2012年4月27日金曜日

Scala Tips / Validation (10) - applicative

ValidationはScalazが提供する成功/失敗の計算文脈を提供するモナドです。Validationを使ってOptionやEitherと同様の成功/失敗の計算文脈上でのMonadicプログラミングをすることができます。

今回はapplicative演算です。

課題

以下に示す2つの関数validateNameとvalidateAgeを用いてデータの検証を行います。

def validateName(a: String): ValidationNEL[Throwable, String] = {
  if (a == null) new IllegalArgumentException("null name").failNel
  else if (a.length >= 2) a.success
  else new IllegalArgumentException("bad name: " + a).failNel
}

def validateAge(a: Int): ValidationNEL[Throwable, Int] = {
  if (150 > a && a >= 0) a.success
  else new IllegalArgumentException("bad age: " + a).failNel
}
validateName
正しい名前であることを検証。ここでは2文字以上の文字列を判定。
validteAge
正しい年齢であることを検証。ここでは0以上、150未満のInt値。

どちらの検証にも成功した場合はSuccess[NonEmptyList[Throwable], (String, Int)]、一つでも検証に失敗した場合はFailure[NonEmptyList[Throwable], (String, Int)]を返します。

validateNameとvalidateAgeの両方が失敗の場合には、NonEmptyListに両方のエラー情報が入ります。

flatMapやfor式を使った場合は、最初に失敗したエラー情報のみが返されますが、今回のテーマであるapplicativeの場合は、エラー情報が累積されていくのが特徴です。

(分類の基準)

Java風

Validationから直接値を取り出すことができないためキャストを使っており、その分大変見にくいコーディングになっています。その点を差し引いてもif式での判定は冗長な感じがします。

def validate(name: String, age: Int): ValidationNEL[Throwable, (String, Int)] = {
  val a = validateName(name)
  val b = validateAge(age)
  if (a.isSuccess && b.isSuccess) {
    val a1 = a.asInstanceOf[Success[NonEmptyList[Throwable], String]].a
    val b1 = b.asInstanceOf[Success[NonEmptyList[Throwable], Int]].a
    Success((a1, b1))
  } else if (a.isSuccess) {
    b.asInstanceOf[Failure[NonEmptyList[Throwable], (String, Int)]]
  } else if (b.isSuccess) {
    a.asInstanceOf[Failure[NonEmptyList[Throwable], (String, Int)]]
  } else {
    val a1 = a.asInstanceOf[Failure[NonEmptyList[Throwable], String]].e
    val b1 = b.asInstanceOf[Failure[NonEmptyList[Throwable], Int]].e
    Failure(a1 |+| b1)
  }
}

Scala風

match式を使うとかなりすっきりしました。しかし、match式がネストするとプログラムが複雑化する感じです。この場合は判定対象が2つなのでネストはまだ浅いですが、判定対象が増えてくると大変なことになるのは明らかです。

def validate(name: String, age: Int): ValidationNEL[Throwable, (String, Int)] = {
  validateName(name) match {
    case Success(a) => validateAge(age) match {
      case Success(b) => Success((a, b))
      case Failure(e) => Failure(e)
    }
    case Failure(e1) => validateAge(age) match {
      case Success(b) => Failure(e1)
      case Failure(e2) => Failure(e1 |+| e2)
    }
  }
}

Scala

fold, map, flatMapを使ったよい記述方法はないと思います。「Scala風」のmatch式を使った書き方になります。

Scalaz

applicative演算を使うと以下のようになります。コーディングが簡単な|@|メソッドを使っています。

def validate(name: String, age: Int): ValidationNEL[Throwable, (String, Int)] = {
  (validateName(name) |@| validateAge(age))((_, _))
}

数学記号を使った「⊛」メソッドを使うこともできます。

def validate(name: String, age: Int): ValidationNEL[Throwable, (String, Int)] = {
  (validateName(name) ⊛ validateAge(age))((_, _))
}

applicative演算の引数の個数が2つなので<**>メソッドを使うことができます。

def validate(name: String, age: Int): ValidationNEL[Throwable, (String, Int)] = {
  (validateName(name) <**> validateAge(age))((_, _))
}

どの記述方法を選ぶのかは好みによりますが、いずれにしても「Java風」、「Scala風」と比べて劇的に簡潔になっています。

ノート

ScalazでApplicativeを使う場合の論点は3つあります。

  • Monad未満Functor以上でも一定の性質(Applicative演算が適用可能)を持つオブジェクトを(Applicative演算を用いて)簡潔に操作したい。
  • 複数のモナドを引数に取る演算を行いたい。
  • 複数のモナドから新しいモナドを生成する際の文脈の再構築に関して、定型処理を自動化したい。

今回のテーマであるValidationは、後ろ2つに当てはまります。

Monad未満Functor以上の性質は、Scalazの場合はZipper、ZipStreamが当てはまるようです。ただし、普通はMonadでないApplicativeはあまりないので、一般的にはモナドに対してApplicative演算を行うと考えておいてよいと思います。

「複数のモナドを引数に取る演算を行いたい」については、今回の課題では、Validationモナドの上で個々の要素に対するバリデーション結果から最終的なバリデーション結果を演算するため、Applicative演算が効果的となります。

3番目の「文脈の再構築」での「定型処理」の典型例はモノイドによる加法演算です。Validationの場合には、エラー情報をモノイドで蓄積していくようになっています。今回の例ではNonEmptyListがMonoidなので、ここに対してThrowableが蓄積されていきます。

別の書き方

Either (12) - Applicativeの記述方法」でも取り上げましたが、以下のような記述方法も可能です。これがApplicative演算の本来的な意味に忠実な記法です。

def validate(name: String, age: Int): ValidationNEL[Throwable, (String, Int)] = {
  validateName(name) <*> (validateAge(age) <*> ((x: Int) => (y: String) => (y, x)).success)
}

また、mapメソッドを使って関数を持ち上げる処理を少し簡略化する方法もあります。

def validate(name: String, age: Int): ValidationNEL[Throwable, (String, Int)] = {
  validateName(name) <*> (validateAge(age).map(x => y => (y, x)))
}

いずれにしても、本文で紹介した「|@|」や「<**>」の方が便利なので、普通はそちらの方を使っておくのがよいでしょう。応用によってはこちらの記法で書いた方がよいこともあるので、引き出しにストックしておきたい所です。

タプル

Applicative演算が可能な場合<|*|>メソッドで直接タプルを生成することができます。今回の課題ではこれを使用することもできます。

def validate(name: String, age: Int): ValidationNEL[Throwable, (String, Int)] = {
  (validateName(name) <|*|> validateAge(age))
}
fold

参考に「Scala」的なfoldを使ったコーディングを考えてみました。演算結果がタプルになるとfoldとの相性がわるいので、Listにしています。Listの場合、タプルより型情報の記述力が落ちるので、本文の課題より脆弱なプログラムになります。

def validate(name: String, age: Int): ValidationNEL[Throwable, List[Any]] = {
  List(validateName(name), validateAge(age)).foldLeft((List[Any](), List[Throwable]())) {
    (a, x) => x match {
      case Success(s) => (a._1 :+ s, a._2)
      case Failure(e) => (a._1, a._2 ::: e.list)
    }
  } match {
    case (xs, Nil) => Success(xs)
    case (_, x :: xs) => Failure(nel(x, xs))
  }
}

この場合は、引数の数が2つなので、かなり冗長な感じがしますが、引数が多数になる場合、引数の個数が任意個になる場合には有効なアプローチです。

諸元

  • Scala 2.9.2
  • Scalaz 6.0.4

0 件のコメント:

コメントを投稿

'},ClipboardSwf:null,Version:'1.5.1'}};dp.SyntaxHighlighter=dp.sh;dp.sh.Toolbar.Commands={ExpandSource:{label:'+ expand source',check:function(highlighter){return highlighter.collapse;},func:function(sender,highlighter) {sender.parentNode.removeChild(sender);highlighter.div.className=highlighter.div.className.replace('collapsed','');}},ViewSource:{label:'view plain',func:function(sender,highlighter) {var code=dp.sh.Utils.FixForBlogger(highlighter.originalCode).replace(/'+code+'');wnd.document.close();}},CopyToClipboard:{label:'copy to clipboard',check:function(){return window.clipboardData!=null||dp.sh.ClipboardSwf!=null;},func:function(sender,highlighter) {var code=dp.sh.Utils.FixForBlogger(highlighter.originalCode).replace(/</g,'<').replace(/>/g,'>').replace(/&/g,'&');if(window.clipboardData) {window.clipboardData.setData('text',code);} else if(dp.sh.ClipboardSwf!=null) {var flashcopier=highlighter.flashCopier;if(flashcopier==null) {flashcopier=document.createElement('div');highlighter.flashCopier=flashcopier;highlighter.div.appendChild(flashcopier);} flashcopier.innerHTML='';} alert('The code is in your clipboard now');}},PrintSource:{label:'print',func:function(sender,highlighter) {var iframe=document.createElement('IFRAME');var doc=null;iframe.style.cssText='position:absolute;width:0px;height:0px;left:-500px;top:-500px;';document.body.appendChild(iframe);doc=iframe.contentWindow.document;dp.sh.Utils.CopyStyles(doc,window.document);doc.write('

'+highlighter.div.innerHTML+'

');doc.close();iframe.contentWindow.focus();iframe.contentWindow.print();alert('Printing...');document.body.removeChild(iframe);}},About:{label:'?',func:function(highlighter) {var wnd=window.open('','_blank','dialog,width=300,height=150,scrollbars=0');var doc=wnd.document;dp.sh.Utils.CopyStyles(doc,window.document);doc.write(dp.sh.Strings.AboutDialog.replace('{V}',dp.sh.Version));doc.close();wnd.focus();}}};dp.sh.Toolbar.Create=function(highlighter) {var div=document.createElement('DIV');div.className='tools';for(var name in dp.sh.Toolbar.Commands) {var cmd=dp.sh.Toolbar.Commands[name];if(cmd.check!=null&&!cmd.check(highlighter)) continue;div.innerHTML+=''+cmd.label+'';} return div;} dp.sh.Toolbar.Command=function(name,sender) {var n=sender;while(n!=null&&n.className.indexOf('dp-highlighter')==-1) n=n.parentNode;if(n!=null) dp.sh.Toolbar.Commands[name].func(sender,n.highlighter);} dp.sh.Utils.CopyStyles=function(destDoc,sourceDoc) {var links=sourceDoc.getElementsByTagName('link');for(var i=0;i');} dp.sh.Utils.FixForBlogger=function(str) {return(dp.sh.isBloggerMode==true)?str.replace(/
|<br\s*\/?>/gi,'\n'):str;} dp.sh.RegexLib={MultiLineCComments:new RegExp('/\\*[\\s\\S]*?\\*/','gm'),SingleLineCComments:new RegExp('//.*$','gm'),SingleLinePerlComments:new RegExp('#.*$','gm'),DoubleQuotedString:new RegExp('"(?:\\.|(\\\\\\")|[^\\""\\n])*"','g'),SingleQuotedString:new RegExp("'(?:\\.|(\\\\\\')|[^\\''\\n])*'",'g')};dp.sh.Match=function(value,index,css) {this.value=value;this.index=index;this.length=value.length;this.css=css;} dp.sh.Highlighter=function() {this.noGutter=false;this.addControls=true;this.collapse=false;this.tabsToSpaces=true;this.wrapColumn=80;this.showColumns=true;} dp.sh.Highlighter.SortCallback=function(m1,m2) {if(m1.indexm2.index) return 1;else {if(m1.lengthm2.length) return 1;} return 0;} dp.sh.Highlighter.prototype.CreateElement=function(name) {var result=document.createElement(name);result.highlighter=this;return result;} dp.sh.Highlighter.prototype.GetMatches=function(regex,css) {var index=0;var match=null;while((match=regex.exec(this.code))!=null) this.matches[this.matches.length]=new dp.sh.Match(match[0],match.index,css);} dp.sh.Highlighter.prototype.AddBit=function(str,css) {if(str==null||str.length==0) return;var span=this.CreateElement('SPAN');str=str.replace(/ /g,' ');str=str.replace(/');if(css!=null) {if((/br/gi).test(str)) {var lines=str.split(' 
');for(var i=0;ic.index)&&(match.index/gi,'\n');var lines=html.split('\n');if(this.addControls==true) this.bar.appendChild(dp.sh.Toolbar.Create(this));if(this.showColumns) {var div=this.CreateElement('div');var columns=this.CreateElement('div');var showEvery=10;var i=1;while(i<=150) {if(i%showEvery==0) {div.innerHTML+=i;i+=(i+'').length;} else {div.innerHTML+='·';i++;}} columns.className='columns';columns.appendChild(div);this.bar.appendChild(columns);} for(var i=0,lineIndex=this.firstLine;i0;i++) {if(Trim(lines[i]).length==0) continue;var matches=regex.exec(lines[i]);if(matches!=null&&matches.length>0) min=Math.min(matches[0].length,min);} if(min>0) for(var i=0;i