Haskellとは、純粋関数型プログラミング言語の一種である。
Haskellという言語名は論理学者Haskell B. Curryの名前が由来。純粋関数型言語の標準化を目的として制定されたといわれている。
静的型付けコンパイラ型言語で、型推論機能が利用できるため関数や変数の型宣言を省略することがある程度は可能である。プログラムの記述は、「等式の左辺は右辺の式へと変換できる」という関係性の定義を列挙していく形になる。
型付け以上に特筆すべきなのは純粋関数型言語ということである。Haskellにおける「関数」とは、数学における「関数」と同じく、引数の値が関数の返り値と一意に対応し不変であるものに限定される。関数が内部状態を持つことは許可されない。変数の初期値は再代入によって変更することはできない。このような制約を持つため、プログラムの各部分の実行順序を任意に選ぶことができ、今後並列演算への応用も期待できる。
Haskellにおいて、標準入出力を用いた処理など純粋な(数学における)関数表現では実現できない処理は「アクション」と呼ばれ「関数」とは区別しているが、両者を同一プログラム内で矛盾を起こさないように共存させる仕組みが提供されている。
変数・関数のスコープは、中括弧などコードブロックを囲むような記号は使わず、Pythonなどのようにソースコードのインデントの深さで表現される。
遅延評価を採用しており、無限リストを容易に扱うことができる。
HaskellのためのフリーのコンパイラとしてはGHC(Glasgow Haskell Compiler)がデファクトスタンダードで、Stackと一緒についてくる。他にはHugsなどがある。これらのコンパイラはEclipseからも利用することもできたが、現在はプラグインのEclipse FPと連携するパッケージが依存関係の変化に対応できず開発中止になっている。他の統合開発環境もパッケージの依存関係を解決できなくてインストールもままならないことが多く、フリーの開発環境はもっぱらテキストエディタが中心になる。
超マイナーな実装だが、Java仮想マシン向けにFregeとEtaという実装が存在する。前者はJavaのコードにトランスパイルされ、後者はJava仮想マシン用中間バイトコードにコンパイルされる。両者ともJavaのライブラリが利用可能だが、Javaから持ち込まれたクラスの扱い方は異なっている。
間違いが発生しにくいとか、数学と相性が良いなどの理由からか、数字の計算に終始する金融投資関係での利用が多いといわれている。
参照透過性とGUIとは相性が悪いのでゲーム開発には適さないと考えられているが、Haskellで書かれた日本で有名なゲームにMonadiusというのがあり、開発が不可能ということはない。(GUIの処理ははOpenGLを利用したライブラリGLUTによるもの)
Haskellは関数型言語の中でも、関数や再代入による状態変更を副作用として排除する道を選んだ純粋関数型言語である。
プログラミングスタイルとしては、その特性を活かして実行順序に関係なく、関係性の定義を宣言的に記述していくことで自動的に結果が導き出される宣言型プログラミングが推奨されている。従来のプログラミング言語とは全く違うその発想に、いわゆる命令型プログラミングに親しんできた人が接すると、拒絶反応を起こすか熱心な信奉者になるかに二極化するらしい。
「プログラミング言語が車だったら」のHaskellの項より選択抜粋
- 宇宙人の作った車と噂され、完全自動化を売りにしている。
- Haskellの運転席にはハンドルもペダルも無く、代わりに運転装置と一体化したカーナビが取り付けられている。ドライバーは実際の運転操作をする必要がなく、このカーナビに目的地の定義を入力すれば、目的地までの運転が自動的になされる。
- 従来の自動運転システムでは、道路状況を判断できず公道を走ることは無理であったが、Haskellはこれを奇想天外な方法で解決した。Haskellには目的地として「青信号のときのみ進行し、飛び出す子供に注意しながら、ブロック塀にかすることなく入った我が家の車庫」が指定できるのである。
- 結局Haskellを試乗した多くのドライバーは「目的地の定義を考えるより自分で運転した方が手っ取り早い」と不満をもらすそうな。
先述のようにHaskellが属する純粋関数型言語というのは副作用を排除する道を選んだ言語である。副作用とは再代入のように状態を変更することである。それくらいならたいした問題ではないのだが、たとえば「画面に文字を表示する」という通常のプログラミング言語ではごく基本的なことに分類されることでも、Haskellでは画面の「状態の変更」であるとみなされる。
従って、純粋関数型言語であるためにはひたすら計算のみを行い結果の画面表示すら行わないという滑稽な状態にならざるをえない。もちろん、こんなことでは使い物にならないのでHaskellはモナドという仕組みを利用している。IOモナドというものがあり、副作用をIOモナドの処理に分離することにより、IOモナドの内部で純粋関数型言語であり続けるのである。
モナドはHaskellにとって副作用を起こすために必要なものではあったが、副作用を起こす以外にも様々な用途のモナドがあり、いわゆるぬるぽの対処をするMaybeモナドが代表的。さらにはListまでもがモナドとして提供されている。
Haskellを擬人化するなら、以下のような感じだろうか。
すべての家具が造り付けで固定された部屋の中に引きこもる潔癖症の数学少女。部屋から出ないので近眼のメガネ属性。外部とのやりとりは、壁にあいたIOモナドという小さな窓から行う。
期限が来てからでないと仕事を始めない彼女のことを怠け者と評する人もいるが、その評価は正格ではない。すべてのものが固定された彼女の部屋には予めすべてのものがあるべき場所に「ある」のだから、必要になったときに手を伸ばせば事足りるのだ。これを可能にするために常日頃から部屋を完璧に整理整頓している彼女は、怠け者ではなく地道な努力家なのである。だが引きこもりだ。
main = putStrLn "Hello world!"
Haskellにおいて、文字列(String型)は文字(Char型)のリストとして扱う。リストは列挙した要素群を'['と']'で囲み、各要素の間は','で区切る。
文字列"Hello world!" は文字のリスト ['H', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd', '!'] と同じもの。
右辺は「直前の状態から、"Hello world!"と画面に表示された状態を計算して作り出す関数」という「値」(Haskellは関数も数値と同じく参照透過な値)である。
(1 . (2 . (3 .(4 . ()))))
と
(1 2 3 4)
が同一のリストを表わすように、
Haskellでは、
1 : (2 : (3 : (4 : []))) ※丸括弧を省略して、 1 : 2 : 3 : 4 : [] と書いてもよい
と
[1, 2, 3, 4]
は同一のリストを表わす。
(記号「→」以降に式の評価結果を記す)
コードの説明 | Haskell | Scheme |
---|---|---|
リストの先頭要素取り出し |
head [1, 2, 3] |
(car '(1 2 3)) → 1 |
リストの先頭要素を除いた残り部分の取り出し |
tail [1, 2, 3] |
(cdr '(1 2 3)) → '(2 3) |
リストに先頭要素を追加 |
1 : [2, 3] |
(cons 1 '(2 3)) → '(1 2 3) |
空リスト判定 |
null [] |
(null? '()) → #t |
無名関数を使った演算 |
(\x y -> x + y) 1 2 |
((lambda (x y) (+ x y)) 1 2) → 3 |
繰り返し処理は、他言語によくあるforループのようなものではなく再帰呼び出しや高階関数を使った手法で書くのがHaskellなど関数型言語の基本的な流儀。
-- 同名の関数定義を複数用意して、引数によるパターンマッチングを利用する例 factorial :: Int -> Int -- 関数名はfactorialとし、引数は整数型の値を一つ取る、返り値も整数型の値 factorial 0 = 1 -- 引数が0の場合、返り値は1とする factorial n = n * factorial (n - 1) -- 引数が0以外の場合は再帰呼び出しを使って返り値を求める
-- 条件式if使った例 factorial :: Int -> Int factorial n = if n == 0 -- Haskell2010の規定により then/else節のインデントは揃えなくてもよい
then 1 -- 引数nが0の場合、返り値は1とする else n * factorial (n - 1) -- それ以外の場合は再帰呼び出しを使って返り値を求める
-- ガード節を使った例 factorial :: Int -> Int factorial n | n == 0 = 1 -- 引数nが0の場合、返り値は1とする | otherwise = n * factorial (n - 1) -- それ以外の場合は再帰呼び出しを使って返り値を求める
-- case構文のパターンマッチングを使った例 factorial :: Int -> Int factorial n = case n of
0 -> 1 -- 引数nが0の場合、返り値は1とする _ -> n * factorial (n - 1) -- それ以外の場合は再帰呼び出しを使って返り値を求める
-- 1からnまでの整数のリストを生成してその要素をすべてかけ算する例
-- 高階関数 foldl は、第2引数「1」と第3引数の整数リストの全要素を使って第1引数の「*」関数を適用 factorial :: Int -> Int factorial n = foldl (*) 1 [1..n] -- 具体的には、1 * (1 * 2 * 3 ....* n) の演算が行われる
下記左上は上記左の翻訳書。ちなみに「すごいH本」といういかがわしい通り名がついているが、原題を見ればわかるように普通の本である。
使わなかったものは理解不能と罵り、使用したものはすばらしいと絶賛する純粋関数型言語Haskell。Hakellユーザーからの肯定的な報告が相次ぐ中、あえてHaskellの闇に迫ってみようと思う。(全6回連載終了)
Haskellでは状態変更を禁止することにより、他のモジュールからの変更を考慮しなくていいように設計されている。逆に言うとオブジェクト指向などで強調されるカプセル化をしなくても、外部からの変更による問題は発生しにくいようにできているといえる。
この結果、Haskellでは内部構造を隠蔽しようという思想よりも、どこからでもアクセスできたほうが便利という思想が優先されている。代数データ型のレコード(他の言語では要素とかフィールドとかメンバーとかに相当)は、定義すれば無条件で外部から参照可能になる。変更はできないのでアクセスできても問題ないという点では正しいのだが、レコードの実装方法が変わった時は、内部構造が隠蔽されていないので外部に変更が及んでしまう。
実装変更の影響を受ける以上に外部から参照可能なことによる弊害があるのが、名前空間での衝突である。代数データ型のレコードへは、レコード名と同名の関数によってアクセスすることができる。従って、一つのファイルに同じ名前のレコードを持つ2つの代数データ型が存在すると、同じ名前の「関数」が2つ存在することになってしまう。型推論の機能が強力なので何とかなってしまうこともある(それでも、コードを読む側は自力で強力な型推論をすることを強いられているんだ!)が、型推論で解決できない時にこれを避けるには一方のレコードの名前を変更するなどの対応方法が考えなければならない。しかし、ライブラリなど他人が作ったものを利用する場合はそうも行かない。
となると、対応方法はモジュール名を付加して区別する(import qualified)くらいしかなくなるのだが、関数を使うたびにモジュール名を付加しないといけないとすると、その手間はかなりのものになる。モジュールの省略名を設定すれば、手間は軽減されるが、省略名の管理をしないとどのファイルでどの名前をどう省略したのかわからなくなってしまう。さらにファイルごとにモジュール名を付ける関数と付けない関数の区別など考え始めた日には、泥沼にはまってしまうのは想像に難くない。
コンピューターもOSもプログラミング言語も多くはアメリカが発祥の地である。従って、文字については英語を前提としたASCIIなどの仕様策定がなされており、日本語などへの多言語対応については後付けになることが多い。特にコンピューターのリソース制限がきつかった昔のコンピューターやプログラミング言語にはこの傾向が顕著である。その結果、日本語を使用するためには文字化けなどと格闘する羽目に陥ることが日常茶飯事であった。
こういった反省を踏まえて、後発の製品では文字コードをUnicodeに統一するなどネイティブに多言語対応することが一般的になってきた。モダンな言語では日本語の文字列も英語の文字列も特に区別なく利用可能であることはごく当たり前になりつつある。
しかし、Haskellはそうではない。Unicodeが使えるところも多いのだが、show, printなど一部の基礎的関数では10進数コードポイント表記が使われており、「ニコニコ大百科」は '\12491\12467\12491\12467\22823\30334\31185' となる。日本語でおkといわざるを得ない。
もちろんUnicode, UTF-8をサポートするパッケージは存在するが、ネイティブ対応していないケースが潜んでいる以上、いちいち気を配る必要があるという点には変わりがないのである。
ところで Haskellの演算子を見てくれ こいつをどう思う?
>>=
すごく…モナドです…
>>=はHaskellを少しやると必ず出くわすことになるモナドに使うbindという演算子である。モナドについては簡単だという人からわけがわからないよという人まで評価が分かれるが、>>=という数学はもちろん他の言語でも見たことがない記号演算子とこれの糖衣構文であるdo記法あたりが最初の関門になる人も多いのではないかと思う。
この記号に慣れたらHaskellの演算子学習はおしまいかというとそうではない。HaskellはあのPerlでさえ尻尾を巻いて逃げ出しそうなほどの多彩な演算子があるのだ。その一部を(コンマスペース区切りで)ご紹介しよう。
<$>, <*>, >>^, <<<, .|., &&&, :<, |*><*|
前項で述べた日本語対応などもはやどうでもいい。英語でおkなので、せめて人間の言葉で書いてほしい…。そう思わずにはいられないのである。おまけにこういった変わった演算子は圏論に基づいているものが多く、抽象的で意味はおろか読み方すらわからないときている。
Haskell演算子の奥には深い闇が眠っているのだ…。
たいていのプログラミング言語は、原則として数式と同じように左から順に計算する。演算子も一部の例外を除いて左結合(@という演算子についてa@b@cとあれば、(a@b)@cと解釈する)で、右結合の(a@b@cとあれば、a@(b@c)と解釈する)ものは直感的に理解できるもので、そもそも結合して用いることが少なかったりする。
Haskellでは関数適用は左結合であり、左から計算する原則は変わらないが、演算子には右結合のものが結構ある。代表的なものには、関数合成"."とリスト結合":", "++"、そしてLispの反省から括弧を減らすために導入された最低優先順位演算子"$"などがある。厳密には演算子ではないが、関数型を表すときに用いる"->"も右結合である。
もちろんこれにはHaskellを知る方々から反論もあるだろう。f . g xは数学でも右から計算するし、数学同様に関数を左に引数を右に書く以上、f(g(h(x + y)))の括弧を減らそうと思えば、f $ g $ h $ x + yとして"$"は右結合としなければならないのは当然である。関数型を表す"->"も意味を考えれば右結合なのは自然である(リスト結合は…おや、誰か来たようだ)。
しかし、Haskellは言語仕様により括弧のほとんどを省略してしまったので、計算する順番を判断するヒントに乏しい。従って、演算子の優先順位だけでなく右結合か左結合かの知識まで確実にしないと、関数合成などに高い頻度で現れる右結合に対応してコードを読み解くことすらできず、「ご存知、ないのですか!?」と言われてしまうことになる。これはコードを読む者にとって大きな負担となるのではないだろうか。
話は演算子の結合にとどまらない。"->"と"<-"の違いといわれて、すぐに答えられるだろうか。確かにこれくらいなら少しHaskellに慣れてくれば容易に答えられるかもしれない。ではこれはどうだろう。
">>="と"=<<", 左記と">=>"と"<=<", "<<<"と">>>", 左記と"^<<"と"<<^"と"^>>"と">>^"
ちなみに">>="は左結合だが"=<<"は右結合、他は向きが違ってもみんな右結合である。
おわかりいただけただろうか。Haskellの演算子は読みや意味が分かりにくい以外にも右だか左だかまで容易にはわからないようになっているのである。
使わなければどうということはない? それは誤解である。あなたが使わなかったとしても、他の人が使うことは止められない。そして、あなたが解説を求めて開いたページのサンプルコードにその記号が突如として立ちはだかる可能性は十分にあるのだ。
以下は、2014年末の時点でのWikipediaでのモナド(プログラミング)の記事の冒頭である。
計算機科学におけるモナド(英: Monad)とは、計算機科学者のEugenio Moggiによって提案されたモジュール性を持たせた表示的意味論の枠組みを言う。プログラムとはクライスリ圏の射である(a program is an arrow of a Kleisli category)、という要請から合成規則としてクライスリトリプル(Kleisli triple)というモナドと等価なものが用いられる。型システムへの適用であるプログラミング言語のHaskellで用いられるものがよく知られている。
!? おまえは何を言っているんだ? まるで意味がわからんぞ!
それでもGoogle先生なら…Google先生ならきっと何とかしてくれる…わからない単語を片っ端から調べれば…そう、まずはこのクライスリ圏から…
と思ってクライスリ圏とは何かを調べようとするわけだが、Google先生ですらクライスリ圏のことはよく知らないらしい。Wikipdiaにも2014年12月1日までは項目すらなかった。2016年10月現在、記述はあるもののやはり数学者にしか分かりそうにない記述のままである。
2016年10月現在、インターネット上において様々な人によってモナドに関する解説が試みられており、中途半端な理解に基づくものや、途中で挫折してしまっているものも見かけるが、上記2014年以前の状態に比べたらかなり改善されたと言える。
しかし、Haskellの圏論の話はモナドでおしまいではない。アプリカティヴ、ファンクター、アロー、モナド変換子と、まだまだ先があるのである。残念ながら、ほとんどの記事がモナドの解説で力尽きており、こういったところに関しては解説が少ないか、あっても上級者向けの内容であったりする。
これらの概念がモナドより難しいかといえば、必ずしもそうではないかもしれない。だが、ゲームのボスキャラを思い浮かべてほしい。十分に攻略情報が与えられて最強隠しボスに挑むよりも、攻略情報なしで初見の中ボスに挑む方がはるかに難しい場合があるのではないだろうか。
そういう意味では、解説が充実しているモナドがHaskellに出てくる圏論用語の中で最弱であると言っても過言ではないのである。
ただ、モナドの解説も2015年以降、1年くらいの間にだいぶ充実してきたことを考えると、他の用語の解説も何年か待っていたら時間が解決してくれるのかもしれない。Google先生の次回作にご期待下さい。
Haskellは静的型付け言語である。しかも、型安全が他の言語よりも徹底しており、一般的にはHaskellの長所とされている。しかしながら、このことが災いをもたらすこともあるのだ。
型安全が厳格であるがゆえに、あるライブラリの仕様がバージョンアップに伴って変更されると、型のちょっとした仕様変更によりそのライブラリに依存していたライブラリが使用不能になることが、稀によくある。
すると、その依存していたライブラリに依存していたライブラリが使用不能になり、というように連鎖反応的に広汎なライブラリが使用不可能になる。どの言語にもあることだが、Haskellは小さなライブラリが多数存在して複雑な依存関係を構成していることが多く、わざわざDependency Hell(依存関係地獄)という言葉まで用意されている。
型検査以外にも、ライブラリ開発者の数が少ないので一人だけで開発していたら独断で仕様変更ができてしまうとか、ユーザーも少ないので仕様変更しても苦情が来る量が少ないとか、他の言語に比べて互換性よりも仕様を洗練することを重視する文化があるとかなのかもしれないが、原因はともかく依存関係地獄が実在することだけは間違いない。
もっともHaskellもこの問題について手をこまねいて見ていたわけではない。cabalという標準のパッケージ管理コマンドがあり、依存関係をチェックしながらインストールしてくれる(なんとこのcabal、パッケージをインストールする機能はあるが、アンインストールする機能がない: cabal-devというものにはあるらしい)。cabalバージョン1.18以降ではサンドボックスが導入され、あるプログラムのためのパッケージバージョンの変更が別のプログラム開発に影響を及ぼさないようすることが可能になった。
また、依存関係が正しく解決されたライブラリバージョンの組み合わせを公開しているStackageというものも提供されるようになってきた。しかし、そのサポート期間は最長で1年と短く心許ない。
あなたは参照透過性にモナドや圏論など耳慣れない概念や見慣れない記号の地獄をくぐり抜けて、ようやくひと通りHaskellと標準ライブラリが使えるようになり、今度は本格的に外部ライブラリやフレームワークを使用したプログラミングに乗り出そうとしているところかもしれない。だが、これまであなたが地獄だと思ってきたものは、所詮はあなたの努力や能力が及んでいなかったということに過ぎず、そこに理不尽さはない。しかし依存関係地獄は「正しく」ライブラリを利用する者にも等しく訪れる。ここからが本当の地獄だ。
掲示板
36 ななしのよっしん
2022/09/01(木) 21:13:50 ID: 5m5lChVlZ3
コラムの「おまえは何を言っているんだ? まるで意味がわからんぞ!」ってこっちのセリフだ
なんだこの自己満コーナー
37 ななしのよっしん
2022/09/01(木) 23:45:41 ID: dZjZffplrS
38 ななしのよっしん
2022/09/05(月) 23:30:10 ID: OTgL60Tghp
曲がりなりにも事典なんだし著者の主観書くべきじゃない…
というかウィキ項目の私物化はするべきではないね。
項目は共有資材であるというウィキというシステムの理念的にも。
noteかなにかに書けばいいんじゃないって思う。
急上昇ワード改
最終更新:2024/12/22(日) 13:00
最終更新:2024/12/22(日) 12:00
ウォッチリストに追加しました!
すでにウォッチリストに
入っています。
追加に失敗しました。
ほめた!
ほめるを取消しました。
ほめるに失敗しました。
ほめるの取消しに失敗しました。