クラウドからAIへ 小林 雅一 朝日新聞出版 2013-07-30 売り上げランキング : 285 Amazonで詳しく見る by G-Tools |
知能というものを機能の面で見ると考えると、
- 外部から感覚器官を通じて情報を適切に取り込む
- 取り込んだ情報を処理する、判断する
- 発話や行動を通じて出力して外界とやりとりする
センサ・制御・アクチュエータ構成という言葉で説明されています。
思考を科学する—「考える」とはどういうことか?— 大須賀 節雄 オーム社 2011-09-21 売り上げランキング : 344477 Amazonで詳しく見る by G-Tools |
その反省があったからかどうかはわかりませんが、その後1の技術、つまり映像、音声、テキスト等から情報を抜き出すなど、地味な研究はその後続けられ、推論や考える技術はどちらかと言えば下火になります。 生の映像から何が映っているかといった映像解析や、音波から何を言っているか判定する音声認識は、粛々と研究が続けられます。 ここ数年で大きな成果を上げている深層学習は、主に音声認識と画像処理の1に関する側面であることに注目すべきです。 1の領域に限ってみても、例えば音声認識の精度向上は音声検索の質を向上させますし、画像認識の精度向上はSNSサービス内での写真の解析(例えば友人の発見)に役立ちます。 また、Googleの買収したDeep MindのDeep Q-Networkは強化学習の技術ですから、これは3と関連が深い技術です。 強化学習はロボットの制御に使われますから、Googleがロボット関係企業に投資していることと無関係ではないでしょう。 各社が「人工知能企業に投資」していることも、もっと解像度をあげてみれば、各社のサービスや戦略と直結していて、短期的にも成果を出すでしょう。
さて、このまま人工知能研究は成功するのでしょうか? 一番の懸念は、深層学習が主に成果を出しているのは1に関わる部分、そして部分的に3に関わる部分だということです。 つまり、2に関わる技術、思考や推論に関わる深層学習の大きな成果は未だに出ていない(変化が早いのでもう出ているかもしれないし、内部ではすでに成果が上がっているかもしれないが、私は聞いたことがない)。 「DNNは人間の脳の模倣である」というような解説をたまに見ますが、どちらかといえば「動物の脳の模倣」に近いとおもいます。 視覚や聴覚の模倣であるところの画像処理や音声認識で顕著な成果を出していますが、これらは「人間」特有の機能というよりは動物の持っている能力です。 言葉を操る人たる人間のもつ、言語の機能や思考する機能に対応した深層学習の華々しい成果というものをまだ聞いていません。 word2vecなどを"Deep" Learningの一種と説明する方もいますが、あれは一層なので全然「深く」ないです。 どちらかというと「表現」の学習であって、ただその意味での大きな成果であると思います。
ここからは私の勘なのですが、徐々に思考の研究が流行っていくのではないか、と思っています。 表現の学習が予想以上にうまくいった、ということは今まで言語処理に対してとっていたアプローチがガラッと変わる可能性はあるな、くらいには思っています。 今年のACLのaccepted paperでも、推論や意味を扱う研究が増えている印象があります(定量的に数えてないけど)。 東ロボの中でもこうした思考の研究をしていますよね。 先ほど紹介した、「思考を科学する」の中でも、ニューラルネットと思考と言語について記述されていて、大変興味深いです。 機械が、真に「知性」を手に入れる、入り口に入ったのかもしれません。
クイズで世界一になってもそれは思考や推論ではないということですか?
返信削除ワトソンも内部では推論のエンジンは入ってはいます。ただし、最も力を入れていた部分は、難しい推論よりも正確で広範囲に及ぶ知識をとにかく集めることの方が重要だ、過去に考えられないくらい広範囲に及ぶ知識を入れたら人間に勝てるんではないか、という挑戦だったように捉えています。実際にうまくいったのは驚異的です(私は失敗すると思ってましたw)。そのまま産業に結びつけることを期待された一方で、他の分野で応用しようとした時に再び苦戦していると言われています。 http://jp.wsj.com/news/articles/SB10001424052702304893004579307880662738744
返信削除また、この成功の後に始まった国立情報学研究所の東ロボプロジェクトでは、社会の問題は似たようなアプローチを取れそうですが、それ以外の教科では全く異なるアプローチがとられていますし、まだ多くの研究が必要なんだろうとおもいます。