囲碁AIが「独学」で最強に グーグル、産業応用探る
【ワシントン=川合智之】米グーグル持ち株会社のアルファベット傘下の英ディープマインドは、新しい囲碁用の人工知能(AI)「アルファ碁ゼロ」を開発した。世界トップ棋士に勝った際は大量のプロの対局データを学習して強くなったが、今回は人が手本を示さなくてもAI同士の対局を繰り返し、独学で勝率の最も高い打ち方を編み出した。
以前のアルファ碁も圧倒し、人間を含めて史上最強になったという。大量のデータから電力の需給調整などのヒントを自動で見つけるといった将来の産業応用にもつながる成果だ。
19日付の英科学誌ネイチャーで発表する。AIには碁のルールだけを教えた。AIは2つの既存の学習方法を組み合わせて学んだ。それぞれの方法で次の手を考えるが、互いの検討結果を参考にするように工夫した。
当初はランダムに石を並べていたが、自己対戦を繰り返すことで急速に上達。実験3日後には、2016年3月にトップ棋士に勝った際のアルファ碁に100戦全勝をあげた。
人間が長年の囲碁の歴史の中で考案した「定石」とされる常とう手段も独自に発見。実験40日後には自己対戦数は2900万局に達し、17年5月に世界最強棋士、柯潔(か・けつ)九段に3連勝した時のアルファ碁を上回る強さとなった。未知の定石も操るようになったという。
米国囲碁協会のアンディ・オークン会長らは同誌への寄稿で「AIの中盤戦の判断のいくつかはまさに謎だ」と指摘。一方、AIと人間が同じ定石に到達したことで「数世紀にわたる人間の囲碁の営みは全くの誤りではなかった」と述べた。
アルファ碁は世界最強棋士に勝利した際に「人間と対局するのはこれが最後」(ディープマインドのデミス・ハサビス最高経営責任者)としていた。その後もAIの改良を続けたのは「人間に一切頼らないAI」という目標があったためだ。
従来は、人間の対局データを「教師」として学習したため、人間の積み重ねた知見の延長線上の強さにすぎないとの指摘があった。そこでゼロからAIが独学する「教師なし学習」と呼ぶ手法を追求することで、人間の発想にとらわれない革新的なAIを作り出した。
ハサビス氏は「AIは人間の知力を前進させ、全人類に前向きな影響をもたらす可能性がある」と語る。
ディープマインドは英国で公共医療を提供する国民保健サービス(NHS)と提携し、難病の早期発見にAIを活用するほか、電力の需給調整などに取り組む。将来は新素材の開発や、生物を形づくるたんぱく質ができる仕組みなど、人間の力では解けない難問の解明にAIが貢献すると期待している。
新技術は将来、産業に貢献する可能性がある。大量のデータの中から人が気づかない効率化などに役立つ重要なヒントを見つける働きが期待されている。様々な電力使用のデータをもとにした省電力などに役立つという。教えるデータがなくても学べるため、宇宙や海洋など測定データの不足した分野にも役立つ可能性がある。
人とコンピューターの対決では、1997年に米IBMの「ディープ・ブルー」がチェスで世界チャンピオンに勝利。将棋ソフト「PONANZA(ポナンザ)」も17年4~5月に佐藤天彦名人に連勝した。局面数が10の360乗と桁違いに複雑な囲碁で人間を追い越すのは10年後とみられていたが、アルファ碁は深層学習(ディープラーニング)の応用で急速に力を付けた。