深層強化学習で開発、小惑星を“ぴょんぴょん”跳ねる移動探査ロボット「スペースホッパー」

スイスのRobotic Systems Labが開発するロボット「スペースホッパー」には、月や小惑星の環境を意識した移動方法が採用されている。開発メンバーがその先に見据えるのは、ロボットの設計が人間から離れていく未来だ。
深層強化学習で開発、小惑星を“ぴょんぴょん”跳ねる移動探査ロボット「スペースホッパー」
Photograph: ETH Zurich / Dominik Lindegge

ロボットは、環境と生物に対する科学的な考え方を、工学で表現してきたものだと言える。それゆえロボットのなかには、どことなく動物や植物、人間などに似ているものがある。例えば、イヌのように四本脚で歩くもの、植物のように光によってエネルギーを得るものなどだ。人間のように労働をし、会話をし、心を通わせるものすらも、近い未来に実現するのかもしれない。この点では、ChatGPTがゲームチェンジャーになろうとしていることは周知の通りだ。

人間は、これらロボットをめぐる“工学的なサーカス”をつくり出す主人公であり、拍手を送る観客であり、時に自らを代替されまいと反抗する。しかしいま、人間の配役は、機械学習によって転換期を迎えているのかもしれない。

スイス連邦工科大学チューリッヒ校(ETH)の「Robotic Systems Lab」は、この世界で最も影響力のあるロボットを生み出してきたラボのひとつ。Robotic Systems Labで現在開発されているのが、小惑星の地表をぴょんぴょん跳ねる、移動探査ロボット「スペースホッパー(SpaceHopper)」だ。起伏が激しく、重力が非常に小さな小惑星での探査を進める革新的な方法になるとして研究が進められている。

「小惑星のような重力が非常に小さな環境は、砂地が多く、滑りやすいので、ロボットはすばやく移動できません」。スペースホッパーを開発したひとりである博士課程の学生、フィリップ・アームはRobotic Systems Labの工房でそう話す。

「では、跳ねてみたらどうかと考えてみたんです。地球の重力下では非効率でも、(小惑星のように)非常に重力が小さな環境であれば、ジャンプ移動は効率のよい移動手段になるのです」

ETHの博士課程で学ぶフィリップ・アーム。Robotic Systems Labにて。

Photograph: Akihico Mori

数年分の試行錯誤を数分に短縮

スペースホッパーは、小惑星や衛星での移動探査を見据えて設計された3本足の小型ロボット。このロボットを通して、宇宙探査ロボットの新しい移動方法となる「ジャンプ移動」を提案している。それも、重力の小さな環境における制御された移動手段としてだ。

興味深いのは、ジャイロスコープ(物体の向きや角加速度を検出する)やフライホイール(主に回転系の慣性モーメントを利用した駆動に用いられる)などに頼ることなく、3本の脚を使って跳び、飛行中に姿勢を修正(要するに“じたばた”する)し、着陸する点だ。こうした特殊な動きを実現する上で重要になったのが、機械学習(深層強化学習)だという。

宇宙で使用可能な部品を採用しているスペースホッパーは、重量5.2kg、本体サイズ245mmとコンパクトだ。

「開発プロセスの特徴として、物理的なロボットを設計すると同時に、そのロボットをデジタル化し、シミュレーション環境で再現します。これらを並行して開発していくのです」とアームは話す。バーチャルなロボットは、壊れてもすぐにもとに戻せる。さらに機械学習を用いることで、物理環境では到底不可能な膨大な量の試行錯誤を行なえる。そこから得た学びによって、物理的なロボットの脚の長さを変更するなど設計を見直し、物理空間でテストするという流れだ。

「機械学習による試行錯誤が素晴らしいのは、(物理空間での)数年分の経験に相当するデータを、数分間で収集できることです。人間は何年もかけて何かを習得しますが、ロボットはコンピューティングのパワーを使い、それを数分に圧縮できます」と彼は続けた。

アームが開発に使用している機械学習は、正確には深層強化学習(Deep Reinforcement Learning)と呼ばれるものだ。深層強化学習は、深層学習(Deep Learning)と強化学習(Reinforcement Learning)の組み合わせであり、非常に簡略化して言えば、エージェント(この場合ロボット)が与えられた環境と相互作用しながら最適な行動方針を学習する方法である。

「強化学習ではバーチャルのロボットに特定のタスクを与え、“報酬”と呼ばれるものを与えます。ロボットがタスクをこなせたら、報酬は上昇します。ここにコンピューティングテクノロジー、つまりわたしたちがもつGPUパワーを結集させることで、何千ものロボットを同時にシミュレートし、数分間でこの報酬を上昇させられるのです。そうして収集したデータから有効な動作をアルゴリズムが自動的に判断し、報酬を最大化するようにロボットの動作が最適化されるのです」

実際の深層強化学習の様子。膨大な数のスペースホッパーが学習する様子は、どこかかわいらしい。

VIDEO: ETH Zurich, Robotic Systems Lab

Robotic Systems Labのメンバーの多くは、同じ深層強化学習を利用してロボットを開発している。メンバーが使用しているのは、NVIDIAが開発した深層学習向けの物理シミュレーション「Isaac Gym」だ。Isaac Gymには、ロボットのシミュレーションから物理空間への変換に必要なコンポーネントが含まれている。Robotic Systems LabにはNVIDIAのラボで働くメンバーもおり、ナレッジの共有が盛んだという。ちなみに、Isaac GymはGithubでオープンソースとして公開されている。

アームらは、深層強化学習によって生み出されたロボットを、実際に物理空間でテストした。欧州宇宙機関(ESA)と協力し、飛行機を用いた無重力テストを実施したところ、スペースホッパーはシミュレーションとほぼ同じように機能することを確認できたという。

「最近とてもいいニュースがありました。ESAから支援を受けて、プレフェーズAと呼ばれるプロジェクトに取り組むことになったんです。これで開発を次の段階に進めることができます。ロボットの外観や必要となるセンサーの統合方法など、今後はより詳細な分析を進める予定です」

プレフェーズAで取り組むのは「LunarLeaper」と呼ばれるプロジェクトであり、長期有人活動の拠点として有望視されている月の「溶岩洞」(火山活動によってつくられたとされる、月地下の巨大空洞)の探索を目的としている。

スペースホッパーの無重力テストの様子。

ロボットが人間の設計から離れていく未来

現在のロボット開発は、開発者が得た何らかのインスピレーションから生まれている。地球の自然や生物を前提にしていることも多く、ロボットが取り組むタスクも見慣れたものだ。一方で、深層強化学習とコンピューティングがより高度に発展する未来において、ロボットの形態は、そもそも人間の開発者のインスピレーションにとどまる必要はない。つまり、ロボットは人間の設計を離れ、想像し得ない形態へと進化していくのかもしれない──。

アームは次のように話す。「機械学習プロセスを使用してロボットをデザインするプロジェクトもあります。そして、深層機械学習を用いたシミュレーションを通してロボットの外観を変化させていくのです。わたしたちはこれを『設計と動作制御の共同最適化』と呼びます。このプロセスによって、見たこともないようなロボットを設計できるのです」

このプロセスを用いることで、重力が非常に小さい宇宙空間で稼働する新しいロボットを生み出せる可能性があるという。月の環境を意識した動物の進化を考えれば、地球のそれとはまったく異なるはずで、それゆえ予想だにしない最適解が出てくるかもしれないのだ。現にスペースホッパーは、3つの脚で飛び跳ねて小惑星を探査するという、これまでのロボットとは似ても似つかない飛びっぷりを実現している。

「こうした可能性はありますが、実現はもう少し先になるでしょうね。というのも、わたしたちは地球以外の環境をあまり知りませんから。もちろん、宇宙で応用できるいくつかのアイデアはありますし、少し先の未来で何かおもしろいことが起きるかもしれません」

ずっと遠い未来、役目を終えたスペースホッパーが月で見つかるようなとき──。そう、ジェイムズ・P・ホーガンの『星を継ぐもの』に登場する、月で見つかった50,000年前の死体のようにだ。未来の人類に、わたしたちに似たユーモアがあれば、こう言うだろうか。

「月には、日本の民間伝承の通り、ウサギがいた。ただそれは、地球のウサギとは、ずいぶん異なる姿をしていたようだ」

森 旭彦|AKIHICO MORI
京都を拠点に活動。主な関心は、新興技術と人間性の間に起こる相互作用や衝突についての社会評論。企画編集やブランディングに携わる傍ら、インディペンデント出版のためのフィクション執筆やジャーナリスティックなプロジェクトを行なう。ロンドン芸術大学大学院メディア・コミュニケーション修士課程修了。

(Edited by Erina Anscomb)

※『WIRED』によるロボットの関連記事はこちら。


Related Articles
article image
衛星軌道上にある探査機「トレース・ガス・オービター」から送信される、息をのむほどに美しい火星の風景。火星探査計画「エクソマーズ」における高度な科学ミッションを遂行する、人類最高峰の宇宙の「目」はどのようにして開発されたのか。スイス・ベルン大学の研究開発現場に迫る。
article image
熱帯生物多様性のモニタリングを迅速化する新しいテクノロジーの開発に挑むコンペティション「XPRIZE Rainforest」。7月にブラジルで開催される決勝への進出が決まったスイス連邦工科大学チューリッヒ校(ETH)のチームにインタビューした。
article image
ヘルシーライフ、持続可能な地球、人間中心のイノベーションの3つのテーマを軸に、豊かな未来を問うコミュニケーション・プログラム「Vitality.Swiss」。そこから見えてきたスイスの最前線を、その特異な地勢や風土、歴史に培われた進取の気質を主軸に紹介する。

編集長による注目記事の読み解きや雑誌制作の振り返りのほか、さまざまなゲストを交えたトークをポッドキャストで配信中!未来への接続はこちらから。


雑誌『WIRED』日本版 VOL.53
「Spatial × Computing」 好評発売中!

実空間とデジタル情報をシームレスに統合することで、情報をインタラクティブに制御できる「体験空間」を生み出す技術。または、あらゆるクリエイティビティに2次元(2D)から3次元(3D)へのパラダイムシフトを要請するトリガー。あるいは、ヒトと空間の間に“コンピューター”が介在することによって拡がる、すべての可能性──。それが『WIRED』日本版が考える「空間コンピューティング」の“フレーム”。情報や体験が「スクリーン(2D)」から「空間(3D)」へと拡がることで(つまり「新しいメディアの発生」によって)、個人や社会は、今後、いかなる変容と向き合うことになるのか。その可能性を、総力を挙げて探る! 詳細はこちら。