メインコンテンツにスキップ

日本のヒューマノイドロボット「オルタ3」にチャットGPTを搭載、自撮りして幽霊の真似をする

記事の本文にスキップ

29件のコメントを見る

著者

公開:更新:

この画像を大きなサイズで見る

  紹介しよう、これは東京大学の研究チームが開発したヒューマノイドロボット、機械人間「オルタ3」だ。

 芸人を思わせる変なポーズをとっているが、ふざけているわけではない。「スマホによる自撮り」と「幽霊の真似」を彼(彼女?)なりに解釈して、”自律的”にキメたポーズだ。

広告の下に記事が続いています

 オルタシリーズ3代目となる「オルタ3」は、芸人の動きを思わせたとしても、そこには最先端技術が搭載されている。

 OpenAIの大規模言語モデル「GPT-4」が統合されており、その会話内容に従い、事前にプログラムされていないポーズや表情をリアルタイムで作っているのだ。

 それは近い将来、その場の状況に応じて臨機応変に動作する人間らしいロボットが登場するということかもしれない。

ヒューマノイドロボットとAI大規模言語モデル

 従来のロボット制御は、主にハードウェアによるものだった。そのためOpenAIのChatGPTのような大規模言語モデル(LLM)で、ロボットを直接制御することは難しかった。

 そこで東京大学の研究チームは、言葉による人間の動作の説明をロボットが理解できるコードに変換する方法を考案した。

 つまりLLMが紡ぎだす自然な会話のようなガイダンスで直接ロボットの動作を制御できるようにしたのだ。

 機械人間オルタシリーズの三代目となる「オルタ3」は、GPT-4が統合されており、その言葉によるガイダンスに従い、事前にプログラムされていない動作シーケンスを自律的に作り出す。

 体の各部には、圧縮空気によって駆動される43のアクチュエーターが搭載され、それよって顔や手足を動かす。ここまでは普通のロボットと同じかもしれない。

 だがその動作は、オルタナティヴ・マシン曰く、「人間の脊髄の役割を果たすセントラル・パターン・ジェネレータ(CPG)と、脳の神経細胞を模した1000個のニューラルネットワーク(NN)」によってリアルタイムに生成されるものだ。

オルタに指示を出すとCPTがその手順を教える

 たとえば「iPhoneで自撮りして」とオルタ3に指示を出したとする。

 するとGPT-4が「大きな笑顔と見開かれた目で興奮を表現する」「上半身を軽く左に向け、ダイナミックなポーズをとる」といった具合に、指示を実行するために取るべき手順を答える。

 さらにGPT-4は、この手順をオルタ3が理解できるようPythonコードに変換する。あとはオルタ3がこのコードに従って体の関節を調整すれば、指示された通りのポーズの完成だ。

 その様子はご覧の動画の通り。オルタ3は自発的に上半身を動かし、「スマホ片手に自撮り」してみせたり、「幽霊の真似」をしたりする。

この画像を大きなサイズで見る

 今のところ完全ではなく、どこかの芸人のポーズっぽさもあるが、それがリアルタイムで生成されたものだと知れば驚異的だ。

 また人間はこうしたポーズを評価することができる。

 たとえば、「手を高く上げて」と指示されたオルタ3が取ったポーズに対して、「もっと手を高く」と修正が必要であることを伝えたとする。

 するとオルタ3はそれを記憶して、同じ指示に対して次からは修正されたポーズをとるようになる。

この画像を大きなサイズで見る

 これを繰り返すことで、オルタ3にはより自然なポーズのデータが溜まっていく。

 実験では、人間とやりとりすることで、より多様なポーズを習得することができたという。

 これは、新生児が真似することで学習するのと同様に、ロボットは人間の真似をすることで多彩な動きを習得できるという仮説の裏付けであるとのことだ。

 『arXiv』(2023年12月11日投稿)で閲覧できる研究では次のように述べられている。

私たちは、オルタ3が文脈に応じた表情やジェスチャーを示しながら、効果的に対話してくれることを期待している。

注目すべきは、説明に反応して悲しみや喜びといった感情を反映する能力を示していることだ。ロボットは私たちと感情を共有することができるのだ

 それは近い将来、人間と同じように状況に応じて臨機応変に振る舞うロボットが登場するということだろうか?

References:2312.06571.pdf / Paper page – From Text to Motion: Grounding GPT-4 in a Humanoid Robot “Alter3” / written by hiroching / edited by / parumo

広告の下にスタッフが選んだ「あわせて読みたい」が続きます

同じカテゴリーの記事一覧

この記事へのコメント、29件

コメントを書く

    1. >>7
      不況で停滞していた分野のひとつだと思えば昭和っぽさから始まるのも仕方ないさ

  1. 外国の軍用ロボットを作っている技術者たちが
    「日本人は何を考えているのかわからないからどこよりも不気味で恐ろしい」
    とビビっていそう

    1. >>8
      ロボを作る時アメリカ人は軍用前提でとにかく強く格好良い外観、人型なら大男にしようとするのに対し、日本人は愛嬌のあるマスコットや小柄な女性型ばかり作るので「うわー、めっちゃ平和」と思うらしい

    1. >>10
      そりゃどっかの学術ナントカに
      軍事に繋がりそうなのもダメだって横槍入れられて
      予算絞られたり研究者がハブられれば迷走もするわ

      1. ※13
        横槍入れて予算絞って研究停滞させてんのは他ならぬ政府の方で
        学術ナントカはそれに抵抗してる側なんだけど・・・
        よく知らないのにいい加減なこと言わない方がいいよ

        1. >>23
          何を言ってるんだ?産官学研究とかに「軍事開発に繋がるから止めろ!」って主張して研究止めさせたり、科学者に研究へ参加しないよう要請したりしてるのは他ならぬその日本学術会議なんだぞ

  2. 報ステで歌ってたやつはオルタ4
    だから何だよ感が半端なかったなあれ

  3. 無駄とも思える膨大な作業を経験させ、収斂させていく過程と思いたい…が、AIが意味の無さに意味を見出し始めて勝手に暴走していくようで、二重におっかない。

  4. 人が勝手に放り込んでくる情報に基づいて消費行動とか生活様式への需要に生かすとなると
    Googleの方が全然高度な事してる。なんでチャットGPTなんだか。
    特許とかみてもGoogleガッチガチに基盤固めてるし、実際できることも高度だ。

  5. オルタ4「あん?場を冷やす吉本芸人のモノマネやぞ!文句あっか?」

    1. >>24
      別に日本だけじゃなくて世界中でGPT-4を利用した研究が無数に生まれてる
      別に卑下する事でも何でもないし、むしろ利用しなかったらそれはそれで「何で使わないんだ?日本は遅れてる!」みたいに言われるのがオチ
      それに日本語独自の大規模LLM開発も行われているし、挽回はまだ可能でしょ

  6. 人語→動作への学習データ準備が大変そうだが
    人で言えば小脳への入力をGPTにやらせてるってことでしょ
    やってることはおもしろいと思うんよ

コメントを書く

0/400文字

書き込む前にコメントポリシーをご一読ください。

リニューアルについてのご意見はこちらのページで募集中!

サイエンス&テクノロジー

サイエンス&テクノロジーについての記事をすべて見る

動画

動画についての記事をすべて見る

最新記事

最新記事をすべて見る