アップルが開発した｢GPT-4を凌ぐ｣AIとは…｢ReALM｣はコンテキストを理解する

Katherine Tangalakis-Lippert ［原文］（翻訳：大場真由子、編集：井上俊彦）
Apr. 15, 2024, 07:30 AM テックニュース
11,013

アップルの新しいAIシステム、ReaLM（Reference Resolution As Language Modeling）は、画面上の画像や会話のコンテキストを理解することができる。

SOPA Images via Getty Images

アップルの研究者らは、画面上のコンテンツからそのコンテキストを｢見て｣理解する新しいAIシステムを開発した。
このReALM（Reference Resolution As Language Modeling）と呼ばれるシステムは、AIとより自然な対話を可能にするものだ。
ReaLMを開発した研究者らによると、このシステムは、コンテキストの理解において、OpenAIのGPT-4を凌ぐものだという。

OpenAIのGPT製品に対抗することを目的とするアップル（Apple）の新たなAI開発で、Siriのようなバーチャルアシスタントとの対話をより直感的にできるようになるかもしれない。

｢Reference Resolution As Language Modeling（言語モデルとしてのリファレンス解決）｣の略である｢ReALM｣システムは、曖昧な画面上の画像コンテンツ、会話上のコンテキストを理解し、AIとのより自然な対話を可能にするものだ。

もっと知る

中国のIT企業、猛スピードでAIを開発中…半導体の供給が足かせになるかも

このシステムを開発した研究者らによると、アップルのこの新しいシステムは、GPT-4のような他の大規模言語モデル（LLM）よりも、コンテキストや言語表現が何を指すかを判断する能力が優れているという。また、OpenAIのGPTシリーズのような他のLLMよりも複雑ではないため、ReaLMは、｢パフォーマンスを犠牲にすることなく、デバイス上に存在できる｣コンテキスト解読システムの｢理想的な選択｣だという。

例えば、Siriに地元の薬局のリストの表示を依頼したとする。リストが表示されたら、｢レインボーロードにある薬局に電話して｣または｢一番下の薬局に電話して｣と頼むかもしれない。このシステムを開発したアップルの研究者によると、ReALMを使う場合、多くの詳細情報を求めるエラーメッセージが表示されることはなく、SiriはGPT-4よりもこのようなタスクを実行するために必要なコンテキストを読み解くことができるという。

｢人間の会話には通常、『they』や『that』といった曖昧な表現が含まれるが、その意味は文脈（コンテキスト）を考えれば（人間には）明らかだ｣と研究者らはReaLMの能力について書いている。

｢このようなリファレンスを含むコンテキストを理解できることは、ユーザーが自然に自分の要求をエージェントに自然に伝えたり、エージェントと会話できることを目的とする会話アシスタントにとっては不可欠だ｣

ReALMシステムは、テキストに埋め込まれた画像を解釈することができ、これを使用して、ページ上の画像から電話番号やレシピなどの情報を抽出することができると研究者らは述べている。

OpenAI の GPT-3.5 はテキスト入力しか受け付けない。GPT-4 は画像のコンテキスト化も可能だが、スクリーンショットではなく、主に自然な実世界の画像で訓練された大規模なシステムである。アップルの研究者らはこのことが実用的なパフォーマンスを妨げ、画面上の情報を理解する上ではReALM をの方が優れていると述べている。

アップルが開発した｢GPT-4を凌ぐ｣AIとは…｢ReALM｣はコンテキストを理解する

Popular

OpenAIの最新モデルo1に数カ月で追いついた中国のDeepSeekとグーグルのGemini。AI競争はどこまで続くのか 有料会員限定

トップ2%のファンドマネージャーが、ドットコムバブルのような｢陶酔期｣の終焉が近いと考える理由 有料会員限定

【佐藤優】Z世代部下の｢正しくないからやりたくない｣に悩む管理職。私たちは｢日本の大企業おじさん｣なのか? 有料会員限定

30歳で経済的な自由を手に入れ、年600万円の不動産収入を得る青年が勧める2冊の必読書 有料会員限定

日産の元COOが激白｢ハイブリッドは地獄への一本道｣｢トヨタが日本の自動車産業を袋小路に追い込んだ｣ 有料会員限定

30歳でFIREしたミレニアル世代が語る、5年間で1億6000万円の資産を築き上げた投資法 有料会員限定

年収700万円を3800万円にした会社員が語る｢人間関係の大切さ｣、外資ITは｢実力主義｣だけじゃない 有料会員限定

株式市場は2025年が厳しい年になるというシグナルを送っている...NDRのストラテジストが警告 有料会員限定

17年間邦訳が禁じられた異例作の教え。日本企業の生産性は｢制約条件理論｣で劇的にアップする 有料会員限定

｢フリーミアム｣は過去のもの? SaaS企業の間に広がる新たな価格モデル模索の動き 有料会員限定

BI編集部 注目の3冊 PR

マッキンゼー REWIRED

百年の孤独

休養学―あなたを疲れから救う

あわせて読みたい

OpenAIの最新モデルo1に数カ月で追いついた中国のDeepSeekとグーグルのGemini。AI競争はどこまで続くのか
有料会員限定

トップ2%のファンドマネージャーが、ドットコムバブルのような｢陶酔期｣の終焉が近いと考える理由
有料会員限定

【佐藤優】Z世代部下の｢正しくないからやりたくない｣に悩む管理職。私たちは｢日本の大企業おじさん｣なのか?
有料会員限定

30歳で経済的な自由を手に入れ、年600万円の不動産収入を得る青年が勧める2冊の必読書
有料会員限定

日産の元COOが激白｢ハイブリッドは地獄への一本道｣｢トヨタが日本の自動車産業を袋小路に追い込んだ｣
有料会員限定

30歳でFIREしたミレニアル世代が語る、5年間で1億6000万円の資産を築き上げた投資法
有料会員限定

年収700万円を3800万円にした会社員が語る｢人間関係の大切さ｣、外資ITは｢実力主義｣だけじゃない
有料会員限定

株式市場は2025年が厳しい年になるというシグナルを送っている...NDRのストラテジストが警告
有料会員限定

17年間邦訳が禁じられた異例作の教え。日本企業の生産性は｢制約条件理論｣で劇的にアップする
有料会員限定

｢フリーミアム｣は過去のもの? SaaS企業の間に広がる新たな価格モデル模索の動き
有料会員限定

BI編集部注目の3冊

PR