先日Googleは、同社のフラッグシップAIモデルの最新版「Gemini 2.0」を正式に発表しました。
具体的には「Gemini 1.5 Flash」の後継となる「Gemini 2.0 Flash」の試験運用版を展開しています。
GoogleのFlashモデルは、強力なAIモデルを必要としないタスクのために設計された軽量モデルであり、効率性をより重視しています。
それでもGoogleは「Gemini 2.0 Flash」は「Gemini 1.5 Flash」だけでなく「Gemini 1.5 Pro」のような強力なモデルへ改良すると説明しています。
「Gemini 2.0 Flash」をほかのモデルと比較すると?
Googleは「Gemini 2.0 Flash」について、General MMLU-Proのベンチマークを含む3つの異なるコーディングのベンチマーク、現実性テスト、2つの数学のベンチマーク、論理的思考、2つの画像のベンチマーク、動画のベンチマークなど、多くの分野で「1.5 Flash」と「1.5 Pro」のどちらにも勝っていると説明しています。
勝っている点では「1.5 Pro」のパフォーマンスに近いものがありましたが、Natural2Codeのベンチマークで7.5ポイント以上、HiddenMathのベンチマークで9ポイント以上など、大幅に改善されている点もありました。
音声のベンチマーク(40.1% vs 39.2%)や、長い文脈のベンチマーク(82.6% vs 69.2%)では、依然として「1.5 Pro」が「2.0 Flash」を上回っています。
このような改善点に加えて、「2.0 Flash」はAIが生成した画像とテキストや、テキストからおこした音声の合成など、新しいマルチモーダル出力にも対応しています。
さらに、Google検索を取り込んだり、コードを実行したり、ほかのサードパーティの機能も利用可能です。
「Gemini 2.0 Flash」はどこで目にするのか?
「Gemini 2.0 Flash」を知っているかどうかに関わらず、おそらくたくさん目にすることになります。
Googleは検索、特に「AI Overview」で使用されると発表しています。
Googleの最初の「AIによる概要」は明らかに失敗でした。にもかかわらず、Googleはこの機能について楽観的な見方を表明しています。
「Gemini 2.0」によって「AI Overview」が、高度な数学やマルチモーダルな質問(例:テキスト、画像、ドキュメントからのクエリ)、コーディングなど、より複雑なトピックや複数のステップのクエリを扱えるようになると説明しています。
また、「2.0 Flash」はGeminiアプリにも搭載されます。実際、すでにデスクトップとモバイルのウェブ版では利用可能です。
試してみたい場合は、ドロップダウンメニューから「2.0 Flash」を選ぶ必要があります。
GoogleはAIに仕事を代行させようと思っている
Googleは「2.0 Flash」を“エージェント時代”の一環として宣伝しています。
つまり、Googleは質問や周囲の状況を分析したり、実際にタスクを完了させたり、何にしてもユーザーの代わりに自社製品にもっと仕事をさせたいと思っているようです。
Googleは、ユニバーサルAIアシスタントの研究開発部門「Project Astra」、ウェブ閲覧中にAIを活用して手助けするChromeの拡張機能「Project Mariner」、開発者のコード作成を支援するAI搭載エージェントの「Jules」のアップデートに取り組んでいると説明しています。
また、Googleは対象を分析し、レポートを生成するのを目的としたAI搭載の検索アシスタント「Deep Research」という新機能についても強調しました。
調べたいトピックや質問を検索アシスタントに指示すると、調査計画を作成してくれるので、ユーザーはそれを承認したり、修正したりします。
承認すると、インターネットで情報ソースを探し出し、Google ドキュメントに書き出せる完全なレポートを作成します。
「AI Overview」と同じように、このレポートには情報ソースへのリンクも含まれているので、自分でソースを確認することができます。