AIじゃないよ

Gemini Deep Research 完全ガイド:AIが大量のWebページを自動探索&レポートを自動生成

当サイトはアフィリエイト広告を一部掲載しています。

Googleがリリースしたばかりの強力なAIリサーチツール「Deep Research」が、早速日本語にも対応し、ウェブ版のGeminiで利用できるようになった。

「Deep Research」は、2024年12月11日に、Geminiの英語版限定で導入された新機能で、数百ものWebサイトをGeminiがクロールした上で、取得した情報を1本のレポートにまとめるツールだ。

これまでも、ChatGPTやGeminiで、ウェブ検索機能を有効にすることはできたが、せいぜい数件のウェブサイトの内容に基づいて、瞬時に回答を生成する機能だった。

「Deep Research」は、その名の通り、はるかに深く、長い時間をかけて、より網羅的に情報を集め回答を生成する、全く新しいAIリサーチツールだ。

実際に使ってみると、レポートの生成に5分以上の時間がかかることもザラである。生成されるレポートの内容も、非常に高度・網羅的で、最強のキュレーションツールといった感じだ。

分野・業界によっては、新入社員に市場調査レポートを執筆させるのと、結構近いレベルのレポートが、たった5分で得られるようになる革命かもしれない。

本記事では、Deep Research の概要と使い方を詳しく説明するとともに、筆者が実際に Gemini Advanced に課金してDeep Research を使ってみて、様々なリサーチ&レポーティングを行なってみた例をいくつか紹介する。



Gemini の新機能「Deep Research」の概要

「Deep Research」は、Googleが開発するAIアシスタントGeminiの最新機能で、有料版のユーザー限定で利用できるようになっている。

Deep Researchは、数時間かかるようなリサーチ業務を数分で完了させる強力なツールだ。複雑なトピックについて、大量のWebページの検索と中身の確認をユーザーに代わって行い、収集した情報を、包括的で読みやすいレポートの形でアウトプットしてくれる。

以下、実際にGeminiでDeep Researchを利用した際の流れを紹介する。

まず、ユーザーが質問を入力すると、Geminiが複数段階からなるリサーチプランを作成する。

ユーザーがこのリサーチプランを承認すると、まずはGeminiが、人間がウェブを閲覧するのと同様に検索を行い、たくさんのWebページの情報を集めてくる。

そして、Webページから学習した内容に基づいて、再び新たな検索を開始し、このプロセスを何度も繰り返す。検索が進行している間は、どんどんWebサイトの件数が上がっていくのが分かる。

最終的に、主要な情報をまとめたレポートを生成し、ユーザーに対して表示してくれる。

レポートにはオリジナルソースへのリンクが脚注の形で整理されているので、各情報の出所を人間が確認することも可能だ。

また、ユーザーは完成したレポートを、Googleドキュメントにエクスポートすることもできるようになっている。

「Deep Research」は、まさにAIモデルが自律的なエージェントのように振る舞う一例だ。Geminiが自ら考えてリサーチクエスチョンを立て、集まった情報から次のリサーチクエスチョンを導き、再び情報を集める…というように、AIが人間を介在せず行動する形になっている。

Geminiモデルの高度な能力と、100万トークンものコンテキストウィンドウを組み合わせることで、大量の情報を集め整理し、的確にドキュメントに落とし込むことを実現できている。

Gemini で Deep Research を有効にする方法

Deep Researchをはじめ、Geminiの有料版であるGemini Advanced限定の機能を利用するには、「Google One AI プレミアム プラン」に加入する必要がある。

「Google One AI プレミアム プラン」は、通常のGoogle Oneプランに含まれるGoogleドライブの2TBストレージに、Gemini Advancedの利用が付帯するプランである。

競合のAIチャットサービスだと、OpenAIのChatGPTや、AnthropicのClaudeも、月額20ドル程度(日本円で月額3,000円程度)だ。

「Google One AI プレミアム プラン」は、競合と同価格帯の月額2,900円なので、おまけで2TB分のGoogleドライブが得られると考えると、結構お得感もある。

記事執筆現在、初めて課金する人は、1ヶ月間無料でトライアルをすることができるようだ。また、かつて課金したことがある人も、最初の2ヶ月半額などの特典が用意されており、再開しやすくなっている。

「Google One AI プレミアム プラン」への加入が完了したら、アカウントにログインした状態で、Web版のGeminiを開くと、Gemini Advancedが有効になっており、Deep Researchの概要を示すポップアップが表示されるはずだ。

Geminiのチャット画面の左上をクリックすると、プルダウンメニューでモデルを選ぶことができる。

ここで、「1.5 Pro with Deep Research」を選択すると、Gemini 1.5 ProモデルによるDeep Research機能を利用することができる。

他にも、Gemini Advancedのみで利用できるモデルとしては、記事執筆現在(2024年12月)、以下のモデルが含まれている。

AIの性能比較サイトChatbot Arenaで、GPT-4oやo1-previewを抑え、世界1位に君臨している「Gemini 2.0 Experimental Advanced」など、最新の高性能なモデルも利用できるので、有料プランのコスパは結構いいと思う。

  • Gemini 1.5 Pro
  • Gemini 1.5 Pro with Deep Research
  • Gemini 2.0 Experimental Advanced

Deep Research を実際に試してみた:学習計画作りから投資アイディア探索まで

Deep Researchは、高校生や大学生などの学生から、リサーチ業務にあたる社会人まで、幅広いユーザーの助けになりそうだ。

ここでは、私生活、学校生活、仕事場などいくつかのシナリオで、あり得そうなリサーチテーマを用意して、Gemini 1.5 Pro with Deep Researchを使ったリサーチを試してみた。

使ってみた感想としては、表現が難しいが、「検索がそこそこ上手い大学生に、Web情報だけで期末レポートを書かせた」くらいのレベルの、そこそこクオリティの高いレポートが得られた。

プロンプトの内容によって、リサーチしてくれる文献の種類も結構変動するので、ユーザー側の最初の質問でうまくGeminiを有望な方向に誘導できるかも重要になりそうだ。

プログラミング学習教材のリサーチと、学習計画の考案

まずは、世の中にあるオンラインコースや参考書籍の情報を集めて、プログラミングの学習計画を立てるのを手伝ってもらってみた。

以下のような非常にシンプルなプロンプトで、プログラミング初心者が、Pythonで機械学習を学びたい場合の、学習ステップを調べさせた。

プログラミング初心者向けに、Pythonで機械学習を学ぶためのおすすめのオンラインコースと書籍

このプロンプトを受けて、Geminiが設定したリサーチ計画が以下である。計画が適切であれば、「リサーチを開始」をクリックすれば、早速リサーチが開始される。

今回は、せっかくなので、少しリサーチ計画を修正させてみる。「計画を編集」をクリックすると、チャットでどのような変更をしてほしいかを打ち込める状態になる。

日本語でGeminiを利用していると、Deep Researchの検索対象となるWebサイトも、基本的に日本語ページばかりが中心になる。

今回は、Pythonと機械学習の学習リソースとして、英語の情報も考慮してほしいと伝えることで、英語圏のオンラインコースなども探してもらうよう誘導した。

オンラインコースは、英語・日本語のものを両方考慮してください。

すると、このチャットを受けて、Geminiが先ほどのリサーチ計画を修正する。あとは「リサーチを開始」をクリックすれば良いだけだ。

リサーチが開始されると、検索するウェブサイト数にもよって前後するが、大体5分以上は待ち時間が発生する。

Geminiの画面右側に、現在リサーチ中のウェブサイトの数と、その一覧が表示される。

チャット上では、「リサーチが完了したらお知らせします。その間、このチャットからご自由にご退出ください。」と表示され、リサーチの途中でこのチャットを閉じてもリサーチは継続してくれる。

リサーチタスクをGeminiに任せて、自分は席を立つ、なんてことができてしまうので、非常にありがたい。

最終的に、全部で61 件のウェブサイトをGeminiが読み込み、その結果を5,000文字を超えるレポートとして生成してくれた。

生成されたドキュメントのアウトラインは次のようになっている。お題に対して、かなり的確なレポーティングが行われており驚いた。

  • Pythonで機械学習を学ぶ!初心者向けおすすめオンラインコースと書籍
    • はじめに
    • Pythonと機械学習のオンラインコース
      • オンライン学習プラットフォーム
      • おすすめコース
    • Pythonで機械学習を学ぶためのおすすめ書籍
    • オンラインコースと書籍を組み合わせる効果的な学習方法
    • 学習の進捗に合わせてさらに高度な内容を学べるコース・書籍
      • 上級オンラインコース
      • 上級書籍
    • 機械学習の応用例
    • 実践的なプロジェクトを通して学習内容を深める方法
    • 結論

内容面でも、オンラインコースと書籍を組み合わせて学習を進め、最後は具体的なプロジェクトで実践的な練習を積むことを勧めるという、納得感のある構成になっている。

おすすめコースとして並んでいるオンラインコース群を見てみても、Python入門から機械学習入門まで、お題に沿ったラインナップが幅広く的確に揃っている。

しかも、講座名、提供サイト、講座概要、口コミ評価などが、適切に構造化され、テーブルデータになっているのも良い感じだ。

各セクションの末尾に、折りたたみパネルで引用元のソースを表示することができるボタンがついている。これを確認することで、レポート内に含まれる文章が、どのWebサイトの情報に基づいているのかを把握できる。

また、完成したレポートはワンクリックでGoogleドライブにエクスポートすることも可能だ。

ドキュメントの末尾には、脚注の形で、全てのソースが表示されている。

ちなみに、レポートが生成された後であっても、Geminiに追加でチャットで指示をすれば、一部を修正させたり、全体の文のスタイルを変更させたりすることも可能だ。

例えば、このレポートを口語調にしてくれ、と言ってみると、

最近、AIとか機械学習ってめっちゃ話題になってるよね。いろんな会社がAIを使ったサービスとか製品作りに力を入れてるんだって。で、そのAIの土台になってるのが機械学習。

という、かなりポップな文体で、レポートを作り直してくれた。

学生のレポートやプレゼンテーションのための情報収集や、社会人の自学自習のための学習計画作りなど、活用場面は多そうだ。

マーケットリサーチ&投資アイディアの探索

次は、もう少しプロフェッショナルな場面で利用されることを想定して、以下のような原子力分野のマーケットリサーチと、投資アイディアの探索を依頼してみた。

先ほどより少しプロンプトを工夫して、レポートを使用する場面に応じた適切な文体とするように指定した。

AIテクノロジーの普及による電力需要の拡大を踏まえて、原子力・核融合炉関連の投資対象を探している。投資先の候補になりうる企業を、国を問わずに探索せよ。

レポートの文体は、投資ファンドの会議内で用いられることを想定して、プロフェッショナルな文語体にすること。

このプロンプトを受けて、Gemini 1.5 Pro with Deep Researchが考案したリサーチ計画が以下である。

プロンプトにある通りの関連企業リストの探索だけでなく、原子力技術の現状と将来展望、AI技術の電力需要への影響など、投資判断の前提となるマーケット全体に関するレポーティングも、リサーチ計画に含まれている。

無事にリサーチが5-6分で完了し、確かに指示通りのレポートが生成された。

しかし、やはり日本語版のGeminiでは、リサーチの対象が日本語ソースに偏りすぎていて、英米の核融合炉スタートアップなどの情報が欲しかったのに、日本の電力会社などばかりがリストアップされてしまった。

そこで、リサーチの対象に特に含めてほしい情報を追加で打ち込み、再びリサーチを行いレポートを改訂するように依頼してみた。

北米・ヨーロッパにおけるスタートアップ企業や上場企業などまでリサーチの範囲を拡大してください。

すると、以下のように北米・ヨーロッパのスタートアップ企業をいくつかレポート内に追加してくれた。

とはいえ、追記はしてくれたものの、参考文献に英語の文献は3件しか増えていなかった。

どうやら、Deep Research機能は、初回のリサーチは非常に熱心に行うが、一度レポートを生成してしまうと、それ以降は多少の追加質問をされても、あまりDeepなリサーチを行ってはくれないようだ。

もし、レポートの内容を大きく変更したい場合には(ex. 日本のマーケットではなく、欧米を中心にリサーチしたい)、追加質問するよりも、そもそもDeep Researchをゼロからやり直した方が良さそうだ。

クラウド各社のサービス比較レポート

最後に、業務で使用するサービスを比較する場合など、ざっと世の中にある競合サービスの情報をまとめて、比較分析をしたいといったシーンを想定して、以下のようなリサーチをGeminiに依頼してみた。

主要クラウドサービス(AWS、Azure、GCP)のAI・機械学習関連サービスの機能、価格、パフォーマンス比較

これを受けて、Geminiが考案したリサーチ計画が以下である。プロンプトにある「AI・機械学習関連サービス」という抽象的なワードを的確にブレイクダウンして、リサーチする対象のサービスを明確化している。

そして、これまた5分以上の時間をかけて、200件ほどのWebサイトをリサーチしてくれた。

生成されたレポートでは、画像認識、自然言語処理、音声認識、予測分析など各ジャンルごとに比較テーブルを作成して、各サービスを列にとって分かりやすく、見やすく比較を行ってくれている。

ところどころ表中の軸設定がたどたどしい箇所もあるが、人間が自身でリサーチを始める前に、ざっくりとマーケットの全体像を把握して、サービス比較の検討を始めるスタートラインにするには十分すぎるクオリティだ。

リサーチ業務をAIに丸投げできる日は目前

Deep Researchは、他社サービスに類を見ない非常に先進的な機能だ。

ウェブ上の膨大な情報を数分で網羅的に集め、サマリーレポートを作成してくれる。

Perplexityなど、検索を売りにしたAIサービスは他にもあるが、さすがWeb検索を本業とするGoogleだけあって、圧倒的に深く、圧倒的に広いリサーチを、Geminiが行ってくれるのは唯一無二の機能だ。

リサーチ作業を圧倒的に効率化することのできるDeep Researchは、マーケティングなどのビジネス分野はもちろん、アカデミックな場での先行研究のリサーチなど、多岐にわたる用途で活用できそうだ。

現在Deep Researchは、ウェブ版のGemini Advancedで利用することができる。

2025年初頭には、モバイルアプリでも提供開始予定とのことで、外出先でも、通勤中でも、手のひらの中で、超高速で超優秀なAIエージェントがリサーチ業務を代行してくれるようになりそうだ。



Make a comment

*
*
* (公開されません)