GoogleのNotebookLMを使って複数論文レビューをする
本記事はNotebookLMを使った医学研究論文のレビュー方法について、実践的な知識を提供します。以下のような情報が得られます。
NotebookLMの概要と特徴について
NotebookLMを使って複数の医学研究論文をレビューする方法が分かります。具体的なプロンプトの例も提示されています。
NotebookLMの長所(正確性)と短所(回答の制限、アップロード数の制限など)について
NotebookLMを効果的に活用するためのTips(論文数の制限、ピン留めによる保存など)
NotebookLMの概要
NotebookLMは、Googleが開発した革新的な生成AIサービスです。ユーザーが指定したデータを基に、AIが回答や要約を行うことができます。2024.6.9時点では無料で使えますが今後有料化の可能性はあるかもしれません。最新のモデルであるGemini 1.5 Proが利用されており、100万トークンという長いコンテキストウィンドウによって複数ドキュメントを同時に理解・要約できるという特徴があります。
細かいNotebookLMの使い方は以下のNoteを参照ください。
NotebookLMの特徴
NotebookLMの大きな特徴の一つは、RAG(Retrieval-Augmented Generation)を利用していることです。RAGは、入力されたクエリに関連する情報を大規模なデータベースから検索し、その情報を利用して回答を生成する手法です。これにより、NotebookLMは入力されたデータに書かれている内容に基づいて正確な回答を生成することができます。
ただし、通常のLLMとは異なり、NotebookLMは入力データに書かれていないことには回答を拒否する場合があります。そのため、論文との対話などで理解を深める場合には、通常のLLMに論文を渡して説明してもらったほうが良いかもしれません。NotebookLMは論文に書いてある内容については答えてくれますが、書いていないような解釈や応用についてはあまり答えてくれません。
一方で、NotebookLMはハルシネーション(嘘)の心配がないという点では信頼が置ける部分もあります。入力データに基づいて正確に回答するため、事実と異なる情報を生成するリスクが低いのです。
複数論文のレビュー
今回は、NotebookLMを使って複数の論文をレビューしてみます。まず、レビューしたい論文のPDFをNotebookLMにアップロードします。次に、以下のようなプロンプトを入力し、各論文の構造化データを表形式で抽出してもらいます(ご自身の欲しい情報に適宜改変してください)。
Please review the attached PDF of papers and extract the following structured data in a table format. Ensure to include the page number where each piece of information is found. If any information is not available in the PDF, state that it is not available.
1. **Author(s) of the paper**: Output as the first author's family name followed by 'et al.'
2. **Year of publication**
4. **Primary outcomes**: Main outcomes that the study aimed to assess.
5. **Secondary outcomes**: Additional outcomes that were evaluated.
6. **Treatment**: Description of the treatment or intervention studied.
7. **Number of patients studied**: If specified.
8. **Type of data used**: Indicate whether the study uses clinical data, imaging (such as X-ray, CT, MRI), laboratory results, or other types of data.
9. **Study design**: Specify whether the study is prospective, retrospective, or another design..
Additionally, provide a one-sentence summary of the study's main findings or conclusions.
The table header should be as follows: Author(s) | Year | Primary Outcomes | Secondary Outcomes | Treatment | Patients Studied | Type of Data | Study Design | Summary |
NotebookLMは入力されたPDFを解析し、指定された項目を表形式で出力してくれます。このサービスはElicitやSciSpaceが提供していますが、数ヶ月前に試した時点での比較では、NotebookLMの方が圧倒的に情報が正確です。
ただし、一度にアップロードできる論文数には49個までと制限があります。また、論文数を最大まで入れるとコンテキスト長が長くなり、しっかり読み取ってくれないリスクも出てくるため、10-20個程度に留めておく方がよいかもしれません(きちんと試してはいませんが経験的に)。
NotebookLMで生成された表は消えてしまうため、ピン留めで保存しておくことが重要です。ただし、ピン留めすると表の形式が崩れてしまうのが難点です。またメモも加えることができます。
まとめ
NotebookLMを使えば、複数の医学研究論文を効率的にレビューし、構造化データとして整理することができます。RAGを利用している点が特徴的で、入力されたPDFに基づいて正確な情報を抽出してくれます。
ただし、一度にアップロードできる論文数には制限があるため、適度な数に留めておくことが重要です。また、生成された表はピン留めで保存しておく必要がありますが、その際に表の形式が崩れてしまうのが難点です。
NotebookLMを上手く活用することで、複数の医学研究論文を効率的にレビューし、研究を進めていくことができそうです。
論文をAIに手伝ってもらう場合はこちら
Geminiを使って欲しい論文を手にいれる新しい手法です
著名なAIエンジニアのお二方が書かれた本。特にCode Interpreterの解説が他のChatGPT本に比べて詳しく書かれており参考になります。
私もTwitterで参考にさせていただいている先生方が書かれた医療者向けのChatGPT本。初〜中級者の先生に最適だと思います。