注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
あけましておめでとうございます🎍 年末年始で、RAG(Retrieval-Augmented Generation) に関する記事や... あけましておめでとうございます🎍 年末年始で、RAG(Retrieval-Augmented Generation) に関する記事や論文を読んでいたところ、とても挑発的なタイトルの論文に出会いました。それがDon’t Do RAG: When Cache-Augmented Generation is All You Need for Knowledge Tasksです。 Paper: GitHub: 要するに「検索なんてせずに、必要な文書は全部まとめてロードしちゃえ」という発想のようで、実験では 最大40倍の高速化 を達成したとのこと。今回は、この論文が提案する Cache-Augmented Generation (CAG) の要点を、ざっくり解説してみます。 1. RAGとCAGの違い:そもそも何が新しいの? ■ RAG:従来のRetrieve + Generate手法 Retri
2025/01/09 リンク