注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
本記事では、LLMの精度向上のために用いられるRAG(検索拡張生成)システムにおける、HTML活用の可能性... 本記事では、LLMの精度向上のために用いられるRAG(検索拡張生成)システムにおける、HTML活用の可能性について紹介します。 現在のRAGシステムでは、ウェブページから単純にテキストを抽出して利用していますが、この過程で見出しの階層構造や表組みのレイアウトといった重要な情報が失われています。そこで注目されているのが「HTMLをそのまま活用する」という新しいアプローチです。 参照論文情報 タイトル:HtmlRAG: HTML is Better Than Plain Text for Modeling Retrieved Knowledge in RAG Systems 著者:Jiejun Tan, Zhicheng Dou, Wen Wang, Mang Wang, Weipeng Chen, Ji-Rong Wen 所属:Renmin University of China, Baic
2024/12/29 リンク