エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
DeepSeek-V3、671Bパラメータの超大規模AIモデルを公開 ー 開発費用は従来の10分の1で最高性能を達成 La... DeepSeek-V3、671Bパラメータの超大規模AIモデルを公開 ー 開発費用は従来の10分の1で最高性能を達成 Last Updated on 2024-12-27 15:55 by admin 中国のAIスタートアップDeepSeekは、2024年12月26日、新たな超大規模モデル「DeepSeek-V3」を発表しました。671Bのパラメータを搭載し、混合専門家アーキテクチャによって特定のタスクを正確かつ効率的に処理します。 開発費用はわずか557万ドル(約82億円)で、従来の大規模言語モデル開発費用の10分の1以下という驚異的な低コストを実現。Math-500テストで90.2点を記録し、GPT-4やLlama 3.1-405Bなど主要モデルを上回る性能を示しています。 革新的な技術と効率性 DeepSeek-V3の最大の特徴は、671Bという巨大なパラメータ数を持ちながら、実際の