https://youtu.be/JERNjc9ZnrA?si=NjsyV9k-UThRofIA
1年ほど前、世界に衝撃を与えたDeepseekが、再び衝撃を与えようとしているらしい。
Deepseekがリリースしてる論文を見るに、今までAI開発の大前提だったTransformerの一部を置き換えるかもしれないそう。
以下、動画をNotebookLMに要約させたやつ。
Deepseekが開発している新アーキテクチャは、過去約9年間にわたりAI業界の「王者」として君臨してきた「トランスフォーマー(Transformer)」の一部を置き換える可能性があり、業界の勢力図やエコシステムに多大な影響を及ぼすと予測されています。
具体的な影響は以下の点が挙げられます。
・AI開発の「前提」が覆る
現在の生成AIのほぼ全ては、2017年にGoogleが発表したトランスフォーマー技術をベースにしています。これまでもトランスフォーマーに挑む技術はありましたが、王座を奪うには至りませんでした。しかし、Deepseekの論文には「社内でこの新アーキテクチャの大規模モデルを既に学習している」という示唆があり、これが成功すれば9年間誰も成し遂げられなかった技術的転換が起こる可能性があります。
このアーキテクチャの変更は、ハードウェア業界にも波及します。NVIDIAのような汎用チップへの影響は少ないと見られますが、トランスフォーマーに特化した専用チップを開発しているスタートアップ企業などは、前提となる技術が変わることで、その製品価値が失われるといった事態になりかねません。
GoogleやOpenAIなどの大手は、トランスフォーマーを前提にインフラや最適化アルゴリズムを構築し、次世代モデル(Gemini 3や4など)の学習を進めています。もしDeepseekの新技術が圧倒的に優れていた場合、進行中の巨大プロジェクトを途中で変更することは困難であるため、既存のビッグテックが対応に遅れをとる、あるいは開発方針の大幅な修正(「ポシャる」)を迫られる可能性があります。
Deepseekは、昨年の「R1」モデルにおいても、推論能力を高める手法(RLVR)を公開し、それが業界全体のスタンダードになったという実績があります。そのため、彼らが示唆する今回の新アーキテクチャも単なる理論にとどまらず、実用的な脅威となると見られています。
中国人は賢いね それに比べて日本のAIは松尾研だぞ?絶望だ
なんでやカンパニー松尾のAVは世界に誇れるやろ