大原雄介の半導体業界こぼれ話

生成AIのバブルはいつ弾ける?

礁渓名物の温泉魚。角質を食べてくれるという奴。一度経験すると病みつきになる気持ちの良さ。ちなみに礁渓はアルカリ泉の温泉で、2日間ひたすら温泉に浸かっていた

 今年(2024年)、COMPUTEX TAIPEI 2024に参加してきた。「おめー、海外取材辞めたんじゃねえのか?」と言われそうだが、一応台湾だけは別扱いにしている。というか、当初は毎年恒例になっている雲南料理のお店に顔を出すのと、同じく毎年恒例のお茶屋さんに大旦那さんの顔を見に行く「だけ」のために、金曜に台湾に行ってそのまま遊んで帰ってくる計画を立ててたら「どうせ行くのなら仕事してこい」と奥様に怒られたので、取材「も」してきた次第。

 ちなみに土曜からは台北南東(台鉄の各停で2時間ほど)の礁渓で2日ほどバカンスしてきた。いい場所である→礁渓(冒頭の写真)。

 なお台湾以外に行く予定はないので、今年の海外旅行はこれで終わり。ただそのCOMPUTEXですら取材が結構体力的に堪えたので、来年は本当に取材はなしで単に遊びに行くだけにするかもしれない。

高まるAI市場への期待

 という話は余談というか枕であるが、そのCOMPUTEX。基調講演はもうAI一色といった感じで、NVIDIA/Supermicro/MediaTekがサーバー側(MediaTekがサーバー側に回ったのはちょっと想定外だった)、Qualcommがクライアント側、IntelとAMDがクライアントとサーバーの両方(やはりCopilot+のインパクトは大きい)、そしてNXPだけがもう少し一般的なAIの話であったが、いずれにせよAIである。

 もう今時、AIという単語を使わずに基調講演なんぞできない、という有様はちょっとばかり異様ではある。前向きに見れば、それだけAIが浸透してきたということなのかもしれないが。

 別に筆者はAI否定論者ではないし、2017年頃に比べるとずいぶん研究も進み、さまざまなソフトウェアフレームワークも揃い、それを実行できるハードウェアも出て来たことで、身近に使えるようになったとは思う。思うのだが、昨今の生成AI系に関してはちょっと加熱の度合いが過ぎる気がする。

 NVIDIAの基調講演でも、昨今では計算量が3カ月で2倍になるとか説明があったわけだが、スライドにもあるように指数級数的に計算能力への要求は高まっている。まぁこれは何となく感覚的に理解できるというか、複雑にすればするほど高度な処理が可能になる。人間の脳のシナプスの数が1,000億~1,500億個だそうだから、100B個位のパラメータを持つネットワークは理論上脳と等価になるはずだし、現状でも一部の処理では人間を凌ぐ性能を出しているわけで、だったら1T(1 Trillion:1兆)個のネットワークならさらにに賢くなる可能性がある。研究者としては、当然挑むべき領域であろう。

 問題は、こうした動きをどこまで企業がフォローアップできるのか、あるいはする必要があるのか、である。要するに投資対効果に見合う成果を現状の生成AIは上げているのか? という話である。

 もちろんここには先端的な研究や、その研究成果が現実の場でどこまで通用するか、といった検証は含まれない。これは本来R&Dとして扱うべきものだからだ。問題は、生成AIを利用してビジネスを行ない、その結果としてどれだけの売上が立ち、どれだけの利益が出て、どの程度投資を回収できているか、という話である。

1部門だけ突出したNVIDIAの決算

 6月1日にBloombergが「Generative AI to Become a $1.3 Trillion Market by 2032, Research Finds」なる記事を掲載している。2032年には1兆3000億ドルのマーケットになる、というのが骨子であるが、2022年末の時点の内訳をみると398億3,400万ドルのマーケットでしかなく、しかもしその内訳の大半がトレーニング向けのAIサーバー(225億6,300万ドル)、次いでAIストレージ(90億2,500万ドル)である。要するにAIトレーニング向けのハードウェアだけが売れている格好だ。

 NVIDIAはちょっと変則的な会計年度(1月末に期締め)であるが、2023年度のForm 10-K(2022年2月1日~2023年1月29日)の決算を見ると、この期間のNVIDIAのCompute & Networking部門の売上は150億6,800万ドルで、要するに生成AIのマーケットの売上と呼ばれているものの半分位がNVIDIAの売上だったりする。この状況は2024年度(2023年1月30日~2024年1月28日)にはさらに進行しており、同部門の売上は474億500万ドルに達している。2023年度の実に3倍である。

2023年1月29日締めの会見年度の結果
Compute & Networking部門で150億ドル6,800万ドルの売上

 ちなみに2023年度の営業利益は50億8,300億ドルで、営業利益率は33.7%。これは半導体業界としてはかなり優秀な方だと思うのだが、2024年度に至っては営業利益が320億1,600万ドル、営業利益率が67.5%である。これはもはや製造業の数字とは思えないレベルに達している。先のBloombergの記事によれば、2023年度のマーケットはおよそ670億ドルであり、つまり生成AIのマーケットの3分の2をNVIDIAの売上が占めていることになる。

 2025年第1四半期(~2024年4月28日)の決算も好調で、同部門は226億7500万ドルの売上と170億4700万ドルの営業利益であり、遂に営業利益率は75.1%という記録的な数字に達している。NVIDIAの観点からすれば我が世の春なのだろうが、何かおかしくないだろうか?

なぜかトレーニングハードウェアだけ伸張している市場

 先ほどの話に戻るが、「生成AIのマーケットが成長する」というのは、普通に考えれば生成AIを利用することによって、たとえば人員コストが削減できる(電話サポートの一次対応の置き換えとかが真っ先に思いつく用途であろう)とか、生成AIの活用によってこれまでは高コストについた作業の低価格化による広範な普及(たとえばキーワードではなく処理内容をキーとした特許検索なんて言うのは、機械化が難しくて人手に頼るところが多かった)、あるいはリアルタイムの双方向翻訳(これはぼちぼち、部分的に可能になりつつある)、さらにはこれまでなかったような新しいビジネスやサービスなど、要するに社会に生成AIが受け入れられ、その結果としてマーケットが大きくなるという風に筆者は理解しているし、そうあるべきだと思っている。

 ところがBloombergの2032年度末の予測の数字を見てみると、

  • インファレンス(推論)向けH/W:1,682億3,300万ドル
  • トレーニング向けH/W:4,735億500万ドル
  • 生成AI関連ソフトウェア:2,798億9,900万ドル
  • 生成AIを利用したサービス:3,819億1,500万ドル

となっており、「あれ? 」という感が否めない。2032年になってもまだ、現在の生成AI向けの投資を回収できるほどに、ハードウェアやソフトウェア以外のマーケットは成長しておらず、それどころか引き続きトレーニング向けハードウェアが売れ続ける、という予測になっていることだ。これは本当に成立するのだろうか?

【図2】で、当然こんなペースでサーバーを入れられるわけでもないので、より高性能かつ高効率なサーバーが必要ということでBlackwellの紹介に移るわけだが、いやBlackwell位では追い付かないだろ、という突っ込みを入れたくなる(会場には居なかったので入れてないが)

 そもそも、図2で示された「3カ月で2倍」の計算能力の要求を満たすのは、色んな意味で不可能である。NVIDIAとかAMDは、平均して18カ月ごとに新製品を発表している。ところがその18カ月の間に、計算能力への要求は64倍になっている計算で、仮に新製品で20倍の性能を達成できたとしても、実際には3倍のチップ数が必要になる。

 そもそもNVIDIAもAMDも、このところ計算能力の向上を精度低下(BF16→FP8→FP4)で補っている面が多々あるわけだが、無限に精度を落とせるわけもないし、プロセスの微細化に伴う性能向上ももうだいぶ鈍化してきた。チップレットによって複数ダイをつなぐことで性能を向上させることはできるだろうが(その極北がCelebrasのWSEである)、それだって限界がある。

消費電力も課題に

 もう1つの問題が、消費電力である。今でさえ、データセンターの供給電力が逼迫しているとか、新しいデータセンターの供給のために発電所を建てないといけないとかいう話になっているのに、この先18カ月毎に3倍のシステムが湧いてきたら、どうやってその電力を供給できるのか、という問題が出てくる。

 データセンターが24時間365日稼働であることを考えると、再生エネルギー系では変動が大きすぎるわけで、毎月火力発電所を建てるか、3カ月に1つ原子力発電所でも建てるしかない事になりかねない。

 あとそもそも18カ月毎に3倍の数のチップをそもそもどうやって供給するんだ? という議論もある。TSMCが既にフル稼働になっていることを考えると(そして半導体のFabが建設から稼働開始まで最低3年かかることを考えると)、毎月先端プロセス向けFabの建設を開始しないといけない(というか、2年位前から開始されていないと間に合わない)。

 要するに、こと生成AIの現在の市場予測は割と非現実的なのである。一言で言えば「バブル」である。

 昨年(2023年)10月、Gartnerは「Gartner Says More Than 80% of Enterprises Will Have Used Generative AI APIs or Deployed Generative AI-Enabled Applications by 2026」と題したプレスリリースを出している(日本語版はこちら)。

生成AIのパイプ・サイクル

 このハイプ・サイクルの図を見る限り、LLM関連は既に“Peak of Inflated Expectations”(「過度の期待」のピーク期)に来ているとされており、普通ならこの辺で「そろそろ生成AIに投資してもリターンがあまり期待できないので投資額を減らそう」となりそうなものが、毎月のように新しいネットワークやら何やらが発表される関係で「いやもうちょっとすれば投資が回収できるかも」的な期待が続いている結果が現状、という気がしなくもない。これは、1990年頃まで続いた土地バブルに非常に似ているように筆者には思えてならない。

 土地バブルは、規制当局によって土地関連融資の総量規制が行なわれたことで崩壊につながったが、そうした規制が生成AIの世界で起きるとはちょっと考えにくい。しかし、チップ生産量とか電力供給量、そして提供できる計算能力の総和の3つが明らかに鈍化傾向を見せる中で、生成AIの投資に見合うリターンがない状態がいつまでも続くとは思えない。

 どうせ弾けるなら早めに弾けた方が被害が少ないとは思うのだが、さていつ頃生成AIバブルは弾けるのだろう?