AMD’s Newest Patent Filing Reveals Unique “Chip Stacking” Method, Significantly Scaling Up Die Usage(WCCF Tech)
午後5:58 · 2024年11月21日(coreteks@coreteks)
AMDの最新のパテントの中に将来のRyzen SoCで用いられるかもしれない“multi-chip stacking”に関するものがあった。
coreteks氏がAMDの新しいパテント資料を紹介している。そのパテント資料は“novel packaging design”とあり、チップ積層技術に革新をもたらし、内部接続の遅延を減らして大幅な性能向上を実現するための技術である。
その資料で示されている新しい積層技術であるが、小さなChipletを一部分のみ大きなダイに重ねるようにして積層する。この技術はより多くのChipletを追加できる余地を作り出し、スケーラビリティを高めることも目的としている。そして単一のダイに多くの機能が備わることになり、接続領域をより効率的に利用できるようになる。同じダイサイズであっても、AMDはより多くのコア数、より大容量のキャッシュ、より広いメモリ帯域を実現でき、性能を大幅にスケールアップすることが可能である。
もう1つの興味深い事実は、AMDがこの方法による内部接続の遅延を減らすことが可能なことだ。一部のみ重なる形で積層されたChipletにより、互いのコンポーネント間の距離を短縮し、より高速な通信を実現する。また、Chipletが分離されているので、ここのユニットを効率的に制御できるため、パワーゲーティングもそれほど問題にならない。
New patent from AMD shows how future Zen SoCs could look like. Basically a novel packaging design that enables compact chip stacking and interconnection by having them partially overlap, as in this figure. The dotted line is a larger die stacked on top of those smaller ones. pic.twitter.com/ZBwSeTsj73
— coreteks (@coreteks) November 21, 2024
中央の大きなBase dieの辺縁部に、小さなChipletを一部分だけ重なるように配置しているのが最大の特徴である。Base dieはChiplet間の接続を担うとともに、ひょっとしたら大容量キャッシュや、あるいはメモリコントローラやPCI-ExpressといったI/Oを搭載することも考えられているのかもしれない。
3次元積層を用いたものとしてはInstinct MI300 seriesが製品化されているが、こちらはよりシンプルに大きなIO dieの上に小さなChipletをそのまま載せる方式である。CDNA 3のXCDであれば2ダイ、“Zen 4”のCCDであれば3ダイを搭載できるが、IO dieをはみ出すような数のChipletを搭載することはできない。今回のパテントで出てきた方式なら、Base dieを大きくしなくても、より多くのChipletを接続することができる。素人目には頂点の部分にあるChipletと辺の中央部にあるChipletで接続方法や帯域が変わってきそうにも見えるが、模式図でもあり実際に製品に採用するときにはこのあたりは当然なんとかするのだろう。
Ryzenはともかく、EPYCは現在の方法ではChiplet数をこれ以上増やすことが難しくなっており、新しい方法が求められている。“Zen 6”の世代で新しい構造に移行するのではないかと個人的には期待しているが、何が出てくるか楽しみである。
- 関連記事
-
- “Strix Halo”―Ryzen AI Max+ Pro 395がGeekbenchに出現する (2024/12/11)
- AMDのパテント資料にあった将来使われる(?)新しいチップ積層技術 (2024/11/25)
- HBM3を搭載したMicrosoft Azure向けのカスタムEPYC―EPYC 9V64H (2024/11/24)
○Amazon売れ筋ランキング CPU メモリ グラフィックカード マザーボード SSD 電源
ベースタイルへの機能付加はLakefieldで、キャッシュ搭載はPonte VecchoのRamboキャッシュで実施済み、ついでにAdamantineキャッシュなんかもあるわけで
それ単品では特許になりえない
下のSiブリッジにIOD機能などを入れてアクティブなダイにした感じ
あのレベルの速度ならD2Dで数百GB/s出るからLPDDR6時代でも安心かと
結局RDNA4には間に合わなかったけれど、UDNA以降で採用してくる可能性が出てきた訳ですね。
ただ、これは確かにやりそうな気はする。
大きなダイを含む段を作ってから研磨して高さを合わせられればいいんだけど・・・大きなダイの表面って削っていいのかなあ?
コンピュートダイとサポートシリコンの層
大きなダイと銅ピラーの層
Siインターポーザの層
の三階建てっぽいな
SiインターポーザはD2D通信に必要な高速高密度なインターコネクトを作れるが、現行の手法では平面配置しか許されないから、各ダイの合計面積(3Dパッケージの分は除く)+αの巨大なサイズで製造され、更にその殆どの領域は低速なインターコネクトと電力線にしか使われない
この特許では、コンピュートダイの外部接続が無い部分を大きなダイの上に重ねて、実装密度&Siインターポーザの利用効率アップを計っていると思われる
CoWoS-LのようなSiブリッジを使えば、巨大Siインターポーザよりウエハからずっと多く取れるが、平面配置のままでは実装面積を小さくする効果は得られない
この特許ならより小さいパッケージで作ることができるだろう
この特許自体は2.5Dの一種だが、大きなダイにTSVを形成すれば割と簡単に3Dに転換できそうに思えるが、あえて3Dを使わない理由はやはりオーバースペックかつ高コストだからか
EMIB 相当なら 203832 が言及してるように既に EFB を使ってる
>>203842
EFB の場合はサブスレートとの接続に Cu Piller を立てて隙間を樹脂で埋めてる
ベースになるダイサイズを小さく、EFB のようにサブスレートに埋め込む加工をしなくて済むので簡単に
EFB からの延長で考えるなら、2.5D パッケージングを安く仕上げようとしてるのかもね
CCD/GCD/Vcache、これらを全部サーバー向けと共通にしてI/Oダイだけ作り分けるのが合理的。
Vcache+CCD、Vcache+GCDも可能になるし、
メモコンをGDDR共用にしてGCDだけ積めばグラボにもなる。
CPU/APU/GPU、全部ダイ流用で作れるようになる。
この記事にトラックバックする(FC2ブログユーザー)