Hot Chips 34 で、AMD は Aldebaran CDNA 2 GPU に基づく Instinct MI200 シリーズ サーバー アクセラレータの詳細を共有しました. これらは、MCM レイアウトとも呼ばれるマルチチップ スタックを使用する AMD の最初のグラフィックス ソリューションです.
Instinct MI200 の主な機能の一部は次のとおりです。
FP64 および FP32 計算を高速化するための第 2 世代マトリックス コアを備えた CDNA 2 アーキテクチャ。これらは、前世代の AMD サーバー アクセラレータと比較して、FP64 操作の最大 4 倍のパフォーマンスを提供します。
高度な 2.5D Elevated Fanout Bridge (EFB) パッケージング テクノロジは、前世代の AMD サーバー GPU よりも最大 1.8 倍のコア数と最大 2.7 倍のメモリ帯域幅を提供すると同時に、3 倍の 2 TB/秒のピーク メモリ帯域幅も実現します。
AMD Infinity Fabric バスの第 3 世代。複数の AMD Instinct MI200 自体と、統合された CPU / GPU メモリをシステムに提供し、最大スループットを向上させる第 3 世代を含む AMD EPYC プロセッサ間の通信を提供する、最大 8 つの Infinity Fabric レーンをサポートします。
AMD Instinct MI200 アクセラレータの一部として、メインとセカンダリの 2 つのクリスタル (チップ) を備えたグラフィックス プロセッサが使用されます。各チップには 8 つのシェーダー エンジンが含まれており、それぞれに FP64、FP32 操作用の 14 個の計算ユニット (CU) と、FP16 および BF16 操作用の第 2 世代マトリックス エンジンが含まれています。
したがって、ダイごとに 112 個のコンピューティング ユニットまたは 7168 個のストリーム プロセッサがあり、GPU 全体では 224 個の CU または 14,336 個のストリーム プロセッサがあります。 GPU は TSMC の 6nm プロセスを使用して製造されています。 GPU には合計 580 億個のトランジスタがあります。
Aldebaran GPU は高速 xGMI バスを使用します。各チップレットには、VCN 2.6 エンジンとメイン IO コントローラー (それぞれ 4 つの 1024 ビット HBM2e メモリー コントローラー) があります。各チップレットには、物理的に 32 ブロックに分割された 8 MB の L2 キャッシュと、スループット 1.6 TB/s の 64 GB の HBM2e メモリも搭載されています。 GPU 上の HBM2e メモリの総容量は最大 128 GB で、帯域幅は 3.2 TB/秒です。これは、80 GB の HBM2e メモリを搭載した NVIDIA A100 よりも 1.2 TB/秒高速です。
AMD Aldebaran は 8 つの Infinity Fabric チャネルをサポートします。そのうちの 1 つは、CPU と GPU を接続するために使用できます (PCI Express 経由)。 144 GB / sの一貫したデータ転送速度向けに設計されています。 4 つの AMD Instinct MI200 アクセラレーターが接続された外部 Infinity Fabric リンクを使用するか、PCIe 4.0 ESM AIC を使用して 100 GB/秒のスループットを実現し、500 GB/秒まで拡張します。
AMD は、タスクによっては、Aldebaran が NVIDIA A100 より最大 3 倍高速になる可能性があると主張しています。
CNDA 2 アーキテクチャに基づく AMD Instinct MI200 アクセラレーターは、世界で最も生産性の高いスーパーコンピューターの TOP500 評価を上回る Frontier エクサスケール スーパーコンピューターの一部として既に使用されています。 1.1 エクサフロップスのレベルでパフォーマンスを提供します。
AMD はまた、新世代の Instinct MI300 コンピューティング アクセラレータをリリースする計画を発表しました。それらもチップレット レイアウトを使用しますが、これらはすでに APU であり、CPU と GPU クリスタルは同じ基板上に結合されます。 Instinct MI300 は、CDNA 3 GPU および Zen 4 アーキテクチャを使用し、CDNA 2 アーキテクチャよりも最大 5 倍高速な AI パフォーマンスを使用すると主張しています。
2022-08-22 20:52:44
著者: Vitalii Babkin