A Hot Chips 34, AMD ha condiviso i dettagli sugli acceleratori per server della serie Instinct MI200 basati sulle GPU Aldebaran CDNA 2. Queste sono le prime soluzioni grafiche di AMD a utilizzare uno stack multi-chip, noto anche come layout MCM.
Alcune delle caratteristiche principali di Instinct MI200 sono:
Architettura CDNA 2 con core matrice di seconda generazione per accelerare i calcoli FP64 e FP32. Forniscono fino a quattro volte le prestazioni delle operazioni FP64 rispetto alla generazione precedente di acceleratori di server AMD;
tecnologia di packaging avanzata 2.5D Elevated Fanout Bridge (EFB) che offre fino a 1,8 volte più core e fino a 2,7 volte più larghezza di banda della memoria rispetto alla generazione precedente di GPU per server AMD, raggiungendo anche un picco di larghezza di banda della memoria di 3x, 2 TB/s;
terza generazione del bus AMD Infinity Fabric; supporto per un massimo di 8 corsie Infinity Fabric, che forniscono comunicazione tra diversi AMD Instinct MI200 stessi, nonché processori AMD EPYC, inclusa la terza generazione, che fornisce al sistema memoria CPU/GPU unificata e aumenta il throughput massimo.
Come parte degli acceleratori AMD Instinct MI200, viene utilizzato un processore grafico con due cristalli (chip): il principale e il secondario. Ogni chip contiene 8 motori shader, ognuno dei quali contiene 14 unità di calcolo (CU) per operazioni FP64, FP32, nonché motori a matrice di seconda generazione per operazioni FP16 e BF16.
Pertanto, ci sono 112 unità di elaborazione o 7168 stream processor per die e 224 CU o 14.336 stream processor per l'intera GPU. La GPU è prodotta utilizzando il processo a 6 nm di TSMC. In totale, ci sono 58 miliardi di transistor nella GPU.
La GPU Aldebaran utilizza il bus xGMI ad alta velocità. Ogni chiplet ha un motore VCN 2.6 e un controller IO principale, quattro controller di memoria HBM2e a 1024 bit ciascuno. Ogni chiplet dispone inoltre di 8 MB di cache L2, divisi fisicamente in 32 blocchi, e 64 GB di memoria HBM2e con un throughput di 1,6 TB/s. La quantità totale di memoria HBM2e sulla GPU può arrivare fino a 128 GB e la sua larghezza di banda è di 3,2 TB / s. Questo è 1,2 TB/s in più rispetto alla NVIDIA A100 dotata di 80 GB di memoria HBM2e.
AMD Aldebaran supporta 8 canali Infinity Fabric. Uno di questi può essere utilizzato per collegare la CPU e la GPU (tramite PCI Express). È progettato per una velocità di trasferimento dati costante di 144 GB / s. Scalabilità fino a 500 GB/s utilizzando un collegamento Infinity Fabric esterno con quattro acceleratori AMD Instinct MI200 collegati o utilizzando un PCIe 4.0 ESM AIC per un throughput di 100 GB/s.
AMD afferma che, a seconda dell'attività, Aldebaran può essere fino a tre volte più veloce di NVIDIA A100.
Gli acceleratori AMD Instinct MI200 basati sull'architettura CNDA 2 sono già utilizzati come parte del supercomputer Frontier exascale, che supera la classifica TOP500 dei supercomputer più produttivi al mondo. Fornisce prestazioni al livello di 1.1 exaflop.
AMD ha anche annunciato l'intenzione di rilasciare una nuova generazione di acceleratori informatici Instinct MI300. Utilizzeranno anche un layout chiplet, ma saranno già APU: i cristalli di CPU e GPU saranno combinati sullo stesso substrato. L'Instinct MI300 afferma di utilizzare la GPU CDNA 3 e le architetture Zen 4 e prestazioni AI fino a 5 volte più veloci rispetto all'architettura CDNA 2.
2022-08-22 20:52:44
Autore: Vitalii Babkin