AMD a parlé des accélérateurs informatiques pour serveurs Instinct MI200

Lors de Hot Chips 34, AMD a partagé des détails sur les accélérateurs de serveur de la série Instinct MI200 basés sur les GPU Aldebaran CDNA 2. Ce sont les premières solutions graphiques d'AMD à utiliser une pile multi-puces, également connue sous le nom de disposition MCM.

Certaines des principales caractéristiques de l'Instinct MI200 sont :

Architecture CDNA 2 avec cœurs matriciels de deuxième génération pour accélérer les calculs FP64 et FP32. Ils fournissent jusqu'à quatre fois les performances des opérations FP64 par rapport à la génération précédente d'accélérateurs de serveur AMD ;

technologie avancée de packaging 2.5D Elevated Fanout Bridge (EFB) qui offre jusqu'à 1,8 fois plus de cœurs et jusqu'à 2,7 fois plus de bande passante mémoire que la génération précédente de GPU pour serveurs AMD, tout en atteignant une bande passante mémoire maximale de 3x, 2 To/s ;

troisième génération du bus AMD Infinity Fabric ; prise en charge jusqu'à 8 voies Infinity Fabric, qui assurent la communication entre plusieurs AMD Instinct MI200 eux-mêmes, ainsi que les processeurs AMD EPYC, y compris la troisième génération, qui fournit au système une mémoire CPU / GPU unifiée et augmente le débit maximal.

Dans le cadre des accélérateurs AMD Instinct MI200, un processeur graphique à deux cristaux (puces) est utilisé - le principal et le secondaire. Chaque puce contient 8 moteurs de shader, chacun contenant 14 unités de calcul (CU) pour les opérations FP64, FP32, ainsi que des moteurs matriciels de deuxième génération pour les opérations FP16 et BF16.

Ainsi, il y a 112 unités de calcul ou 7168 processeurs de flux par puce, et 224 CU ou 14 336 processeurs de flux pour l'ensemble du GPU. Le GPU est fabriqué à l'aide du processus 6 nm de TSMC. Au total, il y a 58 milliards de transistors dans le GPU.

Le GPU Aldebaran utilise le bus xGMI haut débit. Chaque chiplet possède un moteur VCN 2.6 et un contrôleur d'E/S principal, quatre contrôleurs de mémoire HBM2e 1024 bits chacun. Chaque chiplet dispose également de 8 Mo de cache L2, physiquement divisés en 32 blocs, et de 64 Go de mémoire HBM2e avec un débit de 1,6 To/s. La quantité totale de mémoire HBM2e sur le GPU peut atteindre 128 Go et sa bande passante est de 3,2 To/s. C'est 1,2 To/s de plus que le NVIDIA A100 équipé de 80 Go de mémoire HBM2e.

AMD Aldebaran prend en charge 8 canaux Infinity Fabric. L'un d'eux peut être utilisé pour connecter le CPU et le GPU (via PCI Express). Il est conçu pour un taux de transfert de données constant de 144 Go/s. Évoluez jusqu'à 500 Go/s en utilisant une liaison Infinity Fabric externe avec quatre accélérateurs AMD Instinct MI200 connectés, ou en utilisant un PCIe 4.0 ESM AIC pour un débit de 100 Go/s.

AMD affirme qu'en fonction de la tâche, Aldebaran peut être jusqu'à trois fois plus rapide que le NVIDIA A100.

Les accélérateurs AMD Instinct MI200 basés sur l'architecture CNDA 2 sont déjà utilisés dans le cadre du supercalculateur exascale Frontier, qui dépasse le classement TOP500 des supercalculateurs les plus productifs au monde. Il offre des performances au niveau de 1,1 exaflops.

AMD a également annoncé son intention de lancer une nouvelle génération d'accélérateurs informatiques Instinct MI300. Ils utiliseront également une disposition de puces, mais ce seront déjà des APU - les cristaux CPU et GPU seront combinés sur le même substrat. L'Instinct MI300 prétend utiliser les architectures GPU CDNA 3 et Zen 4 et des performances d'IA jusqu'à 5 fois plus rapides que l'architecture CDNA 2.

2022-08-22 20:52:44

Auteur: Vitalii Babkin

Précédent | Suivant