Les accélérateurs d'IA spécialisés ne sont plus une surprise maintenant. Les versions conçues pour former des modèles ont déjà rattrapé leur complexité et leur consommation d'énergie avec les GPU modernes, mais les puces utilisées pour exécuter des modèles formés ne sont pas toujours simples.
Neuchips est allé dans l'autre sens avec l'annonce du RecAccel N3000 ASIC, qui offre une efficacité améliorée et une génération de chaleur réduite à un niveau de performance élevé. Cela le rendra adapté aux plates-formes informatiques de pointe "intelligentes" qui sont souvent obligées de fonctionner avec des contraintes thermiques et électriques strictes. Dans ce cas, nous parlons de systèmes d'inférence compacts mais puissants.
Le nouveau produit est fabriqué à l'aide de la technologie de processus 7 nm de TSMC et a été conçu à l'origine pour exécuter des modèles de recommandation d'apprentissage en profondeur (DLRM). Au cours du second semestre, la société entend commercialiser des modules OCP pour serveurs, et sous deux formes à la fois : double M.2 et sous la forme d'une carte d'extension avec une interface PCI Express 5.0.
La société a entièrement testé le RecAccel N3000 dans MLPerf et est confiante dans le succès du nouveau produit. L'accélérateur utilise des algorithmes propriétaires de quantification et d'étalonnage 8 bits qui garantissent une précision de 99,95% de FP32, le système de mise en cache intégré réduira de 50% le trafic vers la mémoire LPDDR5 externe et l'efficacité d'utilisation de la bande passante mémoire, au contraire , augmentera de 30 %.
L'architecture conçue par Neuchips atteint une efficacité énergétique de l'ordre de 1 µJ par résultat, permettant aux développeurs d'affirmer que la nouvelle plate-forme ASIC fonctionne mieux que les inférences de 20 M par seconde précédemment prévues à 20 W. Pour le moment, il est assez difficile d'évaluer cet indicateur par rapport aux solutions existantes, car nous pouvons parler de différents modèles et scénarios pour leur application.
A noter que de tels accélérateurs existaient déjà en 2020. Tout ce que l'on sait maintenant, c'est que le RecAccel N3000 recevra le matériel RoT et prendra en charge tous les modèles de recommandation AI populaires, y compris DLRM, WND, DCN et NCF. Cependant, il y a lieu de croire que tout cela n'est pas de vaines promesses, puisque la société a été créée par l'ancien patron de Global Unichip Corporation, une filiale de TSMC, qui développe des ASIC et des blocs IP sur mesure.
2022-06-09 14:51:53
Auteur: Vitalii Babkin