• Pagina iniziale
  • High Tech
  • Criptovalute
  • Gioco
  • Hollywood
  • Scienza
  • Spazio
  • Auto
  • Sport
  • Mondo

Untether AI svela l'acceleratore AI240 speedAI con 1.5k core RISC-V e 238 MB di SRAM a 1 PB/s

Untether AI svela l'acceleratore AI240 speedAI con 1.5k core RISC-V e 238 MB di SRAM a 1 PB/s

Untether AI ha annunciato l'architettura AI di prossima generazione speedAI (nome in codice "Boqueria"), incentrata sui carichi di inferenza. Con un'efficienza energetica di 30 Tflops/W e prestazioni fino a 2 Pflops per chip, speedAI stabilisce un nuovo standard per l'efficienza energetica e la densità di calcolo, afferma l'azienda.

Poiché il calcolo in memoria è molto più efficiente dal punto di vista energetico rispetto alle architetture tradizionali in alcune attività, può fornire prestazioni più elevate a parità di energia. La prima generazione di dispositivi runAI nel 2020, Untether AI raggiunge un'efficienza energetica di 8 Tflops/W per l'elaborazione INT8. La nuova architettura speedAI fornisce già 30 TFlops/W.

Ciò è stato ottenuto grazie all'architettura di seconda generazione, all'uso di oltre 1400 core RISC-V a 7 nm ottimizzati (1,35 GHz) con istruzioni personalizzate, al controllo del flusso di dati ad alta efficienza energetica e all'introduzione del supporto FP8. Insieme, questo ha permesso di quadruplicare l'efficienza di speedAI rispetto a runAI. La novità può essere adattata in modo flessibile a varie architetture di reti neurali. Concettualmente, speedAI assomiglia a un altro chip RISC-V da mille core: Esperanto ET-SoC-1.

Il primo membro della famiglia speedAI, speedAI240, fornisce 2 Pflop per i calcoli FP8 o 1 Pflop per le operazioni BF16. Ciò si traduce in un'efficienza leader del settore, come la dichiarazione di prestazioni di BERT di 750 richieste al secondo per watt (qps/w), che secondo l'azienda è 15 volte più veloce delle GPU odierne. È stato possibile ottenere un aumento delle prestazioni grazie alla stretta integrazione di elementi di calcolo e memoria.

Per ogni blocco SRAM da 328 KB, ci sono 512 unità di calcolo che supportano i formati INT4, INT8, FP8 e BF16. Ogni unità di calcolo ha due core RISC-V personalizzati a 32 bit (RV32EMC) con supporto per quattro thread e 64 SIMD. Ci sono 729 blocchi in totale, quindi in totale il chip trasporta 238 MB di SRAM e 1458 core. I blocchi sono collegati tra loro da una rete mesh, a cui è collegato anche un bus IO ad anello, che trasporta quattro blocchi di cache condivisa da 1 MB, due controller LPDRR5 (64 bit) e porte PCIe 5.0: una x16 per la connessione all'host e tre x8 per combinare le fiches.

Il throughput totale della SRAM è di circa 1 PB/s, le reti mesh vanno da 1,5 a 1,9 TB/s, i bus IO sono 141 GB/s in entrambe le direzioni e 32 GB DRAM sono poco più di 100 GB/s. Le interfacce PCIe consentono di combinare fino a tre acceleratori, con sei chip speedAI240 ciascuno. Le soluzioni speedAI saranno offerte sia sotto forma di chip singoli sia come parte di schede PCIe già pronte e moduli M.2. Le prime consegne a clienti selezionati dovrebbero iniziare nella prima metà del 2023.


2022-08-25 04:02:28

Autore: Vitalii Babkin

Precedente | Il prossimo

• Presentato il ciclocomputer Coros Dura con GPS e ricarica solare

• Realme ha lanciato una nuova versione dello smartphone P1 Pro 5G con 12 GB di RAM

• Presentato OnePlus Nord CE4 Lite con batteria da 5500 mAh

• Presentato il tablet Lenovo Tab Plus con sistema audio JBL

• Presentata la TV Hisense S7N CanvasTV 4K QLED

• MSI ha rilasciato il monitor da gioco MAG 27QRF QD E2 Monster Hunter Edition

• AOC ha lanciato il monitor Gaming C27G2Z3/BK con schermo Fast VA e frequenza di 280 Hz

• Samsung, seguendo l'esempio di Apple, ha rinunciato alle ambizioni nel settore dell'auto-pilota

• Nel Regno Unito è stata lanciata una piattaforma per valutare la sicurezza dell'IA

• Un tribunale ha multato Microsoft per 242 milioni di dollari per la violazione di tecnologia nella creazione di Cortana

• Xiaomi ha mostrato il design insolito del telefono Civi 4 Pro

• Il PC compatto GEEKOM Mini Air12 con processore Intel N100 e 16 GB di RAM è stato valutato a 249 dollari

• L'aggiornamento di Apple Watch porta a un'eccessiva rapida scarica della batteria

• Lo smartphone iQOO 12 potrà scattare foto con uno zoom 70x

© 2021-2023 Yoopply Italy - Notizie dal mondo ogni giorno
Deutsch | 日本 | France | Italy | 한국어 | Portugues

Auto | Criptovalute | Gioco | High Tech | Hollywood | Scienza | Spazio | Sport | Mondo | Software

Chi siamo | Politica sulla riservatezza
Facebook | Twitter
Yoopply
40004, Ukraine, Sumska, Sumy, Pratsi str. building 37
Phone: +380958165974
Email: acca.in.ua@gmail.com