Il chip NeuRRAM è il primo chip di elaborazione in memoria che dimostra un'ampia gamma di applicazioni di intelligenza artificiale utilizzando solo una piccola percentuale della potenza consumata da altre piattaforme mantenendo una precisione equivalente.
NeuRRAM, un nuovo chip che esegue calcoli direttamente in memoria e può eseguire un'ampia gamma di applicazioni di intelligenza artificiale, è stato progettato e realizzato da un team internazionale di ricercatori. Ciò che lo distingue è che fa tutto questo per una frazione della potenza consumata dalle piattaforme informatiche di intelligenza artificiale per uso generale.
Il chip neuromorfico NeuRRAM avvicina l'IA all'esecuzione su un'ampia gamma di periferiche disconnesse dal cloud. Ciò significa che possono eseguire complesse attività cognitive ovunque e in qualsiasi momento senza fare affidamento su una connessione di rete a un server centralizzato. Le applicazioni per questo dispositivo abbondano in ogni angolo del globo e in ogni aspetto della nostra vita. Si va da smartwatch a cuffie per realtà virtuale, cuffie intelligenti, sensori intelligenti nelle fabbriche e rover per l'esplorazione planetaria.
Non solo il chip NeuRRAM è più che due volte più efficiente in termini di consumo energetico rispetto ai chip in-memory computing odierni, una classe innovativa di chip ibridi che eseguono l'in-memory computing, ma fornisce anche risultati accurati quanto i chip digitali convenzionali. Le piattaforme di IA convenzionali sono molto più grandi e sono generalmente limitate all'utilizzo di server di dati di grandi dimensioni in esecuzione nel cloud.
Inoltre, il chip NeuRRAM è molto versatile e supporta molti diversi modelli e architetture di reti neurali. Di conseguenza, il chip può essere utilizzato per molte applicazioni diverse, tra cui il riconoscimento e la ricostruzione delle immagini e il riconoscimento vocale.
È comune pensare che una maggiore efficienza di elaborazione della memoria vada a scapito della versatilità, ma il nostro chip NeuRRAM offre efficienza senza sacrificare la versatilità", ha affermato Weyer Wang, primo autore dell'articolo.
Attualmente, l'intelligenza artificiale è ad alta intensità energetica e dispendioso dal punto di vista computazionale. La maggior parte delle applicazioni di intelligenza artificiale sui dispositivi perimetrali comporta lo spostamento dei dati dai dispositivi al cloud, dove l'intelligenza artificiale li elabora e li analizza. I risultati vengono quindi trasferiti nuovamente al dispositivo. Ciò è necessario perché la maggior parte delle periferiche è alimentata a batteria e, di conseguenza, ha solo una quantità limitata di energia disponibile per l'elaborazione.
Riducendo il consumo di energia richiesto per l'inferenza dell'IA all'edge, il chip NeuRRAM può portare a dispositivi edge più affidabili, più intelligenti e più convenienti e a una produzione più intelligente.
Può anche portare a una maggiore privacy dei dati, poiché il trasferimento di dati dai dispositivi al cloud comporta maggiori rischi per la sicurezza.
Nei chip AI, lo spostamento dei dati dalla memoria ai dispositivi informatici è uno dei principali colli di bottiglia. Questo è l'equivalente di un pendolarismo di otto ore per una giornata lavorativa di due ore", ha detto Weier Wang.
Per risolvere questo problema con il trasferimento dei dati, i ricercatori hanno utilizzato la cosiddetta memoria ad accesso casuale resistivo. Questo tipo di memoria non volatile consente di eseguire calcoli direttamente in memoria anziché in unità di calcolo separate.
Prestazioni del chip:
I ricercatori hanno misurato l'efficienza energetica del chip in una metrica nota come EDP (prodotto di ritardo energetico).
L'EDP combina sia la quantità di energia consumata per ciascuna operazione sia la quantità di tempo necessaria per completare l'operazione. Secondo questo indicatore, il chip NeuRRAM fornisce una riduzione dell'EDP di 1,6–2,3 volte (meno è, meglio è) e una densità di calcolo 7–13 volte superiore a quella dei chip moderni.
Gli ingegneri hanno eseguito varie attività di intelligenza artificiale su un chip. Ha raggiunto una precisione del 99% sull'attività di riconoscimento delle cifre scritte a mano; 85,7% sul compito di classificazione delle immagini; e l'84,7% nel compito di riconoscere i comandi vocali di Google.
Inoltre, il chip ha anche ottenuto una riduzione del 70% degli errori di ricostruzione dell'immagine nell'attività di ripristino dell'immagine. Questi risultati sono paragonabili ai chip digitali esistenti, che eseguono calcoli con la stessa precisione, ma con un consumo energetico notevolmente superiore.
I ricercatori osservano che uno dei risultati chiave del lavoro è che tutti i risultati presentati sono stati ottenuti direttamente sull'attrezzatura. In gran parte del lavoro precedente sui chip di elaborazione della memoria, i risultati dei test di intelligenza artificiale sono stati spesso derivati in parte da simulazioni software.
I passaggi successivi includono il miglioramento dell'architettura e dei circuiti e il ridimensionamento del progetto a nodi con tecnologie più avanzate. Gli ingegneri hanno anche in programma di esaminare altre applicazioni come le reti neurali a impulsi.
Pubblicato ad accesso aperto sulla rivista Nature.
2022-08-22 16:40:46
Autore: Vitalii Babkin