전문화된 AI 가속기는 이제 놀라운 일이 아닙니다. 모델을 훈련시키도록 설계된 버전은 이미 최신 GPU의 복잡성과 전력 소비를 따라 잡았지만 훈련된 모델을 실행하는 데 사용되는 칩이 항상 단순한 것은 아닙니다.
Neuchips는 높은 수준의 성능에서 향상된 효율성과 감소된 발열을 특징으로 하는 RecAccel N3000 ASIC을 발표하면서 다른 방향으로 나아갔습니다. 이는 종종 엄격한 열 및 전력 제약 내에서 작동해야 하는 "스마트" 에지 컴퓨팅 플랫폼에 적합합니다. 이 경우, 우리는 작지만 강력한 추론 시스템에 대해 이야기하고 있습니다.
이 신제품은 TSMC의 7nm 공정 기술을 사용하여 만들어졌으며 원래 DLRM(딥 러닝 추천 모델)을 실행하도록 설계되었습니다. 회사는 하반기에 서버용 OCP 모듈을 한 번에 두 가지 폼 팩터로 출시할 계획입니다. 듀얼 M.2와 PCI Express 5.0 인터페이스가 있는 확장 카드 형태입니다.
회사는 MLPerf에서 RecAccel N3000을 완전히 테스트했으며 신제품의 성공을 확신합니다. 가속기는 FP32의 99.95% 정확도를 보장하는 독점적인 8비트 양자화 및 보정 알고리즘을 사용하고 내장된 캐싱 시스템은 외부 LPDDR5 메모리에 대한 트래픽을 50%까지 감소시키며 반대로 메모리 대역폭 사용의 효율성을 감소시킵니다. , 30% 증가합니다.
Neuchips가 설계한 아키텍처는 결과당 1µJ 영역의 에너지 효율성을 달성하므로 개발자는 새로운 ASIC 플랫폼이 20W에서 이전에 계획된 초당 20M 추론보다 더 나은 성능을 발휘한다고 주장할 수 있습니다. 현재로서는 이 지표를 기존 솔루션과 비교하여 평가하기가 매우 어렵습니다. 애플리케이션에 대한 다양한 모델과 시나리오에 대해 이야기할 수 있기 때문입니다.
이러한 가속기는 2020년에 이미 존재했습니다. 현재 알려진 것은 RecAccel N3000이 하드웨어 RoT를 수신하고 DLRM, WND, DCN 및 NCF를 포함한 모든 인기 있는 AI 추천 모델을 지원할 것이라는 것입니다. 하지만 커스텀 ASIC과 IP 블록을 개발하는 TSMC의 자회사 글로벌유니칩(Global Unichip Corporation) 전 대표가 회사를 설립했기 때문에 이 모든 것이 헛된 약속이 아니라고 믿을 만한 이유가 있다.
2022-06-09 14:51:53
작가: Vitalii Babkin