Superchip-ul „Vera Rubin” Superchip de la NVIDIA a fost prezentat în imagini pentru prima dată.

NVIDIA a organizat ieri o conferință GTC la Washington D.C., unde a prezentat cel mai nou Superchip „Vera Rubin”. Pentru prima dată, a fost arătată combinația dintre două GPU-uri „Rubin” și un CPU „Vera”, reunite într-un singur pachet, procesorul având 88 de nuclee personalizate NVIDIA și 176 de fire de execuție.

NVIDIA a declarat că fiecare GPU Rubin oferă o putere de calcul de aproximativ 50 PetaFLOPS FP4, ceea ce înseamnă circa 100 PetaFLOPS FP4 pentru întregul Superchip format din două GPU-uri. Compania a precizat că mostrele inginerești sunt deja în laboratoare, iar producția de masă este planificată pentru 2026, cu livrări și implementări mai ample în 2027.

Fiecare GPU Rubin pare să integreze două cipuri de calcul de dimensiunea unui reticul (aproximativ 2 x 830 mm²) și opt module de memorie HBM4, oferind circa 288 GB de HBM4 per GPU și aproximativ 576 GB de HBM4 pentru întregul Superchip.

Placa include, de asemenea, module SOCAMM2 LPDDR5X, care furnizează o memorie de sistem mare și cu latență redusă; prezentările anterioare indică în jur de 1,5 TB de LPDDR5X pentru fiecare CPU Vera în configurațiile standard.

Procesorul Vera CPU utilizează un design personalizat bazat pe arhitectura Arm, cu 88 de nuclee și 176 de fire de execuție, și pare să folosească o structură multi-chiplet, cu un chiplet I/O separat.

Dacă în cazul procesorului Grace, NVIDIA s-a bazat pe designul Arm Neoverse, în cazul Vera, echipa de proiectare a dezvoltat propriile nuclee pentru a obține performanță maximă.

De asemenea, lățimea de bandă NVLink a fost crescută la aproximativ 1,8 TB/s, pentru a susține traficul intens CPU–GPU, necesar în sarcinile complexe precum antrenarea și inferența modelelor AI.

NVIDIA a poziționat Vera Rubin Superchip ca pe un element de bază pentru sistemele NVL de generație superioară, capabile să se extindă până la performanțe de nivel exascale.

Configurația NVL144, prezentată de NVIDIA, vizează aproximativ 3,6 ExaFLOPS pentru inferență FP4 și aproximativ 1,2 ExaFLOPS pentru antrenament FP8, oferind în același timp o lățime de bandă totală HBM4 de circa 13 TB/s și aproximativ 75 TB de memorie de sistem rapidă distribuită pe întregul rack.

Pentru cerințe mai mari, NVIDIA a prezentat familia Rubin Ultra NVL576, care multiplică numărul de GPU-uri pentru a atinge ținte de performanță de aproape 15 ExaFLOPS FP4, crescând totodată capacitatea memoriei rapide la sute de terabytes, destinată hiperscalerilor și centrelor de cercetare de ultimă generație.

About The Author

Leave a Reply

Your email address will not be published. Required fields are marked *