Notebookcheck Logo

Nvidia Rubin AI-plattform sänker tokenkostnaderna tiofalt jämfört med Blackwell och Elon Musk hyllar den som "raketmotor för AI

Nvidia Rubin AI-plattform (Bildkälla: Nvidia)
Nvidia Rubin AI-plattform (Bildkälla: Nvidia)
Teslas skryt om att dess framtida AI5-chip kommer att köra inferens 10 gånger billigare än Nvidias Blackwell-arkitektur var ganska kortlivad. Nästa generations Nvidia Rubin AI-plattform erbjuder en tiofaldig minskning av kostnaderna per token.

Nvidia tillkännagav sin nästa generations Rubin AI-beräkningsarkitektur som äntligen kommer att matcha Kinas AI-strategi för att köra AI-inferens till mycket lägre kostnader än den nuvarande Blackwell-utgåvan.

Precis som Nvidia Rubin AI-ryktena, är plattformen uppbyggd kring sex bearbetande delsystem som arbetar tillsammans: Vera CPU, den nya Nvidia Rubin GPU, tredje generationens NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU och Spectrum-6 Ethernet Switch. Chipen är byggda på avancerade TSMC-gjuterinoder och introducerar gränssnittsoptimeringar som syftar till en drastisk minskning av tokenkostnader och utbildningstid.

Faktum är att Nvidias "codesign" på de sex nya chipen möjliggör modellträning med en fjärdedel av de GPU:er som behövs i den nuvarande Nvidia Blackwell-plattformen och sänker kostnaderna per token tio gånger. En tiofaldig minskning av tokenkostnaderna är vad Elon Musk lovar för Teslas nästa generation AI5 dator också; det är bara det att den inte kommer att gå in i massproduktion före nästa år. Elon Musk berömde Nvidia Rubin som "raketmotorn för AI" som kommer att möjliggöra distribution av kantmodeller i skala.

Kina är också stolt över den låga AI-tokenpriset som man uppnår genom open source-modeller som DeepSeek och kedja en hel del mellanklass AI GPU: er som Huawei 910C tillsammans, så Nvidia Rubin-arkitekturen gör äntligen något för att ta itu med inte bara prestanda utan också kostnaderna för att köra AI-modeller.

Den kanske mest intressanta delen av Rubin-plattformen är den nya Nvidia Vera CPU,"konstruerad för dataförflyttning och agentisk resonemang över accelererade system, med fullt konfidentiellt beräkningsstöd." Den kan antingen kopplas ihop med en Nvidia GPU eller fungera som en fristående processor som kör"analytics, cloud, orchestration, storage, and high-performance computing (HPC) workloads" med full Arm-kompatibilitet.

Vera CPU-specifikationerna inkluderar 88 anpassade kärnor och 1,2 TB/s LPDDR5X minnesbandbredd och har en mycket sparsam strömförbrukning. NVLink-C2C-anslutningsgränssnittsintegrationen kör synkroniserad CPU-GPU-minnesåtkomst som en del av optimeringsfunktionerna som gör Rubin-plattformen en storleksordning mer effektiv än sin Blackwell-baserade föregångare.

Köp Nvidia DGX Spark personlig AI-superdator på Amazon

Källa(n)

Please share our article, every link counts!
Mail Logo
> Bärbara datorer, laptops - tester och nyheter > Nyheter > Nyhetsarkiv > Nyhetsarkiv 2026 01 > Nvidia Rubin AI-plattform sänker tokenkostnaderna tiofalt jämfört med Blackwell och Elon Musk hyllar den som "raketmotor för AI
Daniel Zlatev, 2026-01- 6 (Update: 2026-01- 6)