Nvidia tillkännagav sin nästa generations Rubin AI-beräkningsarkitektur som äntligen kommer att matcha Kinas AI-strategi för att köra AI-inferens till mycket lägre kostnader än den nuvarande Blackwell-utgåvan.
Precis som Nvidia Rubin AI-ryktena, är plattformen uppbyggd kring sex bearbetande delsystem som arbetar tillsammans: Vera CPU, den nya Nvidia Rubin GPU, tredje generationens NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU och Spectrum-6 Ethernet Switch. Chipen är byggda på avancerade TSMC-gjuterinoder och introducerar gränssnittsoptimeringar som syftar till en drastisk minskning av tokenkostnader och utbildningstid.
Faktum är att Nvidias "codesign" på de sex nya chipen möjliggör modellträning med en fjärdedel av de GPU:er som behövs i den nuvarande Nvidia Blackwell-plattformen och sänker kostnaderna per token tio gånger. En tiofaldig minskning av tokenkostnaderna är vad Elon Musk lovar för Teslas nästa generation AI5 dator också; det är bara det att den inte kommer att gå in i massproduktion före nästa år. Elon Musk berömde Nvidia Rubin som "raketmotorn för AI" som kommer att möjliggöra distribution av kantmodeller i skala.
Kina är också stolt över den låga AI-tokenpriset som man uppnår genom open source-modeller som DeepSeek och kedja en hel del mellanklass AI GPU: er som Huawei 910C tillsammans, så Nvidia Rubin-arkitekturen gör äntligen något för att ta itu med inte bara prestanda utan också kostnaderna för att köra AI-modeller.
Den kanske mest intressanta delen av Rubin-plattformen är den nya Nvidia Vera CPU,"konstruerad för dataförflyttning och agentisk resonemang över accelererade system, med fullt konfidentiellt beräkningsstöd." Den kan antingen kopplas ihop med en Nvidia GPU eller fungera som en fristående processor som kör"analytics, cloud, orchestration, storage, and high-performance computing (HPC) workloads" med full Arm-kompatibilitet.
Vera CPU-specifikationerna inkluderar 88 anpassade kärnor och 1,2 TB/s LPDDR5X minnesbandbredd och har en mycket sparsam strömförbrukning. NVLink-C2C-anslutningsgränssnittsintegrationen kör synkroniserad CPU-GPU-minnesåtkomst som en del av optimeringsfunktionerna som gör Rubin-plattformen en storleksordning mer effektiv än sin Blackwell-baserade föregångare.
Källa(n)
Topp 10...
» Topp 10: Bästa bärbara allround/multimediadatorerna
» Topp 10: Bästa bärbara speldatorerna
» Topp 10: Bärbara budget/kontorsdatorer
» Topp 10: Bästa bärbara kontors/premiumdatorerna
» Topp 10: Bärbara arbetsstationer
» Topp 10: De bästa små/kompakta bärbara datorerna
» Topp 10: Bästa ultrabooks
» Topp 10: Bästa hybriddatorerna
» Topp 10: Bästa surfplattorna
» Topp 10: Marknadens bästa smartphones










