Drygt två år efter lanseringen har xAI:s Grok blivit den ledande språkmodellen för AI, och passerar OpenAI:s ChatGPT, Googles Gemini eller DeepSeek, liksom Meta och Anthropic. Grok kommer att anlända till Tesla-bilar nästa vecka, sa Elon Musk.
Enligt oberoende tredjepartstester har den nyligen släppta Grok 4 nu toppat det offentliga AI-modellernas prestandatabell. Drivkraften bakom den 10-faldiga förbättringen i resonemang mellan Grok 3 och Grok 4 var de AI-beräkningskluster som xAI byggde med halsbrytande hastighet och fördubblade dem till 200 000 GPU: er på väg till den planerade miljonen.
XAI-teamet kontaktade personerna bakom det krävande prestandatestet ARC-AGI och bad dem köra sina sviter av AI-tester, med överraskande resultat:
Först fakta: Grok 4 är nu den bäst presterande offentligt tillgängliga modellen på ARC-AGI. Detta överträffar till och med specialbyggda lösningar som lämnats in på Kaggle. För det andra: ARC-AGI-2 är svårt för nuvarande AI-modeller. För att få bra poäng måste modellerna lära sig en minifärdighet från en serie träningsexempel och sedan visa den färdigheten vid testtid. Den tidigare topppoängen var ~ 8% (av Opus 4). Under 10% är bullrigt. När 15,9% bryter igenom den brusbarriären visar Grok 4 nivåer av flytande intelligens som inte är noll
En annan oberoende AI-testare, Artificial Analysis, sa att de har
"kört hela vår uppsättning av riktmärken och Grok 4 uppnår ett Artificial Analysis Intelligence Index på 73, före OpenAI o3 på 70, Google Gemini 2.5 Pro på 70, Anthropic Claude 4 Opus på 64 och DeepSeek R1 0528 på 68."
Enligt Elon Musk i presentationen av Grok 4 är xAI:s modell nu smartare än alla forskarstuderande inom alla discipliner tillsammans. Med sin typiska pie-in-the-sky bluster hävdade Teslas VD att Grok 4 kommer att kunna upptäcka "ny teknik" som mediciner eller tekniska genombrott på egen hand nästa år.
Ändå medgav han att Grok fortfarande kommer att vara dålig på bildigenkänning under den närmaste månaden eller så, och tog upp de senaste supremacistiska svaren kontrovers genom att säga att"när Grok går väldigt fel beror det oftast på något dumt vi gjort, som en dålig systemprompt eller att vi lägger för stor vikt vid partiska källor"
Musk behöver pumpa Grok 4 eftersom hans xAI introducerar en betald premiumnivå för första gången. Den kallas SuperGrok Heavy och kostar från 300 USD/månad och inkluderar det som ingår i SuperGrok-nivån på 30 USD/månad som ger initial tillgång till Grok 4, plus tillgång till Grok 4 Heavy-plattformen som erbjuder högre hastighetsgränser och tidig tillgång till nya funktioner.
Grok 3 kommer att förbli gratis att använda för allmänheten, medan alla X Premium+-abonnenter kommer att få tillgång till Grok 4 i SuperGrok-nivån.
Topp 10...
» Topp 10: Bästa bärbara allround/multimediadatorerna
» Topp 10: Bästa bärbara speldatorerna
» Topp 10: Bärbara budget/kontorsdatorer
» Topp 10: Bästa bärbara kontors/premiumdatorerna
» Topp 10: Bärbara arbetsstationer
» Topp 10: De bästa små/kompakta bärbara datorerna
» Topp 10: Bästa ultrabooks
» Topp 10: Bästa hybriddatorerna
» Topp 10: Bästa surfplattorna
» Topp 10: Marknadens bästa smartphones