Notebookcheck Logo

Grok 4 slår ChatGPT för att bli den bästa offentliga AI-modellen när Elon Musk visar $ 300 / månad premiumabonnemang

Logotypen för Grok 4 AI-språkmodellen. (Bildkälla: xAI)
Logotypen för Grok 4 AI-språkmodellen. (Bildkälla: xAI)
Den nya Grok 4 av Elon Musks xAI är nu den bästa AI-modellen som är tillgänglig för allmänheten, enligt testplattformar från tredje part, som slår ChatGPT eller Googles Gemini. XAI-teamet introducerade också ett nytt och dyrt AI-prenumerationsalternativ som heter Grok 4 Heavy.

Drygt två år efter lanseringen har xAI:s Grok blivit den ledande språkmodellen för AI, och passerar OpenAI:s ChatGPT, Googles Gemini eller DeepSeek, liksom Meta och Anthropic. Grok kommer att anlända till Tesla-bilar nästa vecka, sa Elon Musk.

Enligt oberoende tredjepartstester har den nyligen släppta Grok 4 nu toppat det offentliga AI-modellernas prestandatabell. Drivkraften bakom den 10-faldiga förbättringen i resonemang mellan Grok 3 och Grok 4 var de AI-beräkningskluster som xAI byggde med halsbrytande hastighet och fördubblade dem till 200 000 GPU: er på väg till den planerade miljonen.

XAI-teamet kontaktade personerna bakom det krävande prestandatestet ARC-AGI och bad dem köra sina sviter av AI-tester, med överraskande resultat:

Först fakta: Grok 4 är nu den bäst presterande offentligt tillgängliga modellen på ARC-AGI. Detta överträffar till och med specialbyggda lösningar som lämnats in på Kaggle. För det andra: ARC-AGI-2 är svårt för nuvarande AI-modeller. För att få bra poäng måste modellerna lära sig en minifärdighet från en serie träningsexempel och sedan visa den färdigheten vid testtid. Den tidigare topppoängen var ~ 8% (av Opus 4). Under 10% är bullrigt. När 15,9% bryter igenom den brusbarriären visar Grok 4 nivåer av flytande intelligens som inte är noll

En annan oberoende AI-testare, Artificial Analysis, sa att de har

"kört hela vår uppsättning av riktmärken och Grok 4 uppnår ett Artificial Analysis Intelligence Index på 73, före OpenAI o3 på 70, Google Gemini 2.5 Pro på 70, Anthropic Claude 4 Opus på 64 och DeepSeek R1 0528 på 68."

Enligt Elon Musk i presentationen av Grok 4 är xAI:s modell nu smartare än alla forskarstuderande inom alla discipliner tillsammans. Med sin typiska pie-in-the-sky bluster hävdade Teslas VD att Grok 4 kommer att kunna upptäcka "ny teknik" som mediciner eller tekniska genombrott på egen hand nästa år.

Ändå medgav han att Grok fortfarande kommer att vara dålig på bildigenkänning under den närmaste månaden eller så, och tog upp de senaste supremacistiska svaren kontrovers genom att säga att"när Grok går väldigt fel beror det oftast på något dumt vi gjort, som en dålig systemprompt eller att vi lägger för stor vikt vid partiska källor"

Musk behöver pumpa Grok 4 eftersom hans xAI introducerar en betald premiumnivå för första gången. Den kallas SuperGrok Heavy och kostar från 300 USD/månad och inkluderar det som ingår i SuperGrok-nivån på 30 USD/månad som ger initial tillgång till Grok 4, plus tillgång till Grok 4 Heavy-plattformen som erbjuder högre hastighetsgränser och tidig tillgång till nya funktioner.

Grok 3 kommer att förbli gratis att använda för allmänheten, medan alla X Premium+-abonnenter kommer att få tillgång till Grok 4 i SuperGrok-nivån.

Grok vs ChatGPT vs Gemini AI-modeller historiskt resultatdiagram.
Grok vs ChatGPT vs Gemini AI-modeller historiskt resultatdiagram.
Rankning av de bästa AI-modellerna.
Rankning av de bästa AI-modellerna.

Källa(n)

Please share our article, every link counts!
Mail Logo
> Bärbara datorer, laptops - tester och nyheter > Nyheter > Nyhetsarkiv > Nyhetsarkiv 2025 07 > Grok 4 slår ChatGPT för att bli den bästa offentliga AI-modellen när Elon Musk visar $ 300 / månad premiumabonnemang
Daniel Zlatev, 2025-07-10 (Update: 2025-07-10)