DeepSeek har presenterat den senaste versionen av sin banbrytande R1 AI stora språkmodell, DeepSeek-R1-0528. Företaget bröt sig in i AI-världen med lanseringen av V3 och R1, båda med topp-tio AI-prestanda men utbildas billigare och tar kortare tid än konkurrerande modeller från företag som OpenAI och Google.
Den senaste R1-modellen testades mot följande AI-benchmarks:
- Amerikansk inbjudande matematikexamen (AIME) 2024
- Amerikansk inbjudande matematikexamen (AIME) 2025
- Google-bevisade frågor och svar (GPQA)
- LiveCodeBench
- Aider AI-kodning
- Mänsklighetens sista prov
Även om DeepSeek-R1-0528 har förbättrat prestanda jämfört med den ursprungliga R1-versionen i alla riktmärken, svarar den bara på 17% av frågorna korrekt i det tuffa Humanity's Last Exam. Eftersom dess främsta konkurrenter också får dåliga resultat på detta prov, kommer vinsterna i den senaste versionen av DeepSeek R1 sannolikt från ytterligare AI-träningstid och inställning snarare än något genombrott i AI-skapande. Det är viktigt att den senaste R1 har minskat AI-hallucinationer, så det är mindre troligt att den genererar vilseledande eller falska svar.
Läsare som vill tippa med R1-modellen med öppen källkod kan köra destillerade, åtta miljarder parameterversioner med en Nvidia 4090 GPU med 24 GB minne.
Topp 10...
» Topp 10: Bästa bärbara allround/multimediadatorerna
» Topp 10: Bästa bärbara speldatorerna
» Topp 10: Bärbara budget/kontorsdatorer
» Topp 10: Bästa bärbara kontors/premiumdatorerna
» Topp 10: Bärbara arbetsstationer
» Topp 10: De bästa små/kompakta bärbara datorerna
» Topp 10: Bästa ultrabooks
» Topp 10: Bästa hybriddatorerna
» Topp 10: Bästa surfplattorna
» Topp 10: Marknadens bästa smartphones