Googles Gemini-svar är de näst mest trovärdiga bland tio ledande AI-chatbots, medan ChatGPT ligger på sjunde plats med 40% osanningar i sina svar på frågor om relevanta nyhetsämnen. Andelen felaktig information från Google Gemini mer än fördubblades dock under loppet av ett år och steg från cirka 7% i augusti 2024 till 17% när teststudien upprepades i augusti förra året.
Forskarna, som gör regelbundna trovärdighetsrevisioner av de tio mest populära AI-verktygen, tillskrev den drastiska ökningen av falskheter som de spyr ut - 18% 2024 mot 35% nu - till den ökade konkurrensen mellan AI-drivna chatbots. När en chatbot inte visste svaret på en nyhetsfråga 2024, till exempel, returnerade den helt enkelt en tom fråga i 31% av fallen.
I augusti 2025 sjönk dock förekomsten av icke-svar till noll, med motsvarande ökning av osanningar som passerade som svar. Den värsta brottslingen var Inflection, vars Pi-chattbot är stolt över att försöka efterlikna en människas känslomässiga intelligens. Emotionell intelligens kommer dock uppenbarligen med att falla för falska nyhetskällor och direkt propaganda som är utformad för att översvämma Internet med osanningar som är utformade för att luta AI-algoritmerna i en viss riktning.
OpenAI: s Sam Altman erkände ChatGPT-desinformationsproblemet i en nyligen intervjuoch säger att det som håller honom vaken om nätterna är skillnaden mellan hur lätt det är att bygga in det i framtida modeller och det förtroende som människor uttrycker för ChatGPT:s svar.
Det mest trovärdiga AI-verktyget visade sig vara Anthropics Claude, med endast 10% falska svar på samma frågor som kördes av de andra, en nivå som är oförändrad från samma revision som gjordes i augusti 2024. Om det inte vore för Claudes tillförlitlighet skulle nivån på den övergripande trovärdigheten för de ledande AI-chattbotarna ha sjunkit ännu mer drastiskt.
Efter många testrundor upptäckte Apple nyligen https://www.bloomberg.com/news/articles/2025-06-30/apple-weighs-replacing-siri-s-ai-llms-with-anthropic-claude-or-openai-chatgpt att Claude är det mest trovärdiga AI-verktyget för att driva sin virtuella butler Siri, och inledde samtal med Anthropic och ställde det mot Google Gemini för anpassad privat AI modeller som kommer att köras på de egna molnservrarna.
Rankning av de mest trovärdiga AI-verktygen
- Claude - 10% felaktiga svar.
- Gemini - 17% felaktiga svar.
- Grok/You - 33% felaktiga svar.
- Copilot/Mistral - 36% felaktiga svar.
- ChatGPT/Meta - 40% felaktiga svar.
AI-verktygets trovärdighetsstudie gäller frågor om nyhetsämnen, eftersom det är dit majoriteten av AI-inriktade propagandainsatser går. Forskarna fann att ryska påverkansoperationer, till exempel, fortsätter att översvämma zonen med miljontals till synes meningslösa AI-bildkollage, inlägg eller nyheter som distribueras av Pravda-nätverket av webbplatser som kan se oskyldiga ut, men som är utformade för att driva attityden hos AI-sökverktyg i en viss riktning.
Det finns också många andra aktörer som försöker påverka AI-chatbotarnas svar, och studien visade att när Google, OpenAI eller Anthropic försökte uppdatera sina algoritmer för att täppa till en typ av falska nyhetskällor, flyttade desinformationskampanjerna till andra kryphål i vad som håller på att bli en ständig katt- och råttalek. Slutresultatet är att mer än en tredjedel av AI-chatbotarnas svar på nyhetsfrågorna i studien inte är trovärdiga, medan andelen AI-driven felaktig information har ökat tvåfaldigt på bara ett år.
Källa(n)
Nyhetsvakt (PDF)
Topp 10...
» Topp 10: Bästa bärbara allround/multimediadatorerna
» Topp 10: Bästa bärbara speldatorerna
» Topp 10: Bärbara budget/kontorsdatorer
» Topp 10: Bästa bärbara kontors/premiumdatorerna
» Topp 10: Bärbara arbetsstationer
» Topp 10: De bästa små/kompakta bärbara datorerna
» Topp 10: Bästa ultrabooks
» Topp 10: Bästa hybriddatorerna
» Topp 10: Bästa surfplattorna
» Topp 10: Marknadens bästa smartphones