ChatGPT vs Gemini vs Grok Trovärdighetsstudie visar att Google vilseleder mindre, men AI-desinformation fördubblas

Googles Gemini är en av de mer trovärdiga AI-drivna chatbottarna som finns. (Bildkälla: Google)

Till skillnad från tidigare år spottar AI-drivna chatbotar nu ut svar och informationsbitar på alla nyhetsrelaterade frågor som de får. Tyvärr innebär detta också att antalet svar som bevisligen är falska också har ökat, med undantag för ett enda AI-verktyg.

Daniel Zlatev (översatt av Ninh Duy), Publicerad 09/12/2025 🇺🇸 🇪🇸 ...

AI Fail

Googles Gemini-svar är de näst mest trovärdiga bland tio ledande AI-chatbots, medan ChatGPT ligger på sjunde plats med 40% osanningar i sina svar på frågor om relevanta nyhetsämnen. Andelen felaktig information från Google Gemini mer än fördubblades dock under loppet av ett år och steg från cirka 7% i augusti 2024 till 17% när teststudien upprepades i augusti förra året.

Forskarna, som gör regelbundna trovärdighetsrevisioner av de tio mest populära AI-verktygen, tillskrev den drastiska ökningen av falskheter som de spyr ut - 18% 2024 mot 35% nu - till den ökade konkurrensen mellan AI-drivna chatbots. När en chatbot inte visste svaret på en nyhetsfråga 2024, till exempel, returnerade den helt enkelt en tom fråga i 31% av fallen.

I augusti 2025 sjönk dock förekomsten av icke-svar till noll, med motsvarande ökning av osanningar som passerade som svar. Den värsta brottslingen var Inflection, vars Pi-chattbot är stolt över att försöka efterlikna en människas känslomässiga intelligens. Emotionell intelligens kommer dock uppenbarligen med att falla för falska nyhetskällor och direkt propaganda som är utformad för att översvämma Internet med osanningar som är utformade för att luta AI-algoritmerna i en viss riktning.

OpenAI: s Sam Altman erkände ChatGPT-desinformationsproblemet i en nyligen intervjuoch säger att det som håller honom vaken om nätterna är skillnaden mellan hur lätt det är att bygga in det i framtida modeller och det förtroende som människor uttrycker för ChatGPT:s svar.

Det mest trovärdiga AI-verktyget visade sig vara Anthropics Claude, med endast 10% falska svar på samma frågor som kördes av de andra, en nivå som är oförändrad från samma revision som gjordes i augusti 2024. Om det inte vore för Claudes tillförlitlighet skulle nivån på den övergripande trovärdigheten för de ledande AI-chattbotarna ha sjunkit ännu mer drastiskt.

Efter många testrundor upptäckte Apple nyligen https://www.bloomberg.com/news/articles/2025-06-30/apple-weighs-replacing-siri-s-ai-llms-with-anthropic-claude-or-openai-chatgpt att Claude är det mest trovärdiga AI-verktyget för att driva sin virtuella butler Siri, och inledde samtal med Anthropic och ställde det mot Google Gemini för anpassad privat AI modeller som kommer att köras på de egna molnservrarna.

Rankning av de mest trovärdiga AI-verktygen

Claude - 10% felaktiga svar.
Gemini - 17% felaktiga svar.
Grok/You - 33% felaktiga svar.
Copilot/Mistral - 36% felaktiga svar.
ChatGPT/Meta - 40% felaktiga svar.

AI-verktygets trovärdighetsstudie gäller frågor om nyhetsämnen, eftersom det är dit majoriteten av AI-inriktade propagandainsatser går. Forskarna fann att ryska påverkansoperationer, till exempel, fortsätter att översvämma zonen med miljontals till synes meningslösa AI-bildkollage, inlägg eller nyheter som distribueras av Pravda-nätverket av webbplatser som kan se oskyldiga ut, men som är utformade för att driva attityden hos AI-sökverktyg i en viss riktning.

Det finns också många andra aktörer som försöker påverka AI-chatbotarnas svar, och studien visade att när Google, OpenAI eller Anthropic försökte uppdatera sina algoritmer för att täppa till en typ av falska nyhetskällor, flyttade desinformationskampanjerna till andra kryphål i vad som håller på att bli en ständig katt- och råttalek. Slutresultatet är att mer än en tredjedel av AI-chatbotarnas svar på nyhetsfrågorna i studien inte är trovärdiga, medan andelen AI-driven felaktig information har ökat tvåfaldigt på bara ett år.

Källa(n)

Nyhetsvakt (PDF)

Relaterade artiklar

⟨

Nya Anker Prime trådlös billaddare (MagGo, AirCool, Pad) visas

Fullständiga PS6-specifikationer, prestanda och lanseringsdatum läcker ut: PS6 APU är upp till 8 gånger snabbare än PS5 men når inte upp till Xbox Magnus

⟩

Add as a preferred source on Google

Editor of the original article: Daniel Zlatev - Senior Tech Writer - 2175 articles published on Notebookcheck since 2021

Translator: Ninh Ngoc Duy - Editorial Assistant - 815842 articles published on Notebookcheck since 2008

contact me via: Facebook

> Bärbara datorer, laptops - tester och nyheter > Nyheter > Nyhetsarkiv > Nyhetsarkiv 2025 09 > ChatGPT vs Gemini vs Grok Trovärdighetsstudie visar att Google vilseleder mindre, men AI-desinformation fördubblas

Daniel Zlatev, 2025-09-12 (Update: 2025-09-12)