Du utbildar AI gratis - och den säger inte ens tack

Har du någonsin fått känslan av att dina ChatGPT-kaninhål på sena kvällar gör mer för Silicon Valley än din egen sömnlöshetsdrivna produktivitet? Det beror på att de gör det. Om du använder gratis AI-verktyg, grattis, du har blivit inkallad till en global obetald arbetskraft, och ingen har ens brytt sig om att ge dig en artig mugg.
Hur det faktiskt fungerar (ja, du är en del av det)
Låt oss dra undan gardinen. De flesta gratis AI-chatbots, som ChatGPT, Claude och Gemini, kör på modeller som förbättras med något som kallas Reinforcement Learning from Human Feedback (RLHF). Det låter komplicerat, men här är den enkla versionen:
Du ställer en fråga. AI:n svarar. Du betygsätter det med tummen upp eller ner. Kanske föredrar du ett svar framför ett annat. Grattis ... du har just tränat modellen. Dina preferenser loggas och analyseras, och så småningom justeras modellen för att bli mer "hjälpsam"
De här verktygen finns inte bara i molnet för skojs skull. De lär sig av dig. Faktum är att du inte bara chattar; du är en mycket prisvärd (läs: obetald) dataantecknare.
Ja, även betalande användare hjälper till att träna robotarna
Tror du att du har sluppit undan datakvarnen genom att betala för GPT-4? Tänk om igen. Om du inte uttryckligen har valt bort det i dina ChatGPT-inställningar används dina interaktioner fortfarande för att finjustera hur AI beter sig. Det är helt rätt. Du betalar 20 USD/månad för att bidra till produktutveckling. I stor skala. Utan royalties. Snyggt trick, eller hur?
OpenAI, till exempel, använder konversationer från både gratis och betalda användare för att förbättra sina modeller, såvida du inte stänger av "chatthistorik" Googles Gemini? Samma sak. Anthropics Claude? Samlar också in preferenser för att förbättra sina inriktningsmodeller.
RLHF är inte bara teknisk magi... Det är ett mänskligt transportband
Bakom varje tjusigt klingande akronym som RLHF finns en mycket verklig och mycket mänsklig process. Entreprenörer anlitas för att rangordna svar, flagga hallucinationer och klassificera uppmaningar.
Företag som Sama (en gång kopplat till OpenAI), Surge AI och Scale AI tillhandahåller denna arbetskraft, ofta genom lågbetalda entreprenörer som arbetar långa timmar, många i utvecklingsländer. År 2023 bekräftade rapporter att RLHF-etiketterare tjänade 2 till 15 dollar i timmen, beroende på region och roll. Så, ja, riktiga människor klickar på "det här svaret är bättre" om och om igen. Och det är den återkopplingsslingan som driver robotarna.
Om du ger samma typ av återkoppling via tummen upp gör du i princip en miniversion av deras jobb... gratis.
Hur den feedbacken används
Det är här det blir intressant. Din feedback tränar inte huvudmodellen direkt. Den matas in i belöningsmodeller, mindre system som talar om för huvud-AI:n hur den ska bete sig. Så när du säger: "Jag gillar det här svaret bättre", hjälper du till att bygga den interna kompass som den stora modellen följer. När tillräckligt många människor gör det börjar AI:n kännas mer mänsklig, artigare, mer hjälpsam ... eller mer som en kolumnist med gränsdragningsproblem.
Hur är det med din skrivstil?
AI minns tonen. När du konsekvent interagerar med den i en viss stil - sarkastisk, akademisk eller brutalt trubbig - lär sig systemet att svara på samma sätt. Det stjäl inte din skrivröst och säljer den till andra (ännu), men dina mönster bidrar till att utgöra en del av den kollektiva träningsupplevelsen, särskilt om boten ser att andra gillar din formulering eller ton.
Det handlar mindre om att klona dig och mer om att replikera det som fungerar. Och det som fungerar kommer ofta från någon som aldrig samtyckt till stilreplikering.
CAPTCHA är inte bara för robotar längre
Åh, och de där CAPTCHA-pusslen som du löser för att bevisa att du är mänsklig? Du klickar inte bara på trafikljus och övergångsställen för att komma in i din e-post. Du märker data för maskininlärningsmodeller. Googles reCAPTCHA, hCaptcha och Cloudflares Turnstile matar alla visuella data till utbildningspipelines, vilket hjälper AI att se världen en suddig gatuskylt i taget.
Så ja, även din säkerhetsverifiering är en del av återkopplingsekonomin nu.
Miljarder i värde... Noll igenkänning
Det här är inte någon konspiration. Marknaden för utbildningsdata blomstrar. Enligt MarketsandMarkets förväntas den globala marknaden för träningsdata växa från 1,5 miljarder dollar 2023 till över 4,6 miljarder dollar 2030. Och även om det inkluderar syntetiska data och kurerade datamängder, ökar värdet av mänskligt märkta verkliga data, aka vad du tillhandahåller tillfälligt varje dag.
Ändå tror de flesta användare fortfarande att deras chatbot-konversation försvinner i etern. Spoiler: det gör den inte. Inte om du inte uttryckligen har avaktiverat loggning (och även då... lita på, men verifiera).
En sista tanke: Du är inte paranoid ... du är bara involverad
Här är det som gäller. Du är med och bygger just det som så småningom kan ersätta ditt jobb, överträffa din kreativitet eller förvandla dina tweets till produktprover. Det betyder inte att du ska sluta använda AI, men du bör veta vad du bidrar till. Och kanske, bara kanske, be om lite transparens i gengäld.
När allt kommer omkring, om ditt gratisarbete är tillräckligt bra för att forma nästa generation av AI-modeller för miljarder dollar, är det minsta de kan göra att säga tack.
Källa(n)
Egen forskning och erfarenhet
AI Training Dataset Market Share, Prognos | Tillväxtanalys och trendrapport [2032]
Bildkälla: Vjulien Tromeur - Unsplash
Topp 10...
» Topp 10: Bästa bärbara allround/multimediadatorerna
» Topp 10: Bästa bärbara speldatorerna
» Topp 10: Bärbara budget/kontorsdatorer
» Topp 10: Bästa bärbara kontors/premiumdatorerna
» Topp 10: Bärbara arbetsstationer
» Topp 10: De bästa små/kompakta bärbara datorerna
» Topp 10: Bästa ultrabooks
» Topp 10: Bästa hybriddatorerna
» Topp 10: Bästa surfplattorna
» Topp 10: Marknadens bästa smartphones