Notebookcheck Logo

Nytt MIT-system låter små AI-modeller överträffa jättar på komplexa uppgifter

En dekorativ bild som visar akronymen AI (Bildkälla: Igor Omilaev via Unsplash; beskuren)
En dekorativ bild som visar akronymen AI (Bildkälla: Igor Omilaev via Unsplash; beskuren)
MIT-forskare har utvecklat ett ramverk för samarbete som gör det möjligt för en stor "boss"-modell att styra ett team av mindre AI-agenter och uppnå överlägsen resonemangseffektivitet och noggrannhet jämfört med ledande solomodeller.

Medan stora språkmodeller utmärker sig för saker som kreativt skrivande och grundläggande matematik, snubblar de ofta när de står inför komplexa, regeltunga uppgifter som Sudoku eller strikt resplanering. För att överbrygga detta gap har ett team av forskare vid MIT: s Computer Science and Artificial Intelligence Laboratory (CSAIL) - under ledning av Gabriel Grand - introducerat ett nytt system som heter DisCIPL (Distributional Constraints by Inference Programming with Language Models).

Ramverket fungerar på en chef-arbetstagarhierarki. En stor "boss"-modell fungerar först som en planerare som tar fram en strategi för att lösa en användares förfrågan. Den tilldelar sedan specifika komponenter av uppgiften till mindre, mer effektiva "följare".

För att se till att teamet håller sig på rätt spår kommunicerar chefen instruktioner med hjälp av LLaMPPL, ett specialiserat programmeringsspråk som är utformat för att styra modellerna mot exakta resultat. Om en följemodell avviker från begränsningarna - till exempel genom att använda fel formuleringar i en strukturerad dikt - ingriper huvudmodellen för att korrigera den.

Detta tillvägagångssätt har gett imponerande resultat. Enligt forskarnas rapport gav DisCIPL-systemet mer exakta svar än OpenAI:s GPT-4o och matchade precisionen hos den specialiserade resonemangsmodellen o1 i tester med uppgifter som att skriva anslagsförslag eller budgetera inköpslistor. Ännu mer anmärkningsvärt är att det gjorde det med mycket högre effektivitet. Genom att överföra det tunga arbetet till mindre modeller minskade systemet resonemangens längd med cirka 40% och sänkte kostnaderna med över 80% jämfört med konkurrenternas.

Teamet anser att denna metod erbjuder en hållbar väg framåt för AI, och visar att samordning av mindre modeller kan vara mycket mer effektivt - och energieffektivt - än att enbart förlita sig på massiva, krafthungriga system.

Källa(n)

Please share our article, every link counts!
Mail Logo
> Bärbara datorer, laptops - tester och nyheter > Nyheter > Nyhetsarkiv > Nyhetsarkiv 2025 12 > Nytt MIT-system låter små AI-modeller överträffa jättar på komplexa uppgifter
Chibuike Okpara, 2025-12-16 (Update: 2025-12-16)