OpenAI har officiellt presenterat Sora 2, sin senaste flaggskeppsmodell för video- och ljudgenerering, och positionerar den som ett stort steg framåt i AI-drivet innehållsskapande. Den nya modellen erbjuder mer realistisk fysik, större kontrollerbarhet och introducerar synkroniserad dialog och miljöljudeffekter, vilket ger en ny nivå av inlevelse i AI-genererat innehåll. Sora 2 lanseras tillsammans med en ny social app, Sora, som syftar till att förändra hur människor interagerar med AI-genererade medier. Utrullningen börjar idag, den 30 september 2025, i USA och Kanada.
OpenAI beskriver den ursprungliga Sora modellen (som släpptes i början av 2024) som ett avgörande steg för generativ video - i likhet med GPT-1:s inverkan på bearbetning av naturligt språk. Sora 2 beskrivs däremot som ett "GPT-3.5-moment" för video, vilket sätter en ny ribba för AI:s förståelse av den fysiska verkligheten och världssimulering.
Enligt OpenAI innebär Sora 2 en stegvis förändring av förmågan till "världssimulering". Medan tidigare system ofta böjde verkligheten för att uppfylla en uppmaning, är Sora 2 utformat för att modellera rimliga resultat - inklusive missar och returer i en basketscen - i stället för att teleportera objekt för att passa manuset. Modellen kan nu återge scenarier som tidigare system inte har klarat av, till exempel gymnastikrutiner på olympisk nivå, exakta bakåtvolter på vatten som modellerar dynamiken i flytkraft och styvhet, eller till och med en trippel axel medan en katt klamrar sig fast för livet. Dessa framsteg gäller även systemets ljud: Sora 2 genererar bakgrundsljudlandskap, synkroniserat tal och ljudeffekter som sömlöst anpassas till det som händer på skärmen, vilket ger en ny dimension av realism.
En av de viktigaste funktionerna är möjligheten att "ladda upp sig själv" Användare kan spela in en kort video- och ljudsekvens, så att Sora 2 kan infoga dem (eller vänner, djur och andra verkliga objekt) i en genererad scen med mycket exakt visuell och röstmässig representation.
För att demonstrera Sora 2:s kapacitet lanserar OpenAI en ny iOS-app som heter Sora. Appen gör det möjligt för användare att skapa och remixa korta videor, upptäcka communityinnehåll i ett anpassningsbart flöde och medverka i AI-genererade scener genom funktionen "cameos". Cameos kräver en kort verifieringsprocess för att säkerställa användarens kontroll och samtycke, med fullständiga alternativ för integritet och borttagning av innehåll.
OpenAI positionerar den nya Sora-appen som skapande i första hand snarare än engagemangsmaximerad. Standardflödet prioriterar personer du följer och innehåll som sannolikt kommer att inspirera dina egna skapelser; företaget säger att det inte optimerar för spenderad tid. Tonårskonton får dagliga flödesvisningsgränser och strängare cameo-behörigheter, medan föräldrakontroller (via ChatGPT) tillåter åsidosättanden som att inaktivera algoritmisk personalisering eller begränsa oändlig rullning. OpenAI ökar också den mänskliga modereringen för att ta itu med mobbning och andra missbruksrisker.
Topp 10...
» Topp 10: Bästa bärbara allround/multimediadatorerna
» Topp 10: Bästa bärbara speldatorerna
» Topp 10: Bärbara budget/kontorsdatorer
» Topp 10: Bästa bärbara kontors/premiumdatorerna
» Topp 10: Bärbara arbetsstationer
» Topp 10: De bästa små/kompakta bärbara datorerna
» Topp 10: Bästa ultrabooks
» Topp 10: Bästa hybriddatorerna
» Topp 10: Bästa surfplattorna
» Topp 10: Marknadens bästa smartphones
Sora 2 lanseras idag i USA och Kanada, med planer på att expandera till ytterligare regioner. Appen lanseras endast med inbjudan för att uppmuntra till samarbete mellan vänner. Modellen är initialt gratis att använda, med "generösa begränsningar", med förbehåll för beräkningsbegränsningar. ChatGPT Pro-användare kan få tillgång till den högkvalitativa Sora 2 Pro-modellen först via ChatGPT, med stöd i Sora-appen som kommer snart. OpenAI planerar också att släppa Sora 2 via API för bredare integration. Innehåll som genererats med Sora 1 Turbo kommer att förbli tillgängligt i användarnas bibliotek.
OpenAI ser Sora 2 som ett viktigt steg mot utvecklingen av generella världssimulatorer och, så småningom, avancerad robotik. Företaget ser förbättringar i video-nativa AI-modeller som en väg inte bara för kreativa verktyg, utan för system som bättre kan förstå, interagera med och så småningom fungera i den fysiska världen.