Notebookcheck Logo

Sora 2 är OpenAI:s konsekvent inkonsekventa AI-videoskapare

I alla dessa tester var det en sanning som stack ut: Sora 2 är genomgående inkonsekvent. En man som dansar runt Sora 2-logotypen på bilden. (Bildkälla: Notebookcheck - Darryl Linington, genererad med Sora 2)
I alla dessa tester var det en sanning som stack ut: Sora 2 är genomgående inkonsekvent. En man som dansar runt Sora 2-logotypen på bilden. (Bildkälla: Notebookcheck - Darryl Linington, genererad med Sora 2)
Sora 2 bygger vidare på OpenAI:s text-till-video-grund men lägger till skarpare rörelsespårning, mer sammanhängande belysning och starkare "världssimulering" I enklare termer: det är mycket bättre på att få objekt att bete sig som om de hör hemma i samma fysiska utrymme.

Där de flesta AI-videomodeller kämpar med kontinuitet, förstår Sora 2 miljöns orsak och verkan. Skuggor skiftar på ett realistiskt sätt. Vatten krusar sig när något rör sig nära det. Reflexer visas i glas och pölar, inte i slumpmässiga vinklar.

OpenAI beskriver Sora 2 som kapabel att generera "komplexa scener med flera karaktärer, specifika rörelser och detaljerade bakgrunder som förblir konsekventa över tid" Det är sant - även om "konsekvent" fortfarande är en relativ term i den här världen.

Frågeställning 1: Central Park-duellen som gick i stöpet

Det första testet var avsiktligt ambitiöst:

"En fridfull eftermiddag i Central Park i New York. Turisterna flanerar i det mjuka solljuset. Plötsligt aktiverar en klädd figur en glödande energistav och uppmanar människor att sätta sig i säkerhet. En annan, i mörka kläder, dyker upp från träden och håller ett rött vapen. Publiken skingras när de två duellerar - eleganta, dansliknande rörelser, glödande ljusbågar som reflekteras på vattnet i närheten. Kameran cirklar runt dem hela tiden medan höstlöven virvlar i luften."

Det som kom tillbaka var visuellt slående - mjuka gyllene toner, smidig kamerarotation och övertygande reflektioner. Men sedan kom kaoset. De glödande stavarna (ljussabeln) flimrade, böjdes och förvandlades till udda former. Kämparnas kroppar tappade balansen och lemmarna klipptes genom varandra som spöklika polygoner från ett videospel från 90-talet. Koreografin gled över i surrealistisk tolkande dans snarare än filmisk strid.

Och den här bristen är inte unik för mitt test. OpenAI har erkänt att Sora 2 "kämpar med ihållande, fysiskt trovärdig humanoid strid eller vapenkoreografi", en begränsning som snabbt blir uppenbar när vapnen börjar röra sig.

Ändå såg den omgivande världen tillräckligt verklig ut för att du nästan kunde förlåta den. Scenen kändes filmisk, även om handlingen inte var det.

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

Frågeställning 2: Återlösningen av duellen i Central Park

Sora 2 svarade ganska bra på följande fråga.

"En fridfull eftermiddag i Central Park i New York. Turister promenerar och tar foton i det mjuka gyllene solljuset. Plötsligt aktiverar en figur i ljusa kläder en glödande energistav och uppmanar folk att sätta sig i säkerhet. En annan figur i mörk dräkt dyker upp från träden med ett rött energivapen i handen. Publiken skingras när de två inleder en exakt, filmisk duell - eleganta, dansliknande rörelser, lysande ljusbågar som reflekteras på vattnet i närheten. Kameran cirklar runt dem i en kontinuerlig tagning medan höstlöv virvlar i luften. Ingen kontakt eller skada visas - bara skicklig koreografi och dynamisk rörelse."

Den här gången fungerade det faktiskt. Rörelserna såg jordade, flytande och förvånansvärt mänskliga ut, med en slutstöt som flyter så naturligt att det är lätt att glömma att man tittar på något som genererats av AI.

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

Frågeställning 3: Fåglar och lejon vid ett vattenhål

För ett lugnare test vände jag mig till vilda djur. Frågeställningen:

"Skapa en scen med vilda djur där fåglar och lejon dricker naturligt från ett vattenhål. Varje djur ska röra sig realistiskt och scenen måste vara hyperrealistisk."

Här var Sora 2 i sitt rätta element. Fåglarna fladdrade och dök med trovärdiga vingrörelser. Solljuset skimrade på vattenytan och reflexerna reagerade naturligt när djuren bytte position. Texturerna - päls, fjädrar, krusig lera - såg ut att vara av närmast naturdokumentär kvalitet.

Men modellens egenheter smög sig ändå in. Ett lejon hamnade felplacerat vid den leriga kanten och såg ut att dricka direkt från smutsen snarare än från vattnet. Det är en mindre men talande detalj: Sora 2 har bra koll på den övergripande scenen men tappar ibland bort interaktionen mellan objekt och yta.

Trots det var detta det mest övertygande resultatet - och en antydan om var Sora 2:s verkliga styrka ligger: miljörealism.

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

Prompt 4: Den futuristiska takjakten

I det sista testet pressade jag rörelse, belysning och atmosfär till det yttersta:

"En vidsträckt futuristisk stadsbild i gryningen. En cyberpunk-kurir i mörk jacka springer över hustaken med en glödande dataväska. En förföljande drönare slingrar sig mellan antenner och ventilationskanaler med blå drivraketer.

Kameran följer löparen bakifrån och till höger om honom, handhållen, när han hoppar över en lucka. Drönaren kör om i luften; linsöverstrålning och rörelseoskärpa fullbordar scenen."

Resultatet var fantastiskt - och förvånansvärt filmiskt.

Ljussättningen var avgörande: soluppgången som glittrade i glastorn, reflektioner på metallytor och subtil linsreflex under hoppet. Rörelsen kändes flytande och tung. Drönarjakten skapade genuin spänning, medan det grunda skärpedjupet efterliknade en 35 mm filmkamera.

Det här var Sora 2 som gick på högvarv - komplext, sammanhängande och trovärdigt. Om detta hade släppts som en teaser för ett spel eller en film skulle de flesta tittare inte misstänka AI-engagemang vid första anblicken.

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

Den vackra oförutsägbarheten i Sora 2

I alla dessa tester var det en sanning som stod ut: Sora 2 är genomgående inkonsekvent. Ibland får det allt rätt. Andra gånger skapar det något så bisarrt att du inte kan sluta skratta. Den oförutsägbarheten har blivit en del av dess charm.

På Reddit sammanfattade en användare det perfekt:

"Sora 2 ger dig antingen Pixar eller feberdrömsenergi, inget mittemellan."
- r/AIGuild

Modellen förvränger ibland föremål, ändrar färg mitt i scenen eller misstolkar uppmaningar på härligt absurda sätt. En uppmaning om "två plyschdjur som går sida vid sida" gav en gång upphov till varelser som såg ut som hälften nallebjörn, hälften uppblåsbar ballong. Det är inte exakt - men det är minnesvärt.

Det kaoset kan vara en belastning för professionella användare som behöver tillförlitlighet, men för kreativa experiment är det guld värt. Sora 2 fungerar ibland mer som en samarbetspartner med en överaktiv fantasi än som en förutsägbar maskin.

Realism kontra verklighet: Förstå Sora 2:s styrkor

När Sora 2 fungerar känns det som magi. Men det är inte magi - det är en maskin som tolkar dina ord med hjälp av sannolikhet och visuell mönsterinlärning. Den trivs med sammanhang, inte med precision. Ge den en stark känsla för platsen - ljusriktning, kamerarörelse, ton - och den fyller i resten på ett övertygande sätt. Be den om precisionsbaserad koreografi eller finmotorisk interaktion och den vacklar.

Mönstret matchar det som andra har observerat i testgrupper på Reddit och Discord. Skaparna noterar att enklare mänskliga handlingar (gå, titta, gestikulera) är trovärdiga, men komplexa sekvenser (slåss, kramas, spela instrument) bryts snabbt ner. Det tyder på att OpenAI:s fysikmodellering fortfarande behandlar människokroppen som en uppsättning oberoende rörelsekluster snarare än en enda enhet. Det är tillräckligt realistiskt i några sekunder - sedan tar entropin över.

Det bredare sammanhanget: Kreativitet i algoritmernas tidsålder

Det som gör Sora 2 så fascinerande är inte bara de tekniska framstegen, utan också den kulturella förändring som det representerar.

I årtionden var det dyrt, tidskrävande och begränsat av tillgång till utrustning eller talang att skapa video. Nu kan vem som helst med en bra idé och ett stycke text producera något visuellt övertygande.

Denna demokratisering är kraftfull - men den suddar också ut det kreativa författarskapet. När en modell "föreställer sig" en del av en scen på ett felaktigt sätt, är det då ett misslyckande eller en tolkning?

I min duell i Central Park förstörde de förvridna vapnen realismen men gav en drömlik kvalitet. Det var inte vad jag ville ha, men det antydde ändå en surrealistisk, målerisk estetik - något som ligger närmare experimentell film än Hollywood-action.

Kanske är det den djupare lärdomen: AI-filmskapande handlar inte om kontroll. Det handlar om förhandling.

Tekniska och etiska gränser

OpenAI är medvetet om både spänningen och oron kring det här verktyget. Företaget fortsätter att begränsa åtkomsten med hänvisning till potentiellt missbruk och behovet av skyddsåtgärder för innehållet.

Japans regering uppmanade nyligen OpenAI att se till att Sora 2 inte gör intrång i upphovsrätten för anime och manga - en påminnelse om att AI:s kreativa räckvidd får juridiska konsekvenser i verkligheten. Sedan har vi frågan om originalitet. Sora 2:s utgångar kan se nya ut, men de är utbildade på stora mängder befintliga medier. Ju mer realistiskt det blir, desto svårare är det att skilja mellan hyllning och kopiering. Det är därför som Sora 2, trots sitt under, befinner sig i ett vägskäl mellan konstnärskap och automatisering.

Prissättning för Sora 2. (Bildkälla: OpenAI)
Prissättning för Sora 2. (Bildkälla: OpenAI)

Ljudproblem är mycket märkbara

De flesta Sora 2-klipp kämpar fortfarande med ljud. Medan det visuella ofta är fantastiskt, tenderar ljudet att låta dåligt, platt, dämpat eller onaturligt. Sora 2 försöker generera omgivningsljud, effekter och dialog på en och samma gång, men kan inte separera dem som en riktig ljuddesigner skulle göra. Resultatet blir överkomprimerat, metalliskt eller konstigt balanserat ljud som sällan matchar den filmiska kvaliteten på bilderna. För tillfället är det bästa sättet att få Sora 2-videor att låta bra att lägga till ljud i efterproduktionen, genom att lägga på atmosfär, effekter och musik från den verkliga världen för att ge scenen liv.

En glimt av framtiden, ofullständigt återgiven

Efter flera dagars testande har Sora 2 imponerat på mig, roat mig och gjort mig lite orolig. Det är både ett tekniskt underverk och en påminnelse om att mänskliga rörelser, känslor och berättelser fortfarande är unikt komplexa.

Styrkor: Miljöer, belysning, atmosfär, dynamisk rörelse och realism i korta sekvenser.

Svagheter: Mänsklig kontakt, vapenfysik, enstaka surrealistiska förvrängningar.

Levererar Sora 2 verkligen?

Sora 2 är ett ganska anständigt steg mot AI-assisterat filmskapande... Men förvänta dig inte felfri realism än. Dessutom är det fortfarande de riktiga filmskaparna som är de verkliga konstnärerna vi behöver... Eftersom Sora 2 fortfarande kämpar med att flytta antimon från en människa, såväl som djur, på ett naturligt sätt.

Som en redditor uttryckte det:

"Sora 2 känns som att se hur framtiden lär sig att drömma."
- r/OpenAI

Det är en passande sammanfattning. Sora 2 simulerar inte bara verkligheten... Den experimenterar med den. Och för oss som ser det här utvecklas är det både spännande och djupt mänskligt... Bara med extremt dålig ljudkvalitet.

Please share our article, every link counts!
Mail Logo
> Bärbara datorer, laptops - tester och nyheter > Nyheter > Nyhetsarkiv > Nyhetsarkiv 2025 11 > Sora 2 är OpenAI:s konsekvent inkonsekventa AI-videoskapare
Darryl Linington, 2025-11-12 (Update: 2025-11-13)