Notebookcheck Logo

Google introducerar Gemini 2.5 Flash Image "nano-banan" med starkare redigeringskonsistens

Google DeepMinds "nano-banan"-modell erbjuder exakta bildredigeringar (Bildkälla: Gemini)
Google DeepMinds "nano-banan"-modell erbjuder exakta bildredigeringar (Bildkälla: Gemini)
Google DeepMinds nya Gemini 2.5 Flash Image, med smeknamnet "nano-banan", utlovar finare kontroll över AI-bildredigering. Den håller karaktärerna konsekventa i olika scener, tillåter redigering i flera vändningar och blandar bilder med instruktioner på naturligt språk, samtidigt som den lägger till synliga och osynliga vattenstämplar för säkerhets skull.

Google DeepMind lanserar https://blog.google/intl/en-mena/product-updates/explore-get-answers/nano-banana-image-editing-in-gemini-just-got-a-major-upgrade/ Gemini 2.5 Flash Image, även kallad "nano-banana", för Gemini-appen och för utvecklare via Gemini API, Google AI Studio och Vertex AI. Denna uppdatering behandlar ett vanligt klagomål med AI-bildverktyg: små redigeringar som slutar ändra hela bilden. Google beskriver den här versionen som en förbättring av kvalitet och kontroll jämfört med tidigare versioner.

Huvudfunktionen är karaktärskonsistens. Du kan se till att en person, ett husdjur eller en produkt ser likadan ut i olika scener, även om du ändrar kläder, frisyrer, tidsperioder eller inställningar. Modellen kan också kombinera flera bilder till en, göra specifika ändringar med hjälp av instruktioner på naturligt språk och använda Geminis världskunskap under bildskapande och redigering.

Du kan använda det här verktyget för att sätta samma karaktär i olika miljöer, visa en produkt från olika vinklar eller hålla varumärkesbilder konsekventa i olika kampanjer. Med Multi-turn editing kan du fortsätta att göra ändringar, till exempel lägga till möbler och inredning i ett rum för att testa idéer. Du kan också blanda mönster, lägga till ett mönster från en bild till ett objekt i en annan, eller blanda en person och ett husdjur i en ny scen.

Prissättningen är transparent för utvecklare: Gemini 2.5 Flash Image kostar $30 per en miljon output tokens. Varje bild räknas som 1 290 output tokens, vilket motsvarar cirka 0,039 dollar per bild. Andra inmatnings- och utmatningsmodaliteter följer standardprissättningen för Gemini 2.5 Flash.

Av säkerhetsskäl innehåller genererade bilder ett synligt AI-märke och en osynlig SynthID digital vattenstämpel. Google säger att SynthID fortfarande kan upptäckas efter vanliga redigeringar, vilket bör hjälpa till att verifiera bildens ursprung eftersom syntetiska medier blir svårare att känna igen.

Google säger att tidiga förhandsvisningar bedömer detta som en ledande bildredigeringsmodell. Gemini-appens inbyggda redigering behåller nu subtila detaljer i dina foton. Du kan ladda upp ett foto, begära ändringar, kombinera bilder med ditt husdjur, byta bakgrunder för att prova nya tapeter eller placera dig själv i olika scener. Du kan också använda den redigerade bilden i Gemini för att skapa en kort video.

Källa(n)

Google (på engelska)

Please share our article, every link counts!
Mail Logo
> Bärbara datorer, laptops - tester och nyheter > Nyheter > Nyhetsarkiv > Nyhetsarkiv 2025 08 > Google introducerar Gemini 2.5 Flash Image "nano-banan" med starkare redigeringskonsistens
Nathan Ali, 2025-08-28 (Update: 2025-08-28)