Gå direkt till textinnehållet
Journalistens omslag nr 1 2025 som skapats med generativ AI. Bild: Copy Lab

Så hamnade Schori i rymden

BESÖKET Från 25 mobilbilder till högupplöst astronaut. Journalisten tog hjälp av AI-pionjärerna på Copy Lab för att skapa det här numrets omslagsbild på Aftonbladets AI-chef Martin Schori. Så här gick det till.

Exklusivt för dig som är prenumerant eller medlem i Journalistförbundet.

– Okej. Vi skriver ”Imagine …” – det är ett nyckelord som chatboten vill att man använder när man pratar med den – och så klipper jag in promptet. ”Portrait of a man with long hair, 1950s era in Stockholm, wearing a fedora hat and trenchcoat.”

Carl-Axel Wahlström skriver hela instruktionen i AI-verktyget Midjourney. Det har tagit en liten stund att resonera sig fram till vad vi ska be om. Behöver det stå ”blonde hair” eller räcker det med ”Swedish”? Hudfärgen behöver inte preciseras: de stora AI-programmen har gott om stereotyper inbyggda. Vilket speglar internet.

– Martin är västerländsk. Det är den jobbiga delen av AI, att vit hy är standard. Men ”svart” eller ”asiatisk” behöver man beskriva.

Elli Ekenlöw gör ett första försök att lägga in Martin Schoris ansikte i 50-talsbilden. – Nja, vi är inte riktigt där än, konstaterar teamet. Efter att AI-modellen tränats om på ett mer komplext sätt för att få med alla Martins unika ansiktsdrag, något som tar den kraftfulla datorn flera dagar, blir bilden betydligt mer porträttlik. Foto: Tor Johnsson

Vi befinner oss i ett vitmålat och sparsmakat inrett kontor i centrala Stockholm, hos AI-produktionsbyrån Copy Lab. Grundarna heter Carl-Axel Wahlström och Axel Engström. Båda har jobbat länge inom mode och reklam som kreatör respektive producent. För två år sedan, ”när ChatGPT började hända”, släppte de allt för att ägna sig åt den nya tekniken.

De producerar nu världens första helt AI-genererade modemagasin, Copy Magazine, och hoppas att branschen ska inse de många fördelarna med teknologin. Som att slippa skicka fotomodeller över hela världen för en dags plåtning på en paradisstrand. De vill samtidigt utmana just de inbyggda stereotyperna och lära AI mångfald i utseende och identitet. I nummer två av deras fyra centimeter tjocka magasin finns både slät och rynkig hud av olika färg, och kroppar i olika former.

Vi är här för att låta Copy Lab ta fram en AI-genererad omslagsbild på Aftonbladets AI- och innovationschef Martin Schori. Vi har med oss två olika idéer; först ut är Schori som tidningsman i 1950-talets Klarakvarter. Midjourney börjar skapa mängder av olika bilder från Carl-Axel Wahlströms prompt. Det är män med Tolkienlångt blont hår, män på en gata i Prag och framför Stockholms slott, i olika poser och ljus och med skiftande uttryck. Några ser ut att faktiskt befinna sig i 1950-talet, andra verkar höra hemma i en Dressmankampanj från 2023.

Processen startade före jul med att Carl-Axel Wahlström fotade Martin Schori med sin mobil. Bilderna har Copy Lab sedan matat in som träningsdata för att skapa en AI-avatar av Aftonbladetchefen.

Carl-Axel Wahlström fotograferar Martin Schoris ansikte i Schibstedhuset. För att kunna skapa en bra AI-modell gäller det att ta bilder från många olika vinklar, med olika ljus och olika miner. Foto: Tor Johnsson

– Den här träningen kan göras mer eller mindre avancerat. Det kommer ner till tid och energi, hur länge ska en dator processa bilderna, hur detaljerat och snabbt kommer datorn att förstå hur Martin är, säger Carl-Axel Wahlström.

Han förklarar att AI-modellen av Schori motsvarar det skick han var i den dag bilderna togs.

– Modellen blir inte bredare än träningsdatan. Har jag plåtat honom i tillräckligt många olika ljus så kommer modellen ha en mycket större förståelse för att kunna få in avataren i ett historiskt foto i rätt ljussättning. Den behöver inte bara en bild, den behöver olika vinklar, detaljer – hur ser hans hud ut? Hans ögon? Vi dokumenterade honom med ungefär 20-30 bilder.

Elli Ekenlöw, Axel Engström och Carl-Axel Wahlström intervjuas på Copy Labs kontor i centrala Stockholm. De kraftfulla datorerna som används för att skapa bilder med generativ AI alstrar så mycket värme att de knappt behöver någon annan värmekälla på kontoret även denna kalla vinterdag. Foto: Tor Johnsson

Bilderna av 1950-talsmän som programmet Midjourney nu skapar enligt Carl-Axel Wahlströms instruktioner har inte Martin Schoris ansikte: det kommer att göras separat i ett senare skede.

– All AI är i grunden beroende av träningsdata. De stora dataseten som används brett, som Midjourney och ChatGPT, kräver biljoner bilder eller texter och input. Det behövs för att AI ska ha en bred förståelse av världen och vad en människa är. Var sitter ett huvud på en kropp? Den måste förstå upp och ner, höger och vänster, människa, maskin, himmel och hav, säger Carl-Axel Wahlström.

Vi granskar raderna av bilder som Midjourney skapar. Carl-Axel Wahlström markerar dem vi gillar, och programmet jobbar vidare med dem.

Att få fram rätt text är en sak – vi har behövt googla fram vilken typ av hatt vi egentligen är ute efter. Men finns det inte tillräckligt många bilder av det vi söker kan AIn ändå inte skapa det. Att göra en hatt med ordet ”PRESS” instucket i brättet visar sig vara en uppgift som Midjourney går bet på.

Vi går vidare till nästa idé – som ska kom­ma att bli den som hamnar på Jour­nalistens omslag. Ska Martin Schori stå på månen? Ska han sväva? Se glad ut? Allvarlig? Är det okej med den amerikanska flaggan på dräkten? Återigen fylls Carl-Axel Wahlströms skärm av mer och mindre lyckade förslag. Prompttexten justeras tills vi är nöjda.

I nästa steg ska Martin Schoris ansikte in i bilderna. Efter ett första försök där man visserligen kunde se att det var Schori – men mer likt en klon av honom – lät Copy Labs generativa systemdesigner Elli Ekenlöw sin dator träna en hel helg på datan.

– Vi gav AI:n mer tid på sig att lära. Då blev det mycket mer exakt, det blev Martin på riktigt, med alla hans drag, ända ner till hur hans hud är. Det är detaljerna som skapar den riktiga människan, säger Carl-Axel Wahlström.

Copy Lab valde också att ändra detaljer i grundbilden – som att ta bort den amerikanska flaggan på rymddräktens ärm.

– Det var ett viktigt ställningstagande för oss att visa att vi inte sitter i händerna på AI:n. Det är vi som styr. Vi promptade aldrig att vi skulle ha en amerikansk astronaut. Att flaggan fanns där visade bara hur begränsat dataseten är uppbyggda, där USA förknippas med rymden. Men vi kan ta bort det om vi vill, säger Carl-Axel Wahlström.

Att sedan skala upp bilden från 1 000 till 8 000 pixlar var ett tidskrävande hantverk. Sedan kunde Martin Schori till sist sväva i rymden.

Fakta/AI-prompten till omslaget
Swedish astronaut man with blonde hair. Wearing a space suit. He is happy. Floating over the earth. Looking straight into the camera –ar 5:7 –quality 2 –v 6.1

Carl-Axel Wahlström visar Copy Labs modemagasin Copy för Martin Schori. Foto: Tor Johnsson

Fakta/Copy magazine
Modemagasinet Copy, som är helt producerat av generativ AI, har uppmärksammats i internationella medier som Vogue och Business Insider. Magasinet innehåller modeinspirerade AI-bilder. Det första numret kom ut i augusti 2023, det andra 2024. Copy Labs creative director Carl-Axel Wahlström har skapat tiotusentals bilder för att få fram urvalet på de runt 450 AI-genererade modebilderna i det första numret av magasinet, och ännu fler i nummer två.

Omslaget steg för steg

  1. Med hjälp av text, så kallad promptning, skapar Copy Lab en bild i Midjourney. Texten ger grundläggande instruktioner till AI:n om vad bilden ska innehålla. Sedan skapar den generativa AI:n en lågupplöst bild baserad på en enorm mängd bilder med metadata (information om en bilds innehåll samt teknisk data). Anledningen till att generativ AI bygger på lågupplösta bilder är att det krävs enorma mängder datakraft för att tolka bilderna.
  2. Bilden skalas upp åtta gånger och blir högupplöst. Vid uppskalning med generativ AI läggs det till ny information och detaljrikedomen ökar i bilden, till skillnad från traditionell uppskalning då pixlarna bara dupliceras. Sedan läggs Martin Schoris ansikte in i bilden genom den AI-modell som skapats av fotografierna Carl-Axel Wahlström tog av honom i Schibstedhuset.
  3. I det sista steget låter Copy Lab AI:n omtolka bilden i olika delar för att kunna styra processen mer i detalj. Det görs också en del manuell retusch och bildbehandling. Till exempel tas den amerikanska flaggan bort. Den fanns i Midjourney-bilden på grund av en överrepresentation av rymddräkter med USA-flaggor på internet.

Kommentarer

Lämna ett svar

Vi hanterar läsarkommentarer som insändare. Regler för kommentarer.