Annons

Krönika

Kommentar: Att promptografera fram en AI-bild

På omslaget av senaste numret av Kamera & Bild hittar du en norrskensbild skapad av AI. Juryn för en av världens största fototävlingar väljer ut en AI-bild som kategorivinnare. Hur lätt är det egentligen att bli lurad?

För några år sedan skulle det säkert låtit som science fiction att man talar in sin svenska mening, och ut kommer en japansk textremsa som dessutom läses upp, där essensen av innehållet förmedlas vidare. Oklar från var, men jag minns översättarhjälmen från min ungdom man tog på sig och bara pratade, så kunde man tala hela världens språk.

Nu är vi där, och har dessutom brutit mark inom andra språk – det som bilderna själva talar, eller i varje fall innehåller. För även om all symbolik går förlorad i vad som definierar »en bra bild«, med det som går att utläsa runtomkring bilden som ger den egentliga meningen och innehållet, så kan vi nu med hjälp av artificiell intelligens testa fram en bild. Vi förklarar innehållet – AI:n skapar. Vi har en ny era för visualisering, något som jag skrivit om tidigare.

Eller skapar och skapar, den tar fram en statistisk sannolikhet över vad den tror att jag vill, och presenterar den som en mix av något som redan finns. Därav att just skapandeprocessen är obefintlig hos en AI och istället hamnar hos dig som »författare« eller»promptolog« för den text som skapar bilden i den nya erans fotografi: »promptografi«.

Om omslagsbilden. Är den unik? Knappast. Blev du lurad och trodde det var ett riktigt fotografi? Kanske – men det är den inte.
Om omslagsbilden. Är den unik? Knappast. Blev du lurad och trodde det var ett riktigt fotografi? Kanske – men det är den inte.

Nu har även bildtjänsten Midjourney blivit så pass bra att den inte längre gör sex fingrar hos personer, och bilderna ser stundvis också rätt bra ut, lite som överretuscherade reklambilder. Men detta innebär att det inte är långt kvar innan vi når en ljussättning som ser verklig och avancerad ut i likhet med exempelvis Matrix-demot skapat med Unreal Engine 5, med ansikten som inte går att skilja om de är verkliga eller påhittade. Och just ansikten kommer bli den svåraste nöten att knäcka, eftersom vi människor är känsliga för hur ansikten ser ut.

Omslagsbilden för senaste Kamera Bild skapadesgenom att mata in orden för »norrsken i det norska landskapet med reflektioner över vattnet« i Midjourney – och så skapades denna bild. Men är den unik?

Knappast. Googla samma text så får du direkt över 15 000 sökresultat.Men den mest spännande frågan är nog ändå: trodde du det var ett fotografi.

Tillgängligheten har dessutom ökat ytterligare sedan Adobe släppte sin betaversion av Firefly – deras AI-baserade verktyg för att skapa bilder genom text.Du kan läsa mer om det här,men Kamera Bild tog även upp detta till diskussion under Stockholms Fotodag när vi fick tillgång till programvaran, som du kan se i klippet här nedan.

Adobe Firefly kommer så klart att öppna upp för gemene man att kunna skapa bilder på ett helt annat sätt än innan – och dessutom göra det på ett relativt enkelt vis utan att man behöver ha någon större kunskap kring hur det fungerar – i ett lättanvänt gränssnitt.