Krönika

Kommentar: Att promptografera fram en AI-bild

På omslaget av senaste numret av Kamera & Bild hittar du en norrskensbild skapad av AI. Juryn för en av världens största fototävlingar väljer ut en AI-bild som kategorivinnare. Hur lätt är det egentligen att bli lurad?

För några år sedan skulle det säkert låtit som science fiction att man talar in sin svenska mening, och ut kommer en japansk textremsa som dessutom läses upp, där essensen av innehållet förmedlas vidare. Oklar från var, men jag minns översättarhjälmen från min ungdom man tog på sig och bara pratade, så kunde man tala hela världens språk.

Nu är vi där, och har dessutom brutit mark inom andra språk – det som bilderna själva talar, eller i varje fall innehåller. För även om all symbolik går förlorad i vad som definierar »en bra bild«, med det som går att utläsa runtomkring bilden som ger den egentliga meningen och innehållet, så kan vi nu med hjälp av artificiell intelligens testa fram en bild. Vi förklarar innehållet – AI:n skapar. Vi har en ny era för visualisering, något som jag skrivit om tidigare.

Eller skapar och skapar, den tar fram en statistisk sannolikhet över vad den tror att jag vill, och presenterar den som en mix av något som redan finns. Därav att just skapandeprocessen är obefintlig hos en AI och istället hamnar hos dig som »författare« eller»promptolog« för den text som skapar bilden i den nya erans fotografi: »promptografi«.

Om omslagsbilden. Är den unik? Knappast. Blev du lurad och trodde det var ett riktigt fotografi? Kanske – men det är den inte.

Nu har även bildtjänsten Midjourney blivit så pass bra att den inte längre gör sex fingrar hos personer, och bilderna ser stundvis också rätt bra ut, lite som överretuscherade reklambilder. Men detta innebär att det inte är långt kvar innan vi når en ljussättning som ser verklig och avancerad ut i likhet med exempelvis Matrix-demot skapat med Unreal Engine 5, med ansikten som inte går att skilja om de är verkliga eller påhittade. Och just ansikten kommer bli den svåraste nöten att knäcka, eftersom vi människor är känsliga för hur ansikten ser ut.

Omslagsbilden för senaste Kamera Bild skapadesgenom att mata in orden för »norrsken i det norska landskapet med reflektioner över vattnet« i Midjourney – och så skapades denna bild. Men är den unik?

Knappast. Googla samma text så får du direkt över 15 000 sökresultat.Men den mest spännande frågan är nog ändå: trodde du det var ett fotografi.

Tillgängligheten har dessutom ökat ytterligare sedan Adobe släppte sin betaversion av Firefly – deras AI-baserade verktyg för att skapa bilder genom text.Du kan läsa mer om det här,men Kamera Bild tog även upp detta till diskussion under Stockholms Fotodag när vi fick tillgång till programvaran, som du kan se i klippet här nedan.

Adobe Firefly kommer så klart att öppna upp för gemene man att kunna skapa bilder på ett helt annat sätt än innan – och dessutom göra det på ett relativt enkelt vis utan att man behöver ha någon större kunskap kring hur det fungerar – i ett lättanvänt gränssnitt.

Det är nämligen ditåt vi är på väg. Titta exempelvis påBoris Eldagsens vinnarbild i kategorin "Creative" i årets version av Sony World Photography Awards. Där tävlade han med sin bild "Pseudomnesia: The Electrician" och lyckades kamma hem priset som kategorivinnare.

Eldsagens vinnarbild (vänster).

Enligt honom ville han ha en diskussion kring AI-genererade bilder, något han själv säger sig ha öppnat upp för i sin kommunikation med Sony World Photography Awards där han även nämnt att AI använts – en diskussion och debatt som alltså inte blev av. Eldagsen själv avsade sig priset under prisutdelningen i London varvid bilden diskvalificerades och försvann från både vinnare, på sajten för tävlingen och utställningen i Somerset House.

Under Sony World Photography Awards 2019 var även Kamera Bild först med att rapportera om att tävlingen tillät bildmanipulation, något som kom som en nyhet för många. Men det som var kanske mest intressant var att bildmanipulation var tillåtet även i den dokumentära kategorin – den kategori vars existens handlar om att återspegla verklighetens skeenden och händelser i sin mest äkta form.Det innebär också att de bilder som visas upp i samband med tävlingen samt tävlingens vinnarbilder kan vara manipulerade – även i kategorierna natur eller dokumentär.

Det var 2019. Nu 2023 finns Eldagsens vinnarbild kvar som vinnar i tryckt form. Den bok med vinnarbider som delades ut var så klart omöjlig att göra om. Men här fortsätter även diskussionen om artificiellt skapade bilder. Problemet är så klart att denna problematik inte tagits upp till diskussion tidigare. Och i en av världens största fototävlingar föll man handlöst och hårt i ett platt fall – oventandes av dess konsekvenser.

Förvisso uppmuntrar en tävlan i kategorin "Creative" till nya vägar inom fotografin, men trots detta nämns inte AI-genererade bilder. Och dessa bilder är så klart här för att stanna, utvecklas och bli än mer svåra att upptäcka. Med förfinad teknik och förbättrade prompthantering kommer vi bli mer och mer lurad, deepfake:ad och stå som frågetecken när de källkritiska frågorna kommer på tal:

Är bilden äkta, och hur kan vi verifiera detta?

För vissa är det omöjligt att se om en bild är AI-genererad. För vissa är det mycket lätt. Utvecklingen har också gått i rasande takt – under 2020 rapporterade Kamera Bild om text-till-bild i artikeln "AI skapar nya fotorealistiska bilder från textmeningar" med texter som "giraff som går på fält" och "barn som spelar fotboll" som då kunde tolkas av en AI – som själv genererar bilden med rätt innehåll.

Otroligt. Tyckte vi då.

Men en sak är säker: för den stora massan kommer det bara bli svårare att se om en bild är från ett äkta skeende eller inte.

Här kan du läsa fler artiklar om AI och foto.