Nyhet

AI skapar nya fotorealistiska bilder från textmeningar

Texten "giraff som går på fält" och "barn som spelar fotboll" kan nu tolkas av en AI – som själv genererar bilden med rätt innehåll.

Seattlebaserade Allen Institute for AI, grundat av Microsoft-grundaren Paul Allen, har tagit ett steg framåt när det gäller AI som klarar av att tolka meningar av text och sedan kunna skapa fotografiska bilder som presenterar textens innehåll.

Forskningen banar väg för en mer utvecklad AI som kan hantera mer avancerade tekniker för att länka samman olika objekt och hur dessa objekt förhåller sig till varandra. AI-algoritmerna har tränats genom maskininlärning, och matats med textbaserad information för att kunna koppla dessa till bilder.

Här har AI:n bland annat tolkat 'ett torn målat i mitten av en stad' och skapat en bild av detta.
Här har AI:n bland annat tolkat "ett torn målat i mitten av en stad" och skapat en bild av detta.
AI:n tolkar bildtexter.
AI:n tolkar bildtexter.

Inmatningen bestod av en icke-komplett bildtext där AI:n själv skulle fylla i det som fattades, och lärde sig på så vis att hitta återkommande mönster kopplade mellan bild och text.

Även om det är en bit kvar för AI-algoritmerna att skapa bilder som är rent fotografiskt kvalitativa, så är detta en bit på vägen för att översätta text till bild, något som i framtiden skulle kunna beskrivas som "promptografering" eller "promptografi", då man blandar både textinmatning och visuell struktur för att skapa en slutlig bild med tidigare nämnda mönster.