Annons

AI & generativ ai

OpenAI släpper GPT-4o – kan beskriva bilder & video i realtid

Foto: OpenAI

Möjliggör interaktion och översättning av rörligt material, ljud, text och bilder utan fördröjning.

Calle Rosenqvist ^{CALLE@KAMERABILD.SE}

Publicerad 14 maj 2024 kl 09.14

Annons

OpenAI som är företaget bakom ChatGPT har nu presenterat en förbättrad version av sin AI och språkmodell: GPT-4o, där “o” står för “omni”). Genom GPT-4o kan modellen använda sig av all information i alla steg av analys, till skillnad från tidigare där olika undermodeller användes.

Resultatet blir mer naturligt och kan även kombinera indata i form av video, ljud, bilder och text för att även generera en kombination av text, ljud och bilder med en fördröjning så kort som 232 millisekunder och med ett genomsnitt av 320 millisekunder – alltså ungefär motsvarigheten till en människas reaktionstid när det gäller samtal.

Annons

På sidan för GPT-4o går det att se mer av vad modellerna klarar av, med bland annat två GPT-4o som interagerar med varandra, beskriver omgivningen från en videoström via en mobiltelefon samt sjunger tillsammans.

OpenAI släppte i februari sin modell "Sora" med möjlighet att skapa hyperrealistisk AI-video från text. Läs mer om detta här. Problematiken med att se skillnad mellan vad som är ett foto och en AI-bild ökar också, något som förslaget "AI Act" ska försöka råda bot på – där rn av flera regler är att AI-genererade bilder måste märkas när de skapas.

LÄS ÄVEN

ai openai generativ ai chatgpt

James Webb-teleskopet avbildar planet från annat solsystem

Gasplaneten Epsilon Indi Ab som ligger 12 ljusår bort har fångats på bild av James Webb-teleskopet.

Högupplösta bilder via Google Messages kan snart bli verklighet

Om du skickar bilder från din Android-telefon komprimeras de hårt – något som nu kan förändras, med möjlighet till att skicka bilder i 60 megapixlar via RCS och Google Messages.

OpenAI släpper GPT-4o – kan beskriva bilder & video i realtid

Möjliggör interaktion och översättning av rörligt material, ljud, text och bilder utan fördröjning.

AI-funktioner för Qnap NAS: Hitta bland dina bilder via textprompt

Sista dagen att hindra Facebook att använda dina bilder för AI-träning

LÄS ÄVEN

AI-funktioner för Qnap NAS: Hitta bland dina bilder via textprompt

Sista dagen att hindra Facebook att använda dina bilder för AI-träning

Tävling: "AI-bild eller fotografi?" – kolla om du kan se skillnaden

Detta krävs för att få upphovsrätt på AI-genererade bilder

Fotograf diskvalificerad – vann AI-kategori med äkta fotografi

Efter kritiken: Adobe uppdaterar användarvillkor för AI & integritet

James Webb-teleskopet avbildar planet från annat solsystem

Högupplösta bilder via Google Messages kan snart bli verklighet

MEST LÄST JUST NU

Fotografera på badstrand – här kan du läsa vad som gäller

Så förklarar Canon hemliga detaljen på nya Canon EOS R1

Fyra områden med fotoförbud – annars fritt fram

Vi testar nya Canon EOS R1 & EOS R5 Mark II – så bra är de

Canon EOS R5 Mark II – högupplöst för hybridfotografen

Iphone 17 kan få mekanisk bländare för bättre porträttbilder

Iphone 17 kan få mekanisk bländare för bättre porträttbilder

Sony PDT-FP1 5G börjar säljas i Sverige – ger snabb dataöverföring

Så förklarar Canon hemliga detaljen på nya Canon EOS R1

Nikon släpper Nikon Imaging Cloud – länkar kameran mot molnet

DJI SDR Transmission kan skicka trådlös bild i 1080/60p

Fotografera på badstrand – här kan du läsa vad som gäller

Ny 3D-röntgen ger bilder som förbättrar batterier

Vi testar nya Canon EOS R1 & EOS R5 Mark II – så bra är de

Canon EOS R1 – läs allt om Canons nya flaggskeppskamera för sport

Canon EOS R5 Mark II – högupplöst för hybridfotografen

Polaroid Now Generation 2 Eames Edition – ny specialutgåva

Anders Wånell: "Diaprojektorn eller 55-tumsteven"

AI-funktioner för Qnap NAS: Hitta bland dina bilder via textprompt

De är Hasselbladstiftelsens fotostipendiater 2024

Sony ZV-E10 II – enklare streaming & bättre autofokusfunktioner

Canon EOS R System Live Event 17 juli – nya prylar på väg?

Niclas Ahlberg: »Undvik FOMO & satsa istället på dina egna bilder«

Profoto släpper Hard Reflectors White – för riktat mjukare ljus

Att köpa & sälja begagnad kamera eller fotoprylar – tänk på detta

Sony släpper ny vloggvänlig ZV-kamera 10 juli

Maria Hedlunds "Någon sorts kunskap" i The Flow of Everything

Leica D-Lux 8 börjar säljas – lagrar bilder i råformatet DNG

AI hos Meta – ny integritetspolicy från 26 juni samlar in dina bilder

Sony avslöjar 8K-sensor med global slutare på 16 megapixlar

Zhiyun Smooth 5S AI – kompakt gimbal med motivspårning

HD: "Beslag av minneskort stred mot yttrandefrihetsgrundlagen

Fujifilm släpper firmware: Reala ACE till X-H2S, X-H2, X-T5 & X-S20

Hasselblad Masters 2023 avgjord: De är de sex vinnarna

Nikon Nikkor Z 35MM F/1,4 – första Z-objektivet med bländare 1,4

Sista dagen att hindra Facebook att använda dina bilder för AI-träning

TEST: Dockcase Studio Smart USB-C Hub – är verkligen smart

Meta raderade vårt inlägg om Instagram-utmanaren BeReal

Tävling: "AI-bild eller fotografi?" – kolla om du kan se skillnaden

Svenska Mästerskapet i Fotografi 2024: Tävla senast sista juni

Lennart Nilsson Award 2024 tilldelas neurobiologen Csaba Adori

Fotograf fick fängelse – gick över staket för att fotografera gejser