I sidste uge annoncerede Google Imagen Video – en tekst-til-video-AI, der er i stand til at skabe 1280×768-videoer med 24 billeder i sekundet ud fra en skriftlig prompt.
Det oplyser Ars Technica.
I øjeblikket er den fortsat i en forskningsfase, men dens fremkomst bare fem måneder efter storebroren Google Imagen peger på en hurtig udvikling.
Blot seks måneder efter lanceringen af OpenAI’s DALLE-2 tekst-til-billede-generator er fremskridtene inden for AI-diffusionsmodeller stormet derudad. Googles Imagen Video-annoncering kommer mindre end en uge efter, at Meta afslørede sit tekst-til-video-AI-værktøj, Make-A-Video.
Ifølge Googles forskningsartikel består Imagen Video af adskillige stilistiske evner, såsom at generere videoer baseret på berømte maleres arbejde, generere 3D-roterende objekter samt gengivelse af tekst i en række forskellige animationsstile. Google håber på, at AI-skabte videoer på sigt kan bidrage til at reducere vanskeligheden ved generering af videoindhold af høj kvalitet.