Společnost Meta představila systém umělé inteligence s názvem Make-A-Video, který generuje videa pouze na základě textových pokynů. Výsledky jsou působivé a rozmanité, ale i mírně děsivé. Informoval o tom server TechCrunch.
S modely převodu textu na obrázek jsme se setkali již dříve, například u DALL-E nebo Stable Diffusion. Převedení textu na video je velký pokrok jak v implementaci modelu strojového učení, tak v obecné užitečnosti generovaného obsahu.
Meta’s Make-A-Video AI achieves a new, nightmarish state of the art https://t.co/w5CVavv2xd | by Devin Coldewey
— TechCrunch (@TechCrunch) September 29, 2022
Make-A-Video vám umožní zadat řetězec slov, například „Pes v kostýmu superhrdiny s červeným pláštěm letící po obloze“, a poté vygeneruje pětisekundový klip, který je sice docela přesný, ale vzhledově vypadá jako staré domácí video.
Klíčovou technologií, která stojí za Make-A-Vide a proč se objevila dříve, než někteří odborníci předpokládali, je to, že navazuje na stávající práci se převedení textu na obraz. Tu používají generátory obrázků jako již výše zmíněný DALL-E od společnosti OpenAI.
Společnost Meta uznává, že možnost vytvářet fotorealistická videa na vyžádání představuje určitá sociální rizika. Proto veškerý videoobsah vytvořený umělou inteligencí od Make-A-Video obsahuje vodoznak, který upozorní, že se nejedná o pravé video. Aby také výzkumný tým předešel případným nekalým praktikám, preventivně vymazal z tréninkových dat jakékoliv pornografické či nenávistné data.
Jak uvedl server TechCrunch, vygenerovaná videa vypadají zároveň dobře a špatně. Kvalita pohybu je podivná, jako by šlo o stop-motion film. Chyby a artefakty dodávají každému videu surrealistický dojem. Lidé se prolínají jeden do druhého – není zde pochopení pro hranice objektů ani pro to, v čem by mělo něco končit nebo se dotýkat.
Projekt bude mít otevřený zdrojový kód
Stejně jako většina ostatních výzkumů umělé inteligence společnosti Meta bude i Make-a-Video projekt s otevřeným zdrojovým kódem. „Otevřeně sdílíme tento výzkum generativní AI a jeho výsledky s komunitou, aby nám poskytla zpětnou vazbu“ poznamenal Zuckerberg.
Společnost Marka Zuckerberga však neoznámila, kdy se tak stane. Existuje již ale registrační formulář, který mohou lidé vyplnit, pokud budou chtít Make-A-Video v budoucnu vyzkoušet.