Meta on luonut uuden tekoälyyn perustuvan generaattorin

Tekoälyn (AI) tekstistä kuvaksi generaattorit ovat nousseet otsikoihin viime kuukausina, mutta tutkijat ovat jo siirtyneet seuraavalle rajalle: tekoälyllä toimivat tekstistä videoksi generaattorit. Meta-tutkijat ovat julkisesti esitelleet tällaisen uuden generaattorin, The Verge raportoi.

Metan koneoppimisen suunnittelutiimi esitetty uusi järjestelmä nimeltä Make-A-Video. Tämän tekoälymallin avulla käyttäjät voivat syöttää karkean kuvauksen kohtauksesta, ja se luo lyhyen videon, joka vastaa heidän tekstiään. Videot ovat selvästi keinotekoisia, niissä on epäselviä objekteja ja vääristyneitä animaatioita, mutta ne ovat silti merkittävä saavutus tekoälyn sisällöntuotannon alalla.

- Mainos -

Viestissään aiheesta Facebook Metan toimitusjohtaja Mark Zuckerberg kuvaili työtä "hämmästyttäväksi edistykseksi" ja lisäsi: "Videoa on paljon vaikeampi luoda kuin valokuvia, koska kunkin pikselin oikean luomisen lisäksi järjestelmän on myös ennakoitava, kuinka ne muuttuvat ajan myötä."

Leikkeet kestävät enintään viisi sekuntia eivätkä sisällä ääntä, mutta ne kattavat valtavan valikoiman vihjeitä. Vaikka on selvää, että video on tietokoneella luotu, tällaisten tekoälymallien laatu paranee nopeasti lähitulevaisuudessa. Vain muutamassa vuodessa tekoälykuvageneraattorit ovat siirtyneet lähes käsittämättömistä kuvista fotorealistiseen sisältöön. Ja vaikka videon edistyminen saattaa olla hitaampaa aihealueen lähes rajattoman monimutkaisuuden vuoksi, saumattoman videon luomisen palkinto motivoi monia organisaatioita ja yrityksiä investoimaan merkittäviä resursseja projektiin.

Yhtiö sanoo aikovansa julkaista demoversion järjestelmästä, mutta ei ole kertonut milloin tai miten se otetaan käyttöön. Mallia kuvaavassa paperissa Meta-tutkijat huomauttavat, että Make-A-Video on koulutettu kuva-tekstipareista sekä leimaamattomista videomateriaalista.

Koulutussisältö on johdettu kahdesta tietojoukosta, WebVid-10M ja HD-VILA-100M, jotka yhdessä sisältävät miljoonia videoita ja kattavat satoja tuhansia tunteja videomateriaalia. Tämä muuten sisältää arkistomateriaalia.

Tutkijat huomauttavat, että mallilla on monia teknisiä rajoituksia epäselvien kehysten ja hajallaan olevien animaatioiden lisäksi. Make-A-Video tuottaa 16 ruutua videota 64 × 64 pikselin resoluutiolla, joiden koko muutetaan sitten erillisellä AI-mallilla 768 × 768 pikseliin.

Voit auttaa Ukrainaa taistelemaan venäläisiä hyökkääjiä vastaan. Paras tapa tehdä tämä on lahjoittaa varoja Ukrainan asevoimille Pelasta elämä tai virallisen sivun kautta NBU.

- Mainos -

Mielenkiintoista myös:

Meta näytti tekoälyä videoiden luomiseen kuvauksen perusteella