OpenAI julkisti uuden mallin AI Sora, joka pystyy luomaan jopa minuutin pituisia teräväpiirtovideoita tekstikehotteiden perusteella. Sora, joka tarkoittaa "taivasta" japaniksi, ei tule suuren yleisön saataville lähiaikoina, mutta yritys julkaisee sen pienelle tutkijoille, jotka arvioivat vahingot ja mahdolliset väärinkäytökset.
"Sora pystyy luomaan monimutkaisia kohtauksia, joissa on useita hahmoja, tietyntyyppisiä liikkeitä ja tarkkoja esine- ja taustatietoja", yrityksen verkkosivuilla sanotaan. "Malli ei ymmärrä vain sitä, mitä käyttäjä kysyi kehotteessa, vaan myös kuinka nämä asiat ovat fyysisessä maailmassa."
Yhdessä Soran luomassa videossa näkyy pariskunta kävelemässä lumisessa Tokiossa kirsikankukkien ja lumihiutaleiden ympärillä kiehuvan, kun taas toisessa nähdään realistisen näköisiä villamammutteja kävelemässä lumisella niityllä lumihuippuisten vuorijonojen taustalla.
Esittelyssä Sora, tekstistä videoksi -mallimme.
Sora voi luoda jopa 60 sekunnin pituisia videoita, joissa on erittäin yksityiskohtaisia kohtauksia, monimutkaista kameran liikettä ja useita hahmoja eloisilla tunteilla. https://t.co/7j2JN27M3W
Kehotus: “Kaunis, luminen… kuva.twitter.com/ruTEWn87vf
- OpenAI (@OpenAI) Helmikuu 15, 2024
OpenAI sanoo, että malli toimii "syvällä kielen ymmärtämisellä", jonka avulla se voi tulkita tekstin vihjeitä. Kuten lähes kaikki AI-kuva- ja videogeneraattorit, Sora ei kuitenkaan ole täydellinen. OpenAI varoittaa myös, että mallille voi olla vaikea antaa syy-seuraus - se voi esimerkiksi luoda videon ihmisestä, joka syö keksiä, mutta siinä ei välttämättä näy purentajälkiä.
Sora ei ole ensimmäinen tekstistä videoksi muunnosmalli. Muut yritykset, mukaan lukien Meta, Google ja Runway ovat joko vihjailleet tekstistä videoksi -työkaluihin tai tuoneet ne julkisesti saataville. Mikään muu työkalu ei kuitenkaan tällä hetkellä pysty luomaan 60 sekunnin videota. Sora luo myös kokonaisia videoita kerralla sen sijaan, että kerää niitä kehys kuvalta kuten muut mallit, joten videon kohteet pysyvät ehjinä, vaikka ne väliaikaisesti katoavat näkyvistä.
Kehotus: ”Useat jättimäiset villamammutit lähestyvät kävelemässä lumisella niityllä, heidän pitkä villaturkkinsa puhaltaa kevyesti tuulessa kävellessä, lumiset puut ja dramaattiset lumihuippuiset vuoret kaukana, keskipäivän valossa ohuita pilviä ja aurinko korkealla. etäisyys… kuva.twitter.com/Um5CWI18nS
- OpenAI (@OpenAI) Helmikuu 15, 2024
Tekstistä videoksi -työkalujen tulo on herättänyt huolta niiden mahdollisuudesta luoda helpommin realistisen näköisiä väärennettyjä videoita. Ja yleisemmin generatiivinen tekoäly on aiheuttanut taiteilijoiden ja luovien työntekijöiden vastareaktion, koska he ovat huolissaan siitä, että teknologia voisi mahdollisesti korvata heidät.
OpenAI kertoi työskentelevänsä asiantuntijoiden kanssa sellaisilla aloilla kuin väärä tieto, vihasisältö ja ennakkoluulot testatakseen työkalua ennen sen julkistamista. Yritys kehittää myös työkaluja, jotka voivat tunnistaa Soran luomat videot ja sisällyttää luotuihin videoihin metatietoja, jotta ne olisi helpompi löytää. Yritys kieltäytyi kertomasta, kuinka Sora koulutettiin, mutta sanoi käyttävänsä sekä "julkisia videoita" että oikeudenhaltijoiden lisensoituja videoita.
Lue myös: