Root NationUutisetIT-uutisiaOpenAI:n Sora AI -malli luo minuutin mittaisia ​​videoita tekstikehotteista

OpenAI:n Sora AI -malli luo minuutin mittaisia ​​videoita tekstikehotteista

-

OpenAI julkisti uuden mallin AI Sora, joka pystyy luomaan jopa minuutin pituisia teräväpiirtovideoita tekstikehotteiden perusteella. Sora, joka tarkoittaa "taivasta" japaniksi, ei tule suuren yleisön saataville lähiaikoina, mutta yritys julkaisee sen pienelle tutkijoille, jotka arvioivat vahingot ja mahdolliset väärinkäytökset.

OpenAI

"Sora pystyy luomaan monimutkaisia ​​kohtauksia, joissa on useita hahmoja, tietyntyyppisiä liikkeitä ja tarkkoja esine- ja taustatietoja", yrityksen verkkosivuilla sanotaan. "Malli ei ymmärrä vain sitä, mitä käyttäjä kysyi kehotteessa, vaan myös kuinka nämä asiat ovat fyysisessä maailmassa."

Yhdessä Soran luomassa videossa näkyy pariskunta kävelemässä lumisessa Tokiossa kirsikankukkien ja lumihiutaleiden ympärillä kiehuvan, kun taas toisessa nähdään realistisen näköisiä villamammutteja kävelemässä lumisella niityllä lumihuippuisten vuorijonojen taustalla.

OpenAI sanoo, että malli toimii "syvällä kielen ymmärtämisellä", jonka avulla se voi tulkita tekstin vihjeitä. Kuten lähes kaikki AI-kuva- ja videogeneraattorit, Sora ei kuitenkaan ole täydellinen. OpenAI varoittaa myös, että mallille voi olla vaikea antaa syy-seuraus - se voi esimerkiksi luoda videon ihmisestä, joka syö keksiä, mutta siinä ei välttämättä näy purentajälkiä.

Sora ei ole ensimmäinen tekstistä videoksi muunnosmalli. Muut yritykset, mukaan lukien Meta, Google ja Runway ovat joko vihjailleet tekstistä videoksi -työkaluihin tai tuoneet ne julkisesti saataville. Mikään muu työkalu ei kuitenkaan tällä hetkellä pysty luomaan 60 sekunnin videota. Sora luo myös kokonaisia ​​videoita kerralla sen sijaan, että kerää niitä kehys kuvalta kuten muut mallit, joten videon kohteet pysyvät ehjinä, vaikka ne väliaikaisesti katoavat näkyvistä.

Tekstistä videoksi -työkalujen tulo on herättänyt huolta niiden mahdollisuudesta luoda helpommin realistisen näköisiä väärennettyjä videoita. Ja yleisemmin generatiivinen tekoäly on aiheuttanut taiteilijoiden ja luovien työntekijöiden vastareaktion, koska he ovat huolissaan siitä, että teknologia voisi mahdollisesti korvata heidät.

OpenAI kertoi työskentelevänsä asiantuntijoiden kanssa sellaisilla aloilla kuin väärä tieto, vihasisältö ja ennakkoluulot testatakseen työkalua ennen sen julkistamista. Yritys kehittää myös työkaluja, jotka voivat tunnistaa Soran luomat videot ja sisällyttää luotuihin videoihin metatietoja, jotta ne olisi helpompi löytää. Yritys kieltäytyi kertomasta, kuinka Sora koulutettiin, mutta sanoi käyttävänsä sekä "julkisia videoita" että oikeudenhaltijoiden lisensoituja videoita.

Lue myös:

DzhereloEngadget
Kirjaudu
Ilmoita asiasta
vieras

0 Kommentit
Upotetut arvostelut
Näytä kaikki kommentit