Google tekee zoomauksesta ja kuvien parantamisesta todellisuutta

Olet luultavasti nähnyt fantasiaelokuvia tai TV-ohjelmia, joissa päähenkilö pyytää suurentamaan kuvaa ja parantamaan tulosta – näyttämään kasvot, rekisterikilven tai minkä tahansa muun keskeisen yksityiskohdan. Googlen uusimmat tekoälyjärjestelmät, jotka perustuvat ns diffuusiomallit, pystyvät suorittamaan tämän tempun.

Prosessi on hankala hallita, koska se lähinnä lisää yksityiskohtia kuvaan, jota kamera ei alun perin ottanut, käyttämällä superälykkäitä arvauksia, jotka perustuvat muihin samankaltaisiin kuviin.

Google

Googlella tätä tekniikkaa kutsutaan luonnolliseksi kuvasynteesiksi ja tässä skenaariossa erittäin korkeaksi kuvan resoluutioksi. Aloitat pienellä, pikselöidyllä valokuvalla ja päädyt jotain terävää, selkeää ja luonnollista. Se ei ehkä ole aivan alkuperäinen, mutta se on tarpeeksi lähellä näyttääkseen todelliselta ihmissilmälle.

Google on tuonut tähän työhön käyttöön kaksi uutta tekoälytyökalua. Ensimmäinen on nimeltään SR3 tai Super-Resolution via Repeated Refinement, ja se toimii lisäämällä kohinaa kuvaan ja poistamalla sen sitten. SR3 voi kuvitella, miltä matalaresoluutioisen pikselikuvan superkorkearesoluutioinen versio näyttää useiden todennäköisyyslaskentojen avulla, jotka perustuvat suureen kuvatietokantaan ja johonkin koneoppimistaikaan.

Toinen työkalu on CDM tai Cascaded Diffusion Models. Google kuvailee niitä "putkiksi", joita pitkin diffuusiomalleja – mukaan lukien SR3 – voidaan ohjata laadukkaaseen kuvan parannusta varten. Se ottaa parannusmalleja ja tekee niistä suurempia kuvia.

Google

Käyttämällä erilaisia parannusmalleja eri resoluutioilla, CDM-lähestymistapa voi Googlen mukaan ylittää vaihtoehtoiset kuvan parannusmenetelmät. Uusi tekoälymoottori testattiin ImageNetissä, jättimäisessä koulutuskuvien tietokannassa, jota käytetään yleisesti visuaalisten objektien tunnistustutkimuksessa.

SR3:n ja CDM:n lopputulokset ovat vaikuttavia. Standarditestissä, jossa oli mukana 50 vapaaehtoista ihmistä, SR3:n luomat kuvat ihmiskasvoista erehtyivät noin 50 % ajasta todellisiin valokuviin – ja kun otetaan huomioon, että ihanteellisen algoritmin pitäisi saavuttaa 50 %, se on vaikuttavaa. On syytä toistaa, että nämä parannetut kuvat eivät täsmää alkuperäisten kanssa, ne ovat huolellisesti laskettuja simulaatioita, jotka perustuvat todennäköisyysmatematiikkaan.

Google

Google lupaa paljon enemmän uusista tekoälymoottoreistaan ja niihin liittyvistä teknologioistaan – ei vain kasvojen ja muiden luonnonobjektien kuvien lisäämisen suhteen, vaan myös muilla todennäköisyyspohjaisen mallintamisen aloilla.

Lue myös:

Dzherelotieteellinen ilmoitus

Kirjaudu

0 Kommentit

Upotetut arvostelut

Näytä kaikki kommentit

Muut artikkelit

Kuten elokuvissa: Googlen uusi valokuvien käsittelyä käyttävä tekoäly tekee kuvien skaalauksesta ja parantamisesta todellisuutta

Viimeaikaiset kommentit