Yhtiö Microsoft esitteli tekoälyjärjestelmän nimeltä Speller100, joka korjaa oikeinkirjoituksen yli 100 Bing-hauissa käytetyllä kielellä.
"Uskomme, että Speller100 on kattavin oikeinkirjoituksen korjausjärjestelmä, joka on koskaan luotu kielen kattavuuden ja tarkkuuden suhteen", yritys sanoi blogiviestissä.
Aiemmin Bing tarjosi laadukkaita oikeinkirjoituksen korjauksia noin kahdelle tusinalle kielelle. Järjestelmällä ei kuitenkaan ollut tarpeeksi harjoitusdataa toimiakseen hyvin kielillä, joilla oli vain vähän läsnäoloa verkossa ja rajoitettu käyttäjien palaute.
Speller100-järjestelmä voittaa nämä rajoitukset etsimällä yhtäläisyyksiä suurista kieliperheistä. Se koskee myös "zero shot -koulutusta" (ZSL - nolla-ammuttu oppiminen) korjataksesi virheet ilman lisäharjoitustietojen tarvetta.
Microsoft selittää
Microsoft sanoi luoneensa noin tusina kieliperhemallia maksimoidakseen "nollaoppimisen" edut:
Kuvittele, että joku opetti sinut kirjoittamaan englanniksi, ja sinä opit automaattisesti myös saksaksi, hollanniksi, afrikaansiksi, skottiksi ja luxemburgiksi. Nämä ovat ominaisuuksia, jotka "nolla-oppiminen" antaa meille, ja se on Speller100:n avainkomponentti, jonka avulla voimme skaalata kieliä, joilla on hyvin vähän tai ei lainkaan dataa.
Järjestelmä vähentää myös ihmisten luomien huomautusten tarvetta poimimalla tekstiä verkkosivuilta yleisten virheiden luomiseksi.
"Tällainen teksti voidaan helposti poimia Internetistä skannaamalla, ja se riittää satojen kielten opettamiseen", sanoi Microsoft.
Verkkotestauksen jälkeen yritys raportoi seuraavat tulokset:
- Tulottomia sivuja on vähennetty 30 prosenttiin.
- Niiden tapausten määrä, joissa käyttäjien oli muotoiltava uudelleen kyselynsä manuaalisesti, väheni 5 %.
- Oikeinkirjoitusehdotusten käyttäjien napsautusten määrä kasvoi yksinumeroisesta 67 prosenttiin.
- Sivun minkä tahansa elementin käyttäjien napsautusten määrä kasvoi yksinumeroisesta 70 prosenttiin.
Microsoft sanoi, että Speller100-järjestelmän integrointi Bingiin on vasta ensimmäinen askel. Yhtiö aikoo lisätä teknologian "moniin muihin" tuotteisiinsa lähitulevaisuudessa.
Lue myös: