Koti mielipiteitä Kuinka ai, ml muuttaa puhe tekstiksi, kielen käännökset | tim bajarin

Kuinka ai, ml muuttaa puhe tekstiksi, kielen käännökset | tim bajarin

Video: The 7 steps of machine learning (Lokakuu 2024)

Video: The 7 steps of machine learning (Lokakuu 2024)
Anonim

Yksi vaikuttavimmista demoista Google I / O: ssa oli Duplex, keinotekoinen älykkyys, joka kutsui toimipaikkoja - tässä tapauksessa kampaamoon ja ravintolaan - varaamaan tapaamisia. Linjan toisessa päässä olevat ihmiset eivät näyttäneet olevan viisaimpia, ja Duplex käsitteli haasteita helposti, kuten kun ravintola sanoi, ettei se hyväksy varauksia pienille juhliin.

Tämä erityinen AI-ilmoitus sai paljon kattavuutta Google I / O: ssa, mutta AI ja koneoppiminen olivat yleisiä kaikissa kehittäjien konferenssissa esitellyissä tuotteissa ja palveluissa. Katso vain tätä kaaviota, jonka Google esitti AI-keskittyneessä analyytikkotapahtumassa päivää ennen I / O: n avaamista.

Oli kaksi muuta asiaa, jotka osoittivat siinä tapahtumassa, että pidän potentiaalisia pelinvaihtajia.

Ensimmäinen tapa on, kuinka AI: tä sovelletaan ääni-teksti-käännökseen. Tavoitteena on saada tämä 99 prosentin tarkkuudella käyttämällä AI: tä ja ML: tä seuraavien vuosien aikana. Demot, joissa he sanoivat kommentteja erilaisiin G-Suite-sovelluksiin, olivat jo aika tarkkoja. Näimme myös perusteellisemman esityksen Smart Compose -sovelluksesta, jossa henkilö kirjoittaa lauseen Gmailissa ja Smart Compose kirjoittaa seuraavan lauseen sinulle ensimmäisen lauseen kontekstin perusteella.

Erilaisia ​​äänentunnistustuotteita, kuten Dragon Dictate, on ollut markkinoilla vuosien ajan. Mutta nämä ohjelmat luottaneet lokalisoituihin ohjelmistoihin ja hyödyntäneet kunkin julkaisun aikaan käytettävissä olevaa nykyistä prosessointitehoa. Nämä ohjelmat paranivat vuosien varrella, mutta jos mainostat AI ja ML, tarkkuusaste varmasti paranee.

Google ymmärtää puhetekstin merkityksen, koska se liittyy jokapäiväiseen elämäämme. Tarkka ääni-teksti-liittymä on kriittinen, kun vastaat viestiin ajon aikana. Se on mielekäs tapa vastata sähköpostiin tai tekstiviestiin puettavissa tai älypuhelimissa. Siitä tulee lopulta arvokas panos, kun käytetään sekoitettuja todellisuuslaseja, joissa äänen käyttäminen osana navigointiprosessia ja ääni-teksti-teksti tarvitaan erityyppisiin AR-sovelluksiin.

Toinen tapa on käyttää AI: tä ja ML: ää Google Translate -palvelussa, joka on aidosti muuttuva, kun käännökset tapahtuvat reaaliajassa. Kansainvälisenä matkustajana, joka puhuu vain englantia, tämäntyyppinen käännös olisi jumalallinen. Jotkut kannettavat laitteet yrittävät kääntää sanomasi paikalliselle kielelle, mutta niillä on tällä hetkellä monia rajoituksia.

Google näkee tämän tyyppiset käännökset, joten on turvallista sanoa, että pian Android-puhelimissa voimme nähdä todellisia läpimurtoja tarkemmassa kieliversiossa. Applella on myös AI- ja ML-tutkimuksia ääni- ja tekstinkääntämisen eri näkökohdista, joten se voisi mahdollisten yhteistyökumppaneiden kanssa toimittaa mobiili kielen käännösratkaisun jonain päivänä iOS: ssä.

AI: llä ja ML: llä on dramaattinen vaikutus äänistä tekstiin kääntämiseen, ja niiden näkyvin vaikutus voi olla osa AR: n ja VR: n käyttöliittymää tai todellisuuden silmälaseja. Henkilökohtaisesti kielen käännökset innoittavat minua eniten, koska se helpottaisi maailmanmatkojani.

Kuinka ai, ml muuttaa puhe tekstiksi, kielen käännökset | tim bajarin