Koti mielipiteitä Äänikääntämisen pyhä graali, nyt skype | john c. Dvorak

Äänikääntämisen pyhä graali, nyt skype | john c. Dvorak

Video: How America Bungled the Plague | NYT Opinion (Marraskuu 2024)

Video: How America Bungled the Plague | NYT Opinion (Marraskuu 2024)
Anonim

Jos seuraisit tietokonevallankumousta mikroprosessorin alusta lähtien, tiedät, että olemassa on useita varhaisia ​​lupauksia, jotka on vielä täytettävä.

Yksi näistä on lennossa käännetty puhe, jossa sanot jotain englanniksi ja se toistetaan toisella kielellä, kuten espanja, lähes reaaliajassa. Vaikka Microsoft on edelleen keskeneräinen työ, se on nyt askeleen lähempänä Skype Translator -sovelluksen kanssa, jonka ensimmäinen vaihe käynnistyi tällä viikolla.

Jos tämä on lähellä työskentelyä eikä ole vitsi, se on vuosikymmenen tuote. Tällä hetkellä Skype Translator tukee käännöksiä espanjasta englanniksi ja englannista ranskaksi, mutta lisää kieliä on tarkoitus seurata.

Tyypillinen ongelma tällaisissa asioissa on törkeä vaikeustaso. Minun ei ole vielä nähnyt kunnollista käännöspakettia, joka tekee tekstistä tekstiin-käännöksiä, jotka toimivat hyvin. Puheen kääntämisellä on aivan erilainen vaikeustaso, etenkin reaaliajassa.

Microsoftilla on elokuva, jossa näytetään kaksi lasta, jotka puhuvat espanjaa ja englantia, minkä vuoksi se näyttää hyvältä. Mutta näin samanlaisen järjestelmän, jonka IBM osoitti melkein 20 vuotta sitten, joka ei koskaan nähnyt päivänvaloa. IBM: n versio kehitettiin 1990-luvulla, kun siellä oli puheentunnistusmania, jota johti Lernout & Hauspie, yritys, joka meni murtumaan - ennen kuin meni läpi petoskandaalin vuonna 2001. Ennen sitä se kuitenkin osti jokaisen puhetekniikan. yritys, johon se voisi kuulua, mukaan lukien Dragon Systems, Berkeley Speech Technologies, Fonix, Dictaphone ja muut. Microsoftilla oli 8 prosentin omistusosuus L&H: sta, ja se päätyi eräisiin tekniikoihin konkurssin erottamiseen.

Nyt Skype Translator ilmestyy yhtäkkiä. Yhteensattuma? Joka tapauksessa tämä koko tekniikka on vienyt liian kauan päästäkseen tähän pisteeseen.

Katso Googlen ja muiden tekemiä onnettomia teksti-tekstitietokoneen käännöksiä. Teksti ei estä eikä voi välttää ilmeisimpiä virheitä. Mikään näistä ei lähestyy puheen kääntämisen monimutkaisuutta, mikä merkitsee voimakasta signaalinkäsittelyä.

Olen viinin keräilijä ja käyn usein ranskalaisten viinitila-verkkosivustoilla. Ranskan kieleni on vain kunnossa, joten käännän käännöksen usein sivuston lukemisen nopeuttamiseksi. Täällä olemme vuonna 2014, eikä kukaan kääntäjistä ymmärrä, että Château Margaux'n käännös on Château Margaux, ei Linna Margaux. Kuinka vaikeaa on pidättäytyä kieltämättä kääntämästä oikeassa nimessä käytettyä yleisesti käytettyä sanaa, kuten château, joka viittaa yleensä tiettyyn viinitilaan, sanaan linna? Ilmeisesti se on mahdotonta. He kaikki tekevät sen.

Kuinka vaikeaa on kirjoittaa jotain poikkeusta koodiin, joka kertoo kääntäjälle, että se on verkkosivustolla Bordeaux-viinistä? Tällä sivustolla sana château ei tarkoita linnaa. Usein kääntäjä yrittää dekoodata myös muun château-nimen, naurettavilla tuloksilla. Paras mitä voit yleensä tehdä tekstinkääntämisellä, on saada tietoa sivuston sanoista.

Kysy itseltäsi: jos teksti on niin vaikeaa, miten Microsoft hallitsee puhetta?

Se on lähes mahdotonta edes samalla kielellä. Ota Google Voice -puhelinpalvelu. Siinä on puhe-tekstiviestien ottamistoiminto. En ole koskaan saanut ääni-tekstiviestiä, joka edes lähestyy sitä, mitä ihminen todella sanoi. Ei kertaakaan.

Myönnän, että hiljaisessa huoneessa, kun puhut selvästi ja selvästi, äänentunnistus toimii hyvin. Käytän sitä tekstiviesteihin Android-puhelimellani. Mutta oikeassa keskustelussa kukaan ei puhu sellaisella tavalla. Ihailen Microsoftia tämän toteuttamisessa. Mutta se ei toimi ilmoitetulla tavalla.

Se sanoi, että on ainakin jotain leikkiä. Se saattaa jopa käynnistää uuden sukupolven tutkimuksen. Joten en valita liikaa.

Kaikki haluavat tämän. Palataan takaisin työskentelemään sen kanssa.

Äänikääntämisen pyhä graali, nyt skype | john c. Dvorak