Sisällysluettelo:
- Mitä eroa on tekoälyn ja koneoppimisen välillä?
- Ohjattu ja valvomaton oppiminen
- Vahvistusoppiminen
- Syvä oppiminen
- Koneoppimisen rajat
Video: Mitä mahdollisuuksia koneoppiminen tarjoaa lääketieteelle? (Marraskuu 2024)
Joulukuussa 2017 DeepMind, Googlen vuonna 2014 hankkima tutkimuslaboratorio, esitteli keinotekoisen älykkyysohjelman AlphaZero, joka voisi voittaa maailmanmestarit useissa lautapeleissä.
Mielenkiintoista on, että AlphaZero sai ihmisiltä nolla ohjeita pelien pelaamiseen (tästä myös nimi). Sen sijaan se käytti koneoppimista, AI-haaraa, joka kehittää käyttäytymistään kokemuksen kautta eksplisiittisten komentojen sijasta.
AlphaZero saavutti 24 tunnin sisällä yli-inhimillisen suorituskyvyn shakissa ja voitti edellisen maailmanmestari-shakkiohjelman. Pian sen jälkeen AlphaZeron koneoppimisalgoritmi hallitsi myös Shogin (japanilainen shakki) ja kiinalaisen lautapelin Go, ja se voitti edeltäjänsä AlphaGon 100: seen nollaan.
Koneoppimisesta on tullut suosittua viime vuosina, ja se auttaa tietokoneita ratkaisemaan ongelmat, joita aiemmin pidettiin ihmisten älyn yksinoikeudenalana. Ja vaikka se on edelleen kaukana keinotekoisen älykkyyden alkuperäisestä visiosta, koneoppiminen on saanut meidät paljon lähemmäksi ajattelukoneiden luomisen perimmäistä tavoitetta.
Mitä eroa on tekoälyn ja koneoppimisen välillä?
Perinteisiin lähestymistapoihin tekoälyn kehittämiseksi sisältyy huolellisesti kaikkien sääntöjen ja tietojen koodaaminen, jotka määrittelevät AI-agentin käyttäytymisen. Luodessaan sääntöpohjaista automaattista tunnistetta kehittäjien on kirjoitettava ohjeet, joissa määritetään, kuinka automaattisen tunnisteen tulisi toimia kaikissa mahdollisissa tilanteissa. Tämä sääntöpohjainen lähestymistapa, joka tunnetaan myös nimellä hyvä vanhanaikainen AI (GOFAI) tai symbolinen AI, yrittää jäljitellä ihmismielen päättelyä ja tiedon esittämistä.
Täydellinen esimerkki symbolisesta AI: stä on Stockfish, huippuluokan avoimen lähdekoodin shakkimoottori, joka on valmistunut yli 10 vuotta. Sadat ohjelmoijat ja shakkipelaajat ovat osallistuneet Stockfish-ohjelmaan ja auttaneet sen logiikan kehittämisessä koodaamalla sen sääntöjä - esimerkiksi mitä AI: n tulisi tehdä, kun vastustaja siirtää ritarinsa B1: stä C3: een.
Mutta sääntöihin perustuva AI rikkoutuu usein käsitellessään tilanteita, joissa säännöt ovat liian monimutkaisia ja implisiittisiä. Esimerkiksi puheen ja objektien tunnistaminen kuvissa on edistyneitä toimintoja, joita ei voida ilmaista loogisissa säännöissä.
Toisin kuin symbolinen AI, koneoppimisen AI-malleja ei kehitetä kirjoittamalla sääntöjä vaan keräämällä esimerkkejä. Esimerkiksi luodakseen koneoppimispohjaisen shakkimoottorin kehittäjä luo perusalgoritmin ja "kouluttaa" sen sitten tuhansien aiemmin pelattujen shakkipelien tiedoilla. Tietoja analysoimalla AI löytää yleisiä malleja, jotka määrittelevät voittastrategiat, joita se voi käyttää todellisten vastustajien voittamiseen.
Mitä enemmän pelejä AI tarkistaa, sitä parempi se on ennustamaan voittavia siirtoja pelin aikana. Siksi koneoppiminen määritellään ohjelmaksi, jonka suorituskyky paranee kokemuksen kanssa.
Koneoppimista voidaan soveltaa moniin reaalimaailman tehtäviin, mukaan lukien kuvan luokittelu, äänentunnistus, sisältösuositukset, petosten havaitseminen ja luonnollisen kielen käsittely.
Ohjattu ja valvomaton oppiminen
Riippuen ongelmasta, jonka he haluavat ratkaista, kehittäjät valmistelevat asiaankuuluvaa tietoa koneoppimismallinsa rakentamiseksi. Esimerkiksi, jos kehittäjät haluaisivat käyttää koneoppimista vilpillisten pankkitapahtumien havaitsemiseksi, kehittäjät laativat luettelon olemassa olevista tapahtumista ja merkitsivät ne lopputulokseen (vilpillinen tai pätevä). Kun he syöttävät tietoja algoritmiin, se erottaa vilpilliset ja pätevät tapahtumat ja löytää yhteiset ominaisuudet molemmissa luokissa. Selitetyllä tiedolla varustettujen koulutusmallien prosessia kutsutaan "ohjattuksi oppimiseksi", ja se on tällä hetkellä koneoppimisen hallitseva muoto.
Useita eri tehtäviä varten merkittyjen tietojen online-arkistoja on jo olemassa. Joitakin suosittuja esimerkkejä ovat ImageNet, avoimen lähdekoodin tietojoukko, jossa on yli 14 miljoonaa merkittyä kuvaa, ja MNIST, tietokokonaisuus, jossa on 60 000 merkittyä käsin kirjoitettua numeroa. Koneoppimiskehittäjät käyttävät myös alustoja, kuten Amazonin mekaaninen Turk, online-tilauspalvelukeskus, joka suorittaa kognitiivisia tehtäviä, kuten kuvien ja ääninäytteiden merkitsemistä. Ja kasvava aloittavien alojen erikoistuminen tietojen merkitsemiseen.
Mutta kaikki ongelmat eivät vaadi merkittyä tietoa. Jotkut koneoppimisongelmat voidaan ratkaista "ohjaamattomalla oppimisella", jossa toimitat AI-mallille raakadataa ja annat sen selvittää itse, mitkä kuviot ovat merkityksellisiä.
Valvomattoman oppimisen yleinen käyttö on poikkeamien havaitseminen. Esimerkiksi koneoppimisalgoritmi voi harjoitella Internet-yhteyden muodostavan laitteen, esimerkiksi älykkään jääkaapin, raakaa verkkoliikennetietoa. Harjoituksen jälkeen AI luo perustason laitteelle ja voi ilmoittaa poikkeavan käytöksen. Jos laite tarttuu haittaohjelmiin ja alkaa kommunikoida haitallisten palvelimien kanssa, koneoppimismalli pystyy tunnistamaan sen, koska verkkoliikenne on erilainen kuin harjoittelun aikana havaittu normaali käyttäytyminen.
Vahvistusoppiminen
Toistaiseksi tiedät todennäköisesti, että laadukkaalla koulutustiedolla on valtava rooli koneoppimismallien tehokkuudessa. Vahvistava oppiminen on kuitenkin erikoistunut koneoppimistapa, jossa AI kehittää käyttäytymistään käyttämättä aiempia tietoja.
Vahvistusoppimallit alkavat puhtaalla liuskalla. Heitä opastetaan vain ympäristönsä perussääntöihin ja käsillä olevaan tehtävään. Kokeilu ja erehdys oppivat optimoimaan toimintansa tavoitteisiinsa.
DeepMindin AlphaZero on mielenkiintoinen esimerkki vahvistusoppimisesta. Toisin kuin muut koneoppimismallit, joiden täytyy nähdä kuinka ihmiset pelaavat shakkia ja oppia niistä, AlphaZero aloitti vain tietämällä kappaleiden liikkeet ja pelin voitto-olosuhteet. Sen jälkeen se pelasi miljoonia otteluita itseään vastaan, aloittamalla satunnaisilla toimilla ja kehittämällä vähitellen käyttäytymismalleja.
Vahvistava oppiminen on kuuma tutkimusalue. Se on tärkein tekniikka, jota käytetään kehittämään AI-malleja, jotka hallitsevat monimutkaisia pelejä, kuten Dota 2 ja StarCraft 2, ja sitä käytetään myös ratkaisemaan tosielämän ongelmia, kuten hallitsemaan tietokeskuksen resursseja ja luomaan robotti käsiä, jotka voivat käsitellä esineitä inhimillisellä taidokkuudella.
Syvä oppiminen
Syväoppiminen on toinen suosittu koneoppimisen osajoukko. Se käyttää keinotekoisia hermoverkkoja, ohjelmistorakenteita, jotka ovat suurin piirtein inspiroituneita ihmisen aivojen biologisesta rakenteesta.
Neuraaliverkot houkuttelevat käsittelemättä jäsentämätöntä tietoa, kuten kuvia, videoita, ääntä ja pitkiä otteita tekstistä, kuten artikkeleita ja tutkimuslehtiä. Ennen syvää oppimista koneoppimisen asiantuntijoiden oli ponnisteltava paljon ominaisuuksien poistamiseen kuvista ja videoista ja suoritettava algoritmejaan tämän lisäksi. Neuraaliverkot tunnistavat nämä ominaisuudet automaattisesti ilman, että vaaditaan paljon vaivaa ihmisinsinööriltä.
Syvä oppiminen on takana monista nykyaikaisista AI-tekniikoista, kuten kuljettajattomat autot, edistyneet käännösjärjestelmät ja kasvojentunnistustekniikka iPhonessa X.
Koneoppimisen rajat
Ihmiset sekoittavat usein koneoppimisen inhimillisen tason tekoälyyn, ja joidenkin yritysten markkinointiosastot käyttävät tarkoituksellisesti termejä vaihdettavasti. Mutta vaikka koneoppimisella on edistytty huomattavasti monimutkaisten ongelmien ratkaisemiseksi, on silti hyvin kaukana AI: n pioneereiden suunnittelemien ajattelukoneiden luomisesta.
Kokemusten oppimisen lisäksi todellinen älykkyys vaatii päättelyä, järkeä ja abstraktia ajattelua - alueita, joilla koneoppimallit toimivat erittäin heikosti.
Esimerkiksi, vaikka koneoppiminen on hyvää monimutkaisissa kuvioiden tunnistustehtävissä, kuten rintasyövän ennustamisessa viisi vuotta etukäteen, se kamppailee yksinkertaisemman logiikan ja päättelytehtävien kanssa, kuten lukion matematiikkaongelmien ratkaiseminen.
Koneoppimisen puutteellinen päättelyvoima tekee siitä huonoksi sen, että se yleistää tietoja. Esimerkiksi koneoppimisagentti, joka voi pelata Super Mario 3: ta kuten ammattilainen, ei hallitse toista tasopeliä, kuten Mega Man, tai edes toista Super Mario -versiota. Se olisi koulutettava tyhjästä.
Ilman voimaa poimia käsitteellistä tietoa kokemuksesta, koneoppimallit vaativat suorittaakseen tonnia harjoitustietoja. Valitettavasti monilla aloilla ei ole riittävästi koulutustietoja tai heillä ei ole varoja hankkia lisää. Syväoppimisessa, joka on nykyään vallitseva koneoppimismuoto, kärsii myös selitettävyysongelma: hermostoverkot toimivat monimutkaisilla tavoilla ja jopa niiden luojat pyrkivät seuraamaan päätöksentekoaan. Tämä vaikeuttaa hermoverkkojen voiman käyttöä asetuksissa, joissa on laillinen vaatimus selittää AI-päätöksiä.
Onneksi koneoppimisen rajat ylitetään. Yksi huomattava esimerkki on puolustusministeriön tutkimusosaston DARPAn laaja aloite luoda selitettävät AI-mallit.
- Mikä on tekoäly (AI)? Mikä on tekoäly (AI)?
- Suurin osa AI-dollareista menee koneoppimiseen. Eniten AI-dollareita menee koneoppimiseen
- Kuinka haluat nähdä AI: n käytetyn? Kuinka haluat nähdä AI: n käytetyn?
Muiden hankkeiden tarkoituksena on vähentää koneoppimisen liiallista riippuvuutta merkittyihin tietoihin ja tehdä tekniikasta saatavissa alueille, joilla on rajoitettua koulutustietoa. IBM: n ja MIT: n tutkijat ovat äskettäin siirtyneet kentälle yhdistämällä symbolisen AI: n hermoverkkoihin. Hybridi-AI-mallit vaativat vähemmän tietoa koulutukseen ja voivat tarjota vaiheittaiset selitykset päätöksistään.
Tulee vielä nähdä, auttaako koneoppimisen kehitys lopulta saavuttamaan jatkuvasti vaikean tavoitteen, ihmisten tason AI: n luomisen. Mutta tiedämme varmasti, että koneoppimisen edistymisen ansiosta työpöydällämme ja taskuissamme lepäävät laitteet ovat älykkäämpiä päivittäin.