Koti liiketoiminta 7 Vinkkejä koneoppimismenestykseen

7 Vinkkejä koneoppimismenestykseen

2024

Sisällysluettelo:

1. Älä unohda logistiikkaa
2. Huomaa tietosi
3. Algoritmit eivät ole taikuusluetteloita
4. Käytä monipuolista työkalusarjaa
5. Kokeile hybridi-oppimista
6. Halpa ei tarkoita huonoa
7. Älä kutsu sitä AI: ksi

Video: Häiriöt kitaralaitteistossa osa 7 - Efektien virranjakamisen tikitys (Marraskuu 2024)

Koneoppimisen liiketoimintaoppaan (ML) ensimmäinen osa hajotti, kuinka ML: n sateenvarjokonsepti on paljon vivahteikkaampi liiketoimintaympäristössä. Tehokkaimmissa strategioissa tarkastellaan ML: tä käytännössä, hyödyntäen sekä monimutkaista syväopetusta että vähemmän intensiivistä "halpojen oppimistekniikoiden" tekniikoita yritysprosessien optimoimiseksi ja konkreettisen yritystiedon (BI) saamiseksi.

ML: n käyttöönoton tavoitteena yrityksesi sovelluksissa on parantaa tulostasi tai painaa yrityksesi kilpailuetua. Mutta organisaatiosi laajemmassa järjestelmässä tässä prosessissa sijoittamasi ajan ja resurssien hyödyntäminen ylittää paljon algoritmeja. Yrityksesi IT-päätöksentekijöiden on varmistettava, että kaikki, jotka vaikuttavat ML: n impedanssiin - datasta ja logistiikasta siihen, miten käytät käyttäjiä - toimii yhtenäisesti yhdessä maksimoidaksesi tehokkuuden.

FT Ted Dunning on MapR: n pääsovellusarkkitehti, yritysohjelmistoyritys, joka tarjoaa erilaisia Big Data -jakelu- ja tiedonhallintatyökaluja. Dunning on myös kirjoittanut kaksi kirjaa siitä, mitä hän kutsuu "käytännön koneoppimiseksi", ja kehittänyt monien yritysten kanssa vuosien mittaan ML-tekniikoita, mukaan lukien ID Analytics -petoksia havaitseva järjestelmä (LifeLockin ostama) ja Musicmatch Jukebox -ohjelmisto, josta tuli myöhemmin Yahoo Music. Hän toimii tällä hetkellä myös Apache Software Foundation -säätiön inkubaatiojohtajana.

Dunning on seurannut ML-tilan kehitystä vuosikymmenien ajan ja oppinut paljon siitä, mikä toimii ja mikä ei käytännöllisessä yritysympäristössä. Jäljempänä Dunning esittää seitsemän parasta käytäntöä, joita on noudatettava kehitettäessä ML: ään pohjautuvia yritysratkaisuja.

1. Älä unohda logistiikkaa

Onnistunut ML ei ole vain oikean työkalun tai algoritmin valinta. Dunning sanoi, että sinun on myös selvitettävä, mikä lähestymistapa sopii hyvin, ja suunnittele se sopivaan tilanteeseen. Esimerkiksi Dunning puhui ML: stä verkkomarkkinointikampanjassa vastakohtana paljon monimutkaisemmille skenaarioille, kuten algoritmeille, jotka ohjaavat autonomista autoa. Resurssien käyttäminen inkrementaaliseen algoritmien parantamiseen on autolle vaivan arvoista, mutta markkinointi-skenaariossa näet paljon paremman tuloksen kaiken sen ympärillä olevan logistiikan optimoinnista.

"Usein yrityksille se on logistiikka, ei oppiminen, mikä antaa sinulle arvon. Se on se osa, johon sinun pitäisi käyttää aikaa ja resursseja", Dunning sanoi. "Algoritmin säätäminen antaisi sinulle pienen parannuksen. Mutta näiden tietojen, graafisen käyttöliittymän ja käyttäjien kuuntelemisen ja käyttäjien kanssa tekemisten mukauttaminen voi antaa sinulle 100-prosenttisen parannuksen. Algoritmin tarkistamiseen kuluva aika kannattaa murto-osan, koska paljon yrityksille samoin kuin käyttäjien kuunteleminen."

Tämän havainnollistamiseksi Dunning selitti, kuinka hän rakensi kerran mallin sovelluspetoksien tunnistamiseksi (väärennettyjen tilien avaaminen varastetuilla identiteetteillä) yrityksen asiakastietokantaan. Hänen rakentama malli sai hyviä tuloksia, mutta Dunning huomasi sen painottavan hakijan sukupuolta erittäin voimakkaasti.

Kävi ilmi, että logistiikka oli poissa käytöstä. Hakuprosessin tapaan hakija täytti sukupuolensa vasta, kun heistä oli jo tullut asiakas ja suorittanut useita seulontavaiheita petosten suodattamiseksi. Joten sukupuolikentän avulla ML-malli huijasi koko petosprosessin logistiikkaa. Sillä ei ole mitään tekemistä algoritmin kanssa, ja kaiken sen kanssa, miten yritys on saanut tietonsa ensisijaisesti.

2. Huomaa tietosi

Dunning on täynnä tarttuvia viisauden juomia. Aloitettuaan "se on logistiikka, ei oppiminen", hän sanoi, että ajatuksen toinen puoli on "se on data, ei algoritmeja". Suuri osa sen varmistamisesta, että ML-algoritmit tarjoavat arvokkaita oivalluksia, on varmistaa, että syöt heille oikeita tietoja. Dunning sanoi, että jos et saa haluamaasi tulosta, niin useimmiten se johtuu siitä, että et käytä oikeita tietoja.

"Ihmiset saavat kaikki haavoittuvuuksiaan ja ego-sidottuja tiettyihin algoritmeihin, mutta nykyään jokainen ja heidän äitinsä voivat ja ovat keksimään kaikenlaisia uusia algoritmeja olemassa olevien työkalujen takia", sanoi Dunning. "Tiedot ovat paljon tärkeämpiä ja antavat sinulle paljon enemmän nostoa kuin algoritmien loputon säätäminen. Jos työskentelet kovan ongelman kuten puheentunnistuksen tai tietokoneen näkemyksen suhteen, se on yksi asia. Mutta tämä on tietopohjainen kenttä. Suurimmassa osassa skenaarioita saat paljon enemmän hyötyä saamiesi tietojen mukauttamisesta ja kysymyksen muuttamisesta."

Sitä Dunning teki 2000-luvun puolivälissä, kun rakensi videosuositusmoottoria Veoh Networks -nimiseen yritykseen. Ryhmä pyrkii tunnistamaan pari käyttäjän luomia videoita, joita ihmiset napsauttivat odotettua enemmän, mutta algoritmi ei toiminut. He ajattelivat musiikkia, missä käyttäjät tuntevat suosikkitaiteilijansa ja kappaleensa nimeltä. Joten he muuttivat kysymystä säätämällä käyttöliittymää koskematta itse algoritmiin.

"Käyttäjien luomissa videoissa kukaan ei tiedä taiteilijoita ja monilla videoilla oli todella roskapostinimikkeitä saadaksesi lisää katselua. Algoritmitoiminnoilla pyöräily ei olisi koskaan antanut meille hyviä tuloksia", Dunning sanoi. "Mitä teimme, muutettiin käyttöliittymää lähettämään majakkosignaali 10 sekunnin välein. Havaitsimme, että jos käytimme majakkaa napsautuksen sijasta suosittajan raakadataa varten, saimme mahtavia tuloksia. Tämän yhden muutoksen nosto oli useita Sataprosenttinen sitoutumisen paraneminen suosituksista johtuen ilman algoritmisia muutoksia."

3. Algoritmit eivät ole taikuusluetteloita

ML-toteutukset menestyvät jatkuvissa kokeissa ja virheissä. Riippumatta siitä, kuinka hyvät algoritmit ovat, jos järjestelmäsi on vuorovaikutuksessa ihmisten kanssa, sitä on mukautettava ajan myötä. Dunning korosti, että yritysten tulisi jatkuvasti mitata toteutuksensa yleistä tehokkuutta ja tunnistaa muutokset ja muuttujat, jotka tekevät siitä parempaa ja pahempaa. Tämä voi kuulostaa leveydeltä, mutta Dunning sanoi, että huolimatta siitä, kuinka ilmeinen se kuulostaa, hyvin harvat ihmiset tekevät tämän tai tekevät sen hyvin.

"Monet ihmiset haluavat ottaa käyttöön järjestelmän tai ryhtyä toimiin, ja he haluavat algoritminsa toimivan täydellisesti ikuisesti", Dunning sanoi. "Mikään algoritmi ei tule olemaan maaginen luoti. Yksikään käyttöliittymäsuunnittelu ei pysy kiinni ikuisesti. Mitään tiedonkeruumenetelmää ei koskaan korvata. Kaikki tämä voi tapahtua ja tapahtuu, ja yritysten on oltava valppaana mittaamaan, arvioimaan ja arvioimaan miten järjestelmä toimii."

4. Käytä monipuolista työkalusarjaa

Saatavana on kymmeniä ML-työkaluja, joista monia voit käyttää ilmaiseksi. Sinulla on suosittuja avoimen lähdekoodin kehyskirjastoja, kuten Caffe, H20, Shogun, TensorFlow ja Torch, sekä ML-kirjastoja useissa Apache Software Foundation (ASF) -projekteissa, kuten Mahout, Singa ja Spark. Sitten on tilauspohjaisia vaihtoehtoja, kuten Amazon Machine Learning, BigML ja Microsoft Azure Machine Learning Studio. Microsoftilla on myös ilmainen kognitiivinen työkalupakki.

Saatavilla on lukemattomia resursseja. Dunning on puhunut useille yrityksille, tietojen tutkijoille ja ML-toimijoille ja kysyi heiltä aina kuinka monta erilaista kehystä ja työkalua he käyttävät. Keskimäärin Dunningin mukaan useimmat sanoivat käyttävänsä vähintään 5–7 työkalua ja usein paljon enemmän.

"Et voi tulla liimatuksi yhteen työkaluun. Sinun on käytettävä useita, ja sinällään sinun on parempi rakentaa järjestelmäsi tavalla, joka on agnostinen", Dunning sanoi. "Jokainen, joka yrittää vakuuttaa sinulle, että tämä työkalu on ainoa mitä tarvitset, myy sinulle tavaralaskun.

"Ensi viikolla voi tapahtua jotain, joka järkyttää omenakärryä, ja innovaatioiden vauhdilla, jota näemme, tapahtuu niin vielä vähintään viisi tai 10 vuotta", Dunning jatkoi. "Katso halpaa oppimisesimerkkiä, jossa käytät ehkä olemassa olevaa kuvaluokittelijaa kuvien analysoimiseksi luettelossa. Se on syvä oppiminen, kun tietokoneen visio heitetään sisään. Siellä on kuitenkin työkaluja, jotka ovat pakataneet kaiken. Tarvitset mitata, arvioida ja tyhjentää eri työkalujen välillä, ja infrastruktuurisi on oltava siihen viihtyisää."

5. Kokeile hybridi-oppimista

Dunning sanoi, että voit myös sekoittaa halvan ja syvän oppimisen yhdessä jotain hybridiä. Esimerkiksi, jos otat olemassa olevan tietokonevisiomallin ja rakennat uudelleen muutaman ylimmän kerroksen, jossa päätöstä tehdään, voit valita nykyisen kehyksen kokonaan uudelle käyttötapaukselle. Dunning osoitti Kaggle-kilpailulle, jossa kilpailijat tekivät juuri sen; he ottivat tietojoukon ja kirjoittivat uuden algoritmin päälle auttamaan tietokonetta erottamaan kissat koirista.

"Kissien ja koirien erottaminen on erittäin hieno asia ML-algoritmille. Ajattele logiikkaa: Kissilla on terävät korvat, mutta samoin kuin saksalaisilla paimenilla. Koirilla ei ole pisteitä, paitsi dalmatialaisia jne., Mikä voi olla melko vaikea tunnistaa. itsessään ", sanoi Dunning. "Voittanut kaveri kehitti järjestelmän, joka teki tämän 99-prosenttisella tarkkuudella. Mutta kolmannelle tulijalle vaikutti minua enemmän. Minun mielestäni tyhjästä rakennuksen sijaan hän otti olemassa olevan kuvan tunnistusohjelman toisesta tehtävästä ja otti pois Hän antoi sille joitain esimerkkejä, ja pian sen tarkkuus oli 98 prosenttia, kun erotettiin kissat koirista. Koko prosessi kesti kaverilla kolme tuntia."

6. Halpa ei tarkoita huonoa

Huolimatta avoimesta merkityksestä Dunning sanoi, että halpa oppiminen ei tarkoita huonoa oppimista. ML-toteutukseen käytetty aika ei korreloi suoraan sen liiketoiminnan arvoon. Tärkeämpi laatu, hän sanoi, on varmistaa prosessin toistettavuus ja luotettavuus. Jos yritys pystyy saavuttamaan tämän sijoittamatta kohtuuttomia määriä resursseja, se on sitä parempaa.

"Halpa ei tarkoita huonoa. Jos se toimii, se toimii. Jos se on halpaa ja se toimii, se on mahtavaa. Mutta rakentamisesi vaiheet eivät määrittele arvoa. Se on summakustannusvirhe, " sanoi Dunning. "Arvo määrittelee sen, kuinka se parantaa liiketoimintaa. Jos parannus tuottaa tai vähentää kustannuksia tai parantaa kilpailutilannettasi. Se on vaikutus, ei työ."

7. Älä kutsu sitä AI: ksi

Dunning korosti, että kun puhutaan näistä tekniikoista, yritysten tulisi käyttää tarkkaa terminologiaa: ML, tietokonevisio tai syväoppiminen. Kaikella tällä on taipumus kuulua kattotermiin "tekoäly", mutta Dunningin mielestä AI: n määritelmä on yksinkertaisesti "tavaraa, joka ei vielä toimi".

"Paras määritelmä, jonka olen koskaan kuullut AI: lle, on se, että emme voi vielä selittää niitä asioita, joita emme ole tajunnut", sanoi Dunning. "Joka kerta kun saamme jotain toimimaan, ihmiset sanovat" Voi, se ei ole AI, se on vain ohjelmistoa. Se on vain sääntömoottori. Se on oikeastaan vain logistiikan regressio. " Ennen kuin selvitämme jotain, kutsumme sitä AI: ksi. Jälkeenpäin kutsumme sitä aina joku muu. Monin tavoin AI: tä käytetään paremmin sanana seuraavalle rajalle, ja AI: ssä on aina seuraava raja. AI on minne olemme menossa, ei minne olemme jo tavoittaneet."