Koti liiketoiminta Ai-tietokannat: mitä ne ovat ja miksi yrityksesi pitäisi välittää

Ai-tietokannat: mitä ne ovat ja miksi yrityksesi pitäisi välittää

2024

Sisällysluettelo:

Mitä ovat AI-tietokannat?
Kuinka AI-tietokanta toimii
Hype vai todellisuus?

Video: ? Kuinka ansaita 12991,42 dollaria Builderallilla ilmaiseksi 14 päivässä (Marraskuu 2024)

Tieto ja liiketiedot (BI) ovat saman kolikon kaksi puolta. Tallennuksen, käsittelyn ja analysoinnin edistyminen on demokratisoinut datan siihen pisteeseen, että sinun ei tarvitse olla tietokantaammattilainen tai tietoteknikko työskennelläksesi massiivisten tietojoukkojen kanssa ja saadaksesi tietoja. Vielä on oppimiskäyrä, mutta itsepalvelun BI- ja datan visualisointityökalut määrittelevät uudelleen tapaa, jolla yritykset hyödyntävät kaiken keräämänsä tiedot toimivaan analytiikkaan. Edistynyttä analytiikkaa haastavaa BI- tai tietokantayritystä ja tehdasälyä (AI) sisältävää tietokantaa, joka on tarkoitukseen rakennettu koneenoppimiseen (ML), ja syvän oppimisen malleihin on kuitenkin ero.

ML-algoritmit kudotaan suuren osan nykypäivän ohjelmistoista. Kuluttajakokemukset sulautuvat AI: n kanssa virtuaaliassistenttien kautta, ja liiketoimintaohjelmissa on esimerkkejä, kuten Salesforce Einstein, jotka toimivat älykkäänä kerroksena koko yrityksen asiakassuhdehallinnan (CRM) portfolion alla. Teknologia jättiläiset, kuten Google ja Microsoft, ajavat älykästä tulevaisuuttamme entisestään, ei pelkästään tutkimuksella, vaan myös kirjoittamalla, kuinka heidän tekniikka toimii alusta alkaen AI: n kanssa.

Yksi harjoittelukoneen ja syvän oppimisen malleista on pelkkä tietomäärä ja prosessointiteho, joita tarvitset neuroverkon kouluttamiseen, esimerkiksi monimutkaisten kuvioiden tunnistamiseen aloilla, kuten kuvan luokittelu tai luonnollinen kielen käsittely (NLP). Siksi AI-tietokannat alkavat nousta markkinoille keinona optimoida AI: n oppimis- ja koulutusprosessi yrityksille. Puhuimme GPU: n kiihdytetyn relaatiotietokantatoimittajan Kinetican kanssa, joka on rakentanut oman AI-tietokannan, ja PCMagin asuvan BI: n ja tietokantaasiantuntijan Pam Bakerin kanssa, jotta voitaisiin osoittaa, mikä AI-tietokanta on ja miten se toimii verrattuna perinteisiin tietokantoihin. Vielä tärkeämpää on, että pyysimme heidän apua hypeen ja markkinointikielen selvittämiseen sen selvittämiseksi, onko tällä nousevalla tekniikalla todellista liikearvoa.

Mitä ovat AI-tietokannat?

AI-tilan nopeasti muuttuva luonne voi vaikeuttaa terminologian laatimista. Kuulet usein sellaisia termejä kuin ML, syväoppiminen ja AI, joita käytetään keskenään, kun tosiasiassa ne ovat edelleen kehitteleviä tekniikoita AI: n suuremmassa varjossa. Sellaisenaan Baker kertoi, että AI-tietokannasta on kaksi valtavasti erilaista määritelmää sen mukaan, kenen kanssa puhut: yksi käytännöllinen ja toinen enemmän taivaalla.

"Alalla on eräänlainen löysä yksimielisyys siitä, että AI-tietokanta toimisi täysin luonnollisista kielikyselyistä. Käyttöliittymä olisi sellainen, että sinun ei tarvitse luottaa hakutermeihin ja avainlauseisiin löytääkseen tarvitsemasi tiedot, joiden avulla käyttäjä voi kutsua tietojoukkoja NLP: n kanssa ", sanoi Baker. "Voisit esittää hyvin rajoitetun väitteen siitä, että IBM Watson voi esittää järjestelmälle luonnollisia kielikyselyjä, mutta sinun on oltava yhteydessä tietoihin jo ja valita tiedot itse. Joten tällä hetkellä tämä määritelmä on joustava."

Käytännöllisempi määritelmä ja tämän selittäjän aihe on käytännössä tarkoitukseen rakennetun tietokannan käyttäminen ML-mallin koulutuksen nopeuttamiseksi. Useat teknologiayritykset kehittävät jo omistettuja AI-siruja lievittääkseen uusien laitteistojen raskaita käsittelykuormituksia, kun myyjät ottavat käyttöön enemmän AI-pohjaisia ominaisuuksia, jotka vaativat huomattavaa laskentatehoa. Tietosivulta AI-tietokannan käyttö voi auttaa sinua paremmin kämmentämään ML: n ja syvän oppimisen mallien koulutukseen liittyviä määriä, nopeutta ja monimutkaisia tiedonhallinnan ja hallinnan haasteita säästääksesi aikaa ja optimoimalla resursseja.

Kuvan luotto: Todd Jaquith osoitteessa Futurism.com. Napsauta laajentaaksesi koko infografian

"Tällä hetkellä tehdään paljon pyrkimyksiä nopeuttaa ML-harjoittelua useilla erilaisilla taktikoilla", selitti Baker. "Yksi on erottaa infrastruktuuri koodausta tekevistä AI-tutkijoista siten, että automatisoidut toiminnot käsittelevät infrastruktuuria ja kouluttavat ML-mallia. Joten sen sijaan, että kulutat jotain kolmen kuukauden tapaa, saatat katsoa 30 päivää tai 30 minuuttia."

Kinetica hajottaa idean integroiduksi tietokantaalustaksi, joka on optimoitu ML: ään ja syvän oppimisen mallintamiseen. AI-tietokanta yhdistää tietovarastoinnin, edistyneen analysoinnin ja visualisoinnit muistissa olevassa tietokannassa. Kinetican Advanced Technology Group -yrityksen varatoimitusjohtaja ja pääohjelmistoinsinööri Mate Radalj kertoi, että AI-tietokannan tulisi pystyä samanaikaisesti nauttimaan, tutkimaan, analysoimaan ja visualisoimaan nopeasti liikkuvaa, monimutkaista tietoa millisekunnin sisällä. Tavoitteena on alentaa kustannuksia, tuottaa uusia tuloja ja integroida ML-mallit, jotta yritykset voivat tehdä tehokkaampia, datapohjaisia päätöksiä.

"AI-tietokanta on osa yleistä tietokantaa", sanoi Radalj. "Tällä hetkellä AI-tietokannat ovat erittäin suosittuja. Mutta monet ratkaisut käyttävät hajautettuja komponentteja. Spark, MapReduce ja HDFS pyörivät aina edestakaisin muistin sijaan. Niissä ei ole tekijöiden, kuten tietokantamme, yhdistelmää, joka rakennettiin alusta alkaen tiiviisti integroiduilla CPU: lla ja GPU: lla yhdelle alustalle. Korkean tason etu meille on nopeampi tarjoaminen ja pienempi mallipohjaisen laitteistojalanjälki nopealla käännöksellä ja analysoinnilla integroituna samaan alustaan."

Kuinka AI-tietokanta toimii

AI-tietokannoista on käytännössä useita esimerkkejä. Microsoft Batch AI tarjoaa pilvipohjaisen infrastruktuurin syvällisen oppimisen ja ML-mallien kouluttamiseen Microsoft Azure GPU: lla. Yhtiöllä on myös Azure Data Lake -tuote, jonka avulla yritysten ja tietotekijöiden on helpompi käsitellä ja analysoida tietoja hajautetussa arkkitehtuurissa.

Toinen esimerkki on Googlen AutoML-lähestymistapa, joka suunnittelee pohjimmiltaan ML-mallien koulutustavan. Google AutoML automatisoi ML-mallin suunnittelun luodakseen uusia hermoverkkoarkkitehtuureja tiettyjen tietojoukkojen perusteella ja testata ja iteroida sitten tuhansia kertoja parempien järjestelmien koodaamiseksi. Itse asiassa Googlen AI voi nyt luoda parempia malleja kuin ihmistutkijat.

"Katso Google AutoML: ML kirjoittaa ML-koodia, joten et tarvitse edes ihmisiä", sanoi Baker. "Tämä antaa sinulle kuvan siitä, kuinka suuri ero myyjien tekemissä on. Jotkut yrittävät välittää edistyneitä analytiikoita kuten ML - ja niin ei ole. Ja toiset tekevät ML: tä niin edistyneellä tasolla, että se on mitä useimmat yritykset voivat ymmärtää tällä hetkellä."

Sitten siellä on Kinetica. San Franciscossa toimiva startup, joka on kerännyt 63 miljoonan dollarin pääomasijoitusrahoitusta, tarjoaa tehokkaan SQL-tietokannan, joka on optimoitu nopeaan tiedonkeruuseen ja analytiikkaan. Kinetica on mitä Radalj kuvasi massiivisesti rinnakkaisprosessoiduksi (MPP) hajautettua tietokantaa ja laskentaalustaa, jossa jokaisessa solmussa on samanaikaisesti muistin tiedot, CPU ja GPU.

Mikä tekee AI-tietokannasta poikkeavan perinteisestä tietokannasta, Radalj selitti, kolme pääelementtiä:

Nopeutettu tiedon saanti,
Muistissa olevan tiedon samanaikaisuus (rinnakkaisprosessointi tietokannan solmujen välillä), ja
Yhteinen alusta tietotekijöille, ohjelmistosuunnittelijoille ja tietokannan ylläpitäjille, jotta ne voisivat iteroida ja testata malleja nopeammin ja soveltaa tuloksia suoraan analytiikkaan.

Kaikille tätä lukeneille tietokantoihin kuulumattomille ja AI-mallien koulutusasiantuntijoille Radalj mursi nämä kolme keskeistä tekijää ja selitti, kuinka AI-tietokanta liittyy todelliseen liikearvoon. Tiedon saatavuus ja tiedon saanti ovat avainasemassa, hän sanoi, koska kyky käsitellä reaaliaikaista suoratoistotietoa antaa yrityksille mahdollisuuden toimia nopeasti AI-pohjaisten näkemysten pohjalta.

"Meillä on yksi vähittäiskaupan asiakas, joka halusi seurata myyntihintoja myymälöittäin viiden minuutin välein", sanoi Radalj. "Halusimme käyttää AI: tä ennustaaksesi muutaman viimeisen tunnin historiallisten tietojen perusteella, pitäisikö heidän täydentää varastoa ja optimoida tämä prosessi. Mutta konepohjaisen varaston täydennyksen tekeminen vaatii tuen 600-1200 kyselyä sekunnissa. "ovat SQL-tietokanta ja AI-tietokanta, joten voimme syödä tietoja tällä nopeudella. Meille liiketoimintatapaamisen täyttäminen tuotti sovelluksen, joka lisäsi sijoitetun pääoman tuottoprosenttia."

Baker oli yhtä mieltä siitä, että ML vaatii valtavan määrän tietoja, joten sen nopea syöminen olisi erittäin tärkeää AI-tietokannan kannalta. Toinen tekijä, käsite "muistin sisäisen datan samanaikaisuus", vie hieman enemmän selitystä. Muistin sisäinen tietokanta tallentaa tietoja päämuistiin erillisen levymuistin sijaan. Se käsittelee kyselyt nopeammin, etenkin analytiikassa ja BI-tietokannoissa. Yhdessä sijainnissa Radalj selitti, että Kinetica ei erota CPU- ja GPU-laskentasolmuja verrattuna tallennussolmuihin.

Seurauksena on, että AI-tietokanta tukee rinnakkaisprosessointia - joka jäljittelee ihmisen aivojen kykyä prosessoida useita ärsykkeitä - samalla kun se on myös jakautunut skaalautuvaan tietokantainfrastruktuuriin. Tämä estää suuremman laitteistojalanjäljen, joka johtuu siitä, mitä Radalj kutsui "tiedonsiirtoksi" tai tarpeesta lähettää tietoja edestakaisin eri tietokantakomponenttien välillä.

"Jotkut ratkaisut käyttävät IBM Symphony -tyyppistä orkestraattoria eri komponenttien työn ajoittamiseen, kun taas Kinetica korostaa toiminnan kuljettamista rinnakkain sijoitettuihin resursseihin nähden edistyneellä optimoinnilla tiedon lähettämisen minimoimiseksi", sanoi Radalj. "Tämä yhteinen sijaintipaikka tarjoaa erinomaisen suorituskyvyn ja suorituskyvyn, etenkin erittäin samanaikaisten raskaiden kyselyiden tekemiseksi suurissa tietokokonaisuuksissa."

Varsinaisen tietokantalaitteiston suhteen Kinetica on yhteistyössä Nvidian kanssa, jolla on laajeneva AI GPU -kokoonpano ja tutkitaan mahdollisuuksia Intelin kanssa. Radalj kertoi myös, että yritys seuraa silmällä tulevia AI-laitteistoja ja pilvipohjaisia infrastruktuureja, kuten Googlen Tensor Processing Units (TPU).

Viimeiseksi on ajatus yhtenäisestä malliharjoitteluprosessista. AI-tietokanta on tehokas vain, jos nopeamman käytön ja prosessoinnin edut palvelevat suurempia, liiketoimintakeskeisiä tavoitteita yrityksen ML: lle ja syvälle oppimiselle. Radalj viittaa Kinetican AI-tietokantaan "malliputkiympäristöksi", joka suorittaa data tiedepohjaista mallin ylläpitoa.

Tämä kaikki mahdollistaa nopeamman testauksen ja iteroinnin tarkempien ML-mallien kehittämiseksi. Tältä osin Bakerin mukaan yhteistyö yhtenäisellä tavalla voi auttaa kaikkia insinöörejä ja tutkijoita, jotka työskentelevät kouluttamaan ML: n tai syvän oppimisen mallia, iteroitumaan nopeammin yhdistämällä mikä toimii, toisin kuin keksimällä jatkuvasti kaikkia koulutusprosessin vaiheita. Radalj sanoi, että tavoitteena on luoda työnkulku, jossa erän nopeampi nauttiminen, suoratoisto ja kysely tuottaa mallituloksia, joita voidaan välittömästi soveltaa BI: hen.

"Tietotieteilijöillä, ohjelmistosuunnittelijoilla ja tietokannan ylläpitäjillä on yksi ainoa alusta, jossa työ voidaan rajata puhtaasti itse tietojenkäsittelytieteen, ohjelmistojen kirjoittamisen sekä SQL-tietomallien ja kyselyiden kanssa", sanoi Radalj. "Ihmiset työskentelevät puhtaammin yhdessä niillä eri aloilla, kun se on yhteinen alusta. Tavoitteena on useimmiten ML: n suorittaminen ja syvä oppiminen. Haluat käyttää tuloksia - aputehokkuuksia ja muuttujia - yhdessä analytiikan kanssa., ja käytä lähtöä esimerkiksi pisteyttämiseen tai ennustamaan jotain hyödyllistä."

Hype vai todellisuus?

AI-tietokannan lopullinen arvo, ainakin Kinetica: n määrittelemällä tavalla, on laskenta- ja tietokantaresurssien optimointi. Tämä puolestaan antaa sinun luoda parempia ML- ja syväoppimismalleja, kouluttaa niitä nopeammin ja tehokkaammin ja ylläpitää läpikotaista linjaa siihen, kuinka tätä AI: ta sovelletaan yritykseesi.

Radalj antoi esimerkin laivaston hallinnasta tai kuljetusyrityksestä. Tässä tapauksessa AI-tietokanta voisi prosessoida suuria reaaliaikaisen tiedon kulkuja ajoneuvokannasta. Sitten mallinnalla geospatiaalinen tieto ja yhdistämällä se analytiikkaan, tietokanta voisi dynaamisesti reitittää rekat ja optimoida reitit.

"On helpompaa toimittaa, prototyyppi ja testata nopeasti. Sana" mallintaminen "heitetään AI: hen, mutta kyse on pyöräilystä eri lähestymistapojen kautta - mitä enemmän tietoja, sitä parempi - ajaa niitä uudestaan ja uudestaan, testata, vertailla ja parhaiden mallien keksiminen ", sanoi Radalj. "Neuraaliverkoille on annettu elämä, koska tietoja on enemmän kuin koskaan ennen. Ja opimme pystyämme laskemaan sen läpi."

Viime kädessä Kinetican yhteinen tietokanta ja malliputkistoalusta ovat vain yksi lähestymistapa tilassa, joka voi tarkoittaa paljon erilaisia asioita riippuen siitä, ketä kysyt. Baker kertoi, että haasteena ostajalle markkinoilla, jotka ovat edelleen kehittymässä ja kokeellista, on selvittää tarkalleen, mitä AI-tietokantatoimittaja kohoaa.

"Liiketoimintakonseptina syvä oppiminen, ML, ja kaikki tämä on vakaa käsite. Työskentelemme parhaillaan teknisissä kysymyksissä, jotka ovat ratkaistavissa, vaikka emme ole vielä ratkaisseet niitä", Baker sanoi. "Se ei tarkoita, että tämä on kypsä tila, koska se ei todellakaan ole. Sanoisin, että" ostaja varokaa ", koska jotain sellaista kuin ML voi olla tai ei. Se voi olla vain puutarhalajike-edistynyt analytiikka."

Baker kertoi, ovatko AI-tietokannat hyötysuhteet tällä hetkellä hyviä tai ovatko ne tärkeitä suuntauksia liiketoiminnan etenemiselle. Hän sanoi, että Big Data markkinointiterminä on nyt etusijalla. Baker kertoi, että edistyneen, datavetoisen analysoinnin ja todellisen ML: n sekä syvän oppimisen algoritmien välillä on nyt jonkin verran markkinoiden epäjärjestystä. Riippumatta siitä, puhutko tietokannasta ML-mallinnusta varten tai popkulttuurin haaveista itsetietoisista AI-tiedoista, kaikki alkaa ja päättyy tiedolla.

"Tietoja käytetään liiketoiminnassa ajan loppumiseen asti; se on juuri niin keskeistä liiketoiminnassa", sanoi Baker. "Kun puhut tieteiskirjallisuuden suhteen, AI on itsestään toteutunut älykkyys. Silloin aloitat puhumisen yksilöllisyyksistä ja roboteista, jotka valloittavat maailman. Joko tapahtuu vai ei, en tiedä. Jätän että Stephen Hawkingille."