Koti liiketoiminta Google yksinkertaistaa koneoppimista sql: llä

Google yksinkertaistaa koneoppimista sql: llä

Sisällysluettelo:

Video: Tekoäly alle 20 minuutissa (Marraskuu 2024)

Video: Tekoäly alle 20 minuutissa (Marraskuu 2024)
Anonim

Google on nyt lisännyt koneoppimis- (ML) ominaisuuksia Google BigQueryyn, yrityksen petabyte (PB) -asteikon pilvitietokantatarjoukseen. Uudella versiolla, joka on nyt nimeltään BigQuery ML, voidaan käyttää yksinkertaisia ​​SQL-lauseita rakentaa ja ottaa käyttöön ML-malleja ennustavaan analytiikkaan.

Se ei ole vain hyvä uutinen tietotekijöille, jotka käyttävät Googlea. Se on myös hyödyllinen yrityksille, jotka ovat kiinnostuneita kehittämään data-analyyttisiä ominaisuuksiaan, koska se lisää yhden tehokkaamman kilpailijan melko pieneen luetteloon myyjiä, jotka pystyvät toimittamaan tämän tason hienostuneisuuden pilvipalvelun kautta. Kaksi muuta tunnetuinta nimeä ovat Amazonin relaatiotietokantapalvelu ja Microsoftin Azure SQL. Löydät lisää viimeisimmästä pilvitietokantapalvelustamme roundup.

Kaikkien tietotuotteiden myyjien ja ostajien rajoitukset ovat aina olleet osaamisvaje. Se on ollut erityisen totta niille, jotka ovat kiinnostuneita ML: stä ja ennakoivasta analytiikasta, koska nämä tieteet vaativat usein uuden tekniikan tuntemusta ja kielten kyselyä.

"Jokaisella tietotieteilijällä on satoja analyytikoita, jotka työskentelevät datan kanssa ja useimmat käyttävät SQL: ää", Google Cloudin tuotehallinnan johtaja Sudhir Hasbe kertoi PCMagille. Jotain oli annettava, jos data-analyytikoiden armeijan voimaa haluttiin poistaa irrotettaessa liian harvojen ja liian ylenmääräisten tietojen tutkijoiden luomasta pullonkaulasta.

Googlen vastaus tähän ongelmaan on hieno. Vaikka ML on kuuma suuntaus ja esiintyy kaikenlaisissa tuotteissa kaikkialla, se on silti tiukasti datatieteilijän alue. Monet myyjät ovat edistyneet tekniikan yksinkertaistamisessa, mutta ruma totuus on, että voit yksinkertaistaa sitä paljon, ja yli 99 prosentilla ihmisistä se on edelleen liian vaikea käyttää. Meidän on kuitenkin kyettävä käyttämään sitä, koska ML voi tehdä enemmän ja tehdä sen nopeammin kuin ryhmä superälykkäitä ihmisiä.

Google istuttaa ML: n Google BigQuery -sovellukseen sisälle siten, että se on lähempänä tietoja. Sovellus tuo ML-ominaisuudet nopeammin kuin perinteiset ML-mallit osittain, koska data-analytiikka voidaan suorittaa lähteessä. Nyt beetaversiona BigQuery ML antaa analyytikoille (ja tietotekijöille) suorittaa ennakoivaa analytiikkaa, kuten ennustaa myyntiä ja luoda asiakassegmenttejä suoraan niiden tietojen päälle, joihin ne tallennetaan. Pelkästään se on kunnioitettava ja huomattava päivitys.

Google meni kuitenkin pidemmälle lisäämällä ominaisuuden, jonka avulla tietoanalyytikot voivat käyttää yksinkertaisia ​​SQL-käskyjä ML-mallien rakentamiseen ja käyttöönottoon. Tällä hetkellä vaihtoehdot ovat lineaarinen regressio ja logistinen regressiomallit ennustavaa analyysiä varten, koska nämä ovat kaksi mallia, joita käytetään yleisimmin.

Tässä on Googlen tarjoama esimerkki siitä, kuinka data-analyytikot käyttävät tätä ominaisuutta:

Hasbe toteaa, että Google aikoo lisätä lisää ML-vaihtoehtoja tähän kykyyn ajan myötä. "Meidän on kuultava asiakkailtamme, mitä malleja he haluavat meidän lisäävän, jotta toimitamme ensin hyödyllisimmät", hän sanoi.

Muut Google BigQuery -päivitykset

Tärkeän päivitysluettelon kärjessä ML: n jälkeen ovat klusterointimahdollisuudet, BigQuery Geographic Information Systems (BigQuery GIS), uusi Google Sheets -dataliitin ja uusi Google Sheets -dataliitin.

Klusterointi on myös beetaversiota ja mahdollistaa klusteroitujen taulukoiden luomisen datan optimointiliikkeessä, joka kimppuun rivit samanlaisten klusteriavaimien kanssa. Tämä vähentää kustannuksia, koska se parantaa suorituskykyä ja antaa Google BigQuerylle mahdollisuuden veloittaa käyttäjältä vain skannatut tiedot, ei koko taulukon tai osion sijaan.

BigQuery GIS on tällä hetkellä alfa, ja sitä käytetään geospatiaalisen tiedon analysointiin. Vaikka Google Cloud -tiimi teki yhteistyötä Google Earth Enginen kanssa BigQuery GIS -järjestelmän rakentamiseksi, sinun on tuotava omat paikkatietosi taulukkoon. Se ei ole ongelma useilla aloilla, mukaan lukien kytketyt autojärjestelmät, esineiden Internet (IoT), valmistus, vähittäiskauppa, älykkäät kaupungit ja telematiikka. Puhumattakaan valtion virastoista, jotka vaihtelevat ympäristönsuojeluvirastosta (EPA) ja kansallisesta geospatiaalisen älykkyyden virastosta National Oceanic and Atmospheric Administration (NOAA) ja kaikki armeijan haaroihin, tietenkin.

BigQuery GIS käyttää S2-kirjastoa, jolla on nyt yli miljardi käyttäjää monien tuotteiden, kuten Google Earth Engine ja Google Maps, kautta. Jos tarvitset lisää paikkatietoa, liittohallitus jakaa valtavan määrän sitä GeoPlatformissa.

Uusi Google Sheets -liitäntä ilahduttaa todennäköisesti monia data-analyytikoita vain siksi, että se on niin käytännöllinen päivittäisessä käytössä. Voit käyttää Google BigQueryä Google Sheetsistä (taulukkolaskentaohjelma) ja käyttää Google Sheetsin työkaluja, kuten Explore, joka on yhdistetty yhteistyö, datan visualisointi ja luonnollisen kielen kyselytyökalu.

Google BigQueryllä on nyt myös uusi käyttöliittymä (UI) beetaversiona. Yksi mielenkiintoisimmista elementeistä on yhden napsautuksen visualisointitoiminnot, joita Google Data Studio tukee. Kaiken kaikkiaan, se on loistava päivityskierros jo tyylikkäälle palvelulle. Nämä päivitykset testataan PCMag: n Tietokanta palveluna (DBaaS) -ratkaisujen seuraavalla kierroksella, kun virheet on selvitetty ja tuotteet ovat siirtyneet vastaavien alfa- ja beeta-tilansa ulkopuolelle.

PCMag EIC Dan Costa keskustelee datan tulevaisuudesta:
Google yksinkertaistaa koneoppimista sql: llä