Koti Arvostelut Kuinka yritykset voivat ymmärtää suuria tietomarkkinoita

Kuinka yritykset voivat ymmärtää suuria tietomarkkinoita

Video: Suuri juutalaisuus (Lokakuu 2024)

Video: Suuri juutalaisuus (Lokakuu 2024)
Anonim

Yritykset eivät saa pisteitä siitä, kuinka tehokkaasti heidän infrastruktuurinsa toimii tai kuinka korkealle ne voivat pinota kaikki keräämänsä Big Data. Tärkeää on tietojen tuottaman analytiikan ja älykkyyden laatu.

Viime vuosien aikana Hadoop on sana, josta on tullut kaikkein synonyymi tietojen syömiselle, käsittelemiselle ja muuntamiselle. Tämä avoimen lähdekoodin kehys hajautetulle tietojen tallennukselle ja käsittelylle on saanut aikaan oman yritystilan ja integroinut tiensä kaikkiin tärkeimpiin pilvialustoihin. Hadoop on kaukana ainoasta Big Data -tekniikasta, josta kannattaa puhua, mutta siitä on tullut se, johon monet muut rakennetaan.

Yritysten ongelmana on, että Hadoop-tila on täynnä jakelu- ja työkaluvaihtoehtoja, ja kuten Gartnerin tutkimusjohtaja Nick Heudecker selitti, monet näistä näyttävät samalta. Heudecker, jonka tutkimus kattaa tiedonhallinnan, mukaan lukien Big Data- ja NoSQL-tilat, sanoi, että jos tarkastellaan yleisiä tietojenkäsittelyvaihtoehtoja, monet myyjät tarjoavat hyvin samanlaisia ​​ominaisuuksia.

Hajottaa markkinat

Hadoop-aloittajia on kolme päätoimistoa - Cloudera, Hortonworks ja MapR -, ja ne ovat kasvaneet tasaisesti vuonna 2015. Gartnerin mukaan jokaisella on noin 700 asiakasta, antavat tai ottavat 10 prosenttia, sijoittaen maailmanmarkkinat keskenään. 2 100–2 400 Hadoopin asiakasta ympäri maailmaa. Kaikki kolme tarjoavat sekä ilmaisen että yritystason Hadoop-jakelustaan, ja kukin antaa merkittävän avoimen lähdekoodin panoksen hankkeisiin Apache Software Foundation (ASF) -palkin alla.

"Tietojemme mukaan 44 prosenttia Hadoopin käytöstä on tällä hetkellä maksamatta", sanoi Heudecker. "Onko siellä selkeä johtaja? En usko niin. He kaikki tarttuvat markkinaosuuteen, koska se on aivan uusi tila."

Viime kuukausien aikana suuri osa näiden kolmen osapuolen välisestä kilpailusta on tullut kilpailulle data-analyyttisten ominaisuuksien ja luovien tapojen integroimiseksi avoimen lähdekoodin suurten tietojenkäsittelykoneiden Apache Spark -sovelluksen integroimiseksi käyttötapauksissa reaaliaikaisista tietovirroista koneoppimiseen. MapR ilmoitti äskettäin MapR-virroista osana "lähentynyttä tietoalustaa", joka yhdistää Hadoopin, Spark-pohjaisen streamin käsittelyn ja analysoinnin. Hortonworks julkaisi päivityksen Hortonworks Data Platform (HDP) -muistissa olevaan Spark-analytiikkaan, ja Cloudera tarjoaa monenlaisia ​​avoimen lähdekoodin Spark-integraatioita One Platform Initiativen kautta tarjoamalla Spark-koulutuskursseja.

"Tietohallinnassa ja tietoinfrastruktuuritiloissa tapahtuu paljon, eikä se ole kaikki Hadoop", Heudecker selitti. "Sparkin nopeuden ja muistikeskeisen tietojenkäsittelymallin takana on valtava vauhti, vaikka Sparkin kehitys onkin vielä alkuvaiheessa. Spark on jälleen yksi tietojenkäsittelyn lingua franca, aivan kuten SQL tänään, ja se osoittaa ehdottomasti merkkejä siitä, että sillä on joitain jaloja. kun yhä useammat yritykset investoivat siihen."

Heudecker korosti myös pilvipelaajien merkitystä Big Data -palvelussa; tekniikan jättiläiset, jotka ovat integroineet Hadoopin ja muut Big Data -teknologiat olemassa olevaan infrastruktuurin palveluna (IaaS) -tarjontaansa.

Amazon Web Services (AWS) käyttää Amazon Elastic MapReduce (EMR) -palveluaan pilvipohjaiseen Hadoop-orkestrointiin. Microsoft tarjoaa koko joukon Big Data -palveluita Azure-pilvialustallaan, yhteistyössä Hortonworksin kanssa HDInsight-palvelussaan Apache Hadoopin, Sparkin, HBase: n ja Stormin hallintaan sekä SQL-pohjaisiin Azure Data Lake- ja Azure Data Analytics -sovelluksiin. IBM: llä on sekä paikan päällä toimiva IBM Open Platform -tarjonta Hadoopille että IBM BigInsights, analyysipaketti, joka toimii sen päällä, sekä hallitut Hadoop ja Apache Spark-as-a-service sen Bluemix-pilvessä. Lista jatkuu, ja yritykset löytävät soveltuvat käyttötapaukset pilvestä.

"Arvioimme, että pelkästään AWS: llä on noin 5000 asiakasta, joten se on yli kaksinkertainen puhdassoittojen asiakaskuntaan", Heudecker sanoi. "Yksi pilveen siirtymisen eduista on, että saat ekosysteemin. Voit saada puhtaan pelin Hadoop-jakelut missä tahansa IaaS-tarjouksessa. MapR on saatavana kaikissa pilvissä, joita voit ajatella, muissa kuin IBM: n; samat Clouderalle ja Hortonworksille. Emme ole nähneet, että pilvien saatavuus olisi muuttunut liian suureksi tekijäksi valittaessa toimittajien välillä."

Yritystietostrategian valitseminen

Sekä pienille että keskisuurille yrityksille ja kasvaville yritysyrityksille, kun he investoivat tietojenkäsittely- ja analytiikkaratkaisuihin, Heudecker sanoi, että ratkaiseva tekijä on se, mikä alusta pystyy tarjoamaan korkeimman palvelutason. Suurin haaste yrityksille Gartnerin mukaan on osaamisvaje - selvittää kuka hallitsee alustaa sen asennuksen ja käyttöönoton jälkeen.

"Jos yritykset etsivät tietoalustayhteistyökumppania, kuka auttaa heitä tiedonsaannissa? Kuka auttaa heitä rakentamaan analyyttisen sovelluksen? Kolmen puhtaasti pelattavan Hadoop-eerin osalta arviointiperusteet ovat yleensä noin hallintatyökalujen ja -konsolien, tiedonhallintatyökalujen ja suorituskyvyn kypsyys ".

Toinen mielenkiintoinen näkökohta Hadoop-alustan valinnassa on uskollisuuden puute. Yritykset arvioivat Hadoop-alustansa uudelleen usein 6–12 kuukauden välein tarkistaakseen, ovatko tietojenkäsittelykomponentit edelleen oikein sopivia johtuen siitä, kuinka nopeasti tila muuttuu ja kuinka vähän suuret toimijat ovat erottuneet toisistaan. Heudecker kertoi, että 20 prosentilla yrityksistä, joista hän on puhunut, on useita Hadoop-jakeluja käynnissä tietokeskuksissaan tai pilvissä, joko antamalla eri joukkueille valita valitsemansa alustan tai monipuolistua tarkoituksella välttääksesi takertuvan vain yhteen Hadoop-jakeluun.

Tällainen monipuolinen alustussalkku hyödyntää sitä, mitä Frank Buytendijk, digitaalistrategiaan keskittyvä Gartnerin tutkimusjohtaja ja arvostettu analyytikko, kutsuu "informaatioksi omaisuudeksi". Kuten et voi hoitaa yritystä ilman pääomaa, työvoimaa, materiaaleja ja joko fyysisiä tai virtuaalisia palveluita, Buytendijk sanoi, että et voi hallita yritystä ilman tietoja.

"Aikaisemmin tarkastelimme yritystä kolmen virtauksen suhteen: ensisijainen virta oli tavaroita, toissijainen virta oli rahaa ja tertiäärinen virtaus oli tietoa varmistaaksemme, että tavarat ja rahat olivat yhdenmukaiset. Nyt useimmissa yrityksissä se on päinvastoin.. "Ensisijainen virtaus on tieto tunnistamisesta ja kokoonpanosta sisällön markkinointiin jne. Ei ole väliä sillä, soitatko Big Dataksi vai ei."

"Big Data" on vanhentunut

Buytendjik kertoi, että hän ei näe Big Data -yritystä erillisenä tekniikkana yrityksille, vaan yhtenä teemana tai ajattelutapana koko digitaalistrategiassasi.

"En usko Big Data -strategian olemassaoloon", sanoi Buytendjik. "Tuskin ei enää ole yritystrategiaa ilman digitaalisia komponentteja, joten uskon, että meillä on digitaalinen strategia, jossa kaikenlaiset tekniikat tarjoavat kriittisiä ominaisuuksia. Tähän sisältyy mobiili, sosiaalinen, pilvi, Internet, älykkäät koneet ja Big Data."

Heudecker uskoo, että alamme puhua "Big Data" -ohjelmasta yhä vähemmän, koska nyt se on vain dataa. Se on tapa, jolla liiketoiminta tehdään. Massiiviset määrät ja suuri tiedonsiirtonopeus eivät ole enää niin pelottavia.

"Tiedot ja analysoinnit alkavat jälleen siirtää Big Data -palvelua", Heudecker sanoi. "Big Data -luokka ei suoraan sanoen erota. Meiltä kysytään aina Big Data -markkinoiden kokoa, mutta mitä se jopa tarkoittaa? Big Data ei ole oikeastaan ​​markkinoita, se on käsite. Yritykselle, joka ajattelee Big Data: jotain ainutlaatuista ja erityistä, joka on radikaalisti erilainen kuin mitä olet aiemmin tehnyt, on virhe. Tässä vaiheessa tiedot ovat vain normaalia."

Kuinka yritykset voivat ymmärtää suuria tietomarkkinoita