De delgong fan it tiidrek fan Big Data

In protte bûtenlânske auteurs binne it iens dat it tiidrek fan Big Data oan in ein kaam is. En yn dit gefal ferwiist de term Big Data nei technologyen basearre op Hadoop. In protte auteurs kinne sels mei fertrouwen de datum neame doe't Big Data dizze wrâld ferliet en dizze datum is 05.06.2019/XNUMX/XNUMX.

Wat barde op dizze wichtige dei?

Op dizze dei beloofde MAPR har wurk op te hâlden as it gjin fûnsen koe fine foar fierdere operaasje. MAPR waard letter oernaam troch HP yn augustus 2019. Mar werom nei juny, men kin net helpe, mar note de trageedzje fan dizze perioade foar de Big Data merk. Dizze moanne seach in ynstoarting yn oandielprizen fan CLOUDERA, in liedende spiler op 'e merke, dy't yn jannewaris fan itselde jier fusearre mei de chronysk net-rendabele HORTOWORKS. De ynstoarting wie frij signifikant en bedroech 43%; úteinlik foel de kapitalisearring fan CLOUDERA fan 4,1 nei 1,4 miljard dollar ôf.

It is ûnmooglik net te sizzen dat geroften fan in bubble op it mêd fan Hadoop-basearre technologyen sûnt desimber 2014 sirkulearje, mar it hat moedich hâlden foar hast fiif jier mear. Dizze geroften wiene basearre op de wegering fan Google, it bedriuw dêr't Hadoop technology ûntstie, fan har útfining. Mar de technology naam woartel by de oergong fan bedriuwen nei wolkferwurkingsark en de rappe ûntwikkeling fan keunstmjittige yntelliginsje. Dêrom, weromsjen, kinne wy ​​mei fertrouwen sizze dat de dea ferwachte waard.

Sa is it tiidrek fan Big Data oan in ein kommen, mar yn it proses fan it wurkjen oan Big Data hawwe bedriuwen alle nuânses fan it wurkjen deroan realisearre, de foardielen dy't Big Data foar bedriuw bringe kinne, en ek leard om keunstmjittich te brûken yntelliginsje om wearde út rauwe gegevens te heljen.

De nijsgjirriger wurdt de fraach wat dizze technology sil ferfange en hoe't analytyske technologyen fierder sille ûntwikkelje.

Augmented Analytics

By de beskreaune eveneminten sieten bedriuwen dy't wurkje op it mêd fan data-analyse net stil. Wat kin wurde beoardiele op basis fan ynformaasje oer transaksjes dy't barde yn 2019. Dit jier waard de grutste transaksje op 'e merk útfierd - de oankeap fan it analytyske platfoarm Tableau troch Salesforce foar $ 15,7 miljard. In lytsere deal barde tusken Google en Looker. En fansels kin men net misse om de oanwinst troch Qlik fan it grutte dataplatfoarm Attunity te notearjen.

BI-merklieders en Gartner-saakkundigen kundigje in monumintale ferskowing oan yn oanpak foar gegevensanalyse; dizze ferskowing sil de BI-merk folslein ferneatigje en liede ta de ferfanging fan BI troch AI. Yn dit ferbân moat it opmurken wurde dat de ôfkoarting AI net "Artificial intelligence" is, mar "Augmented Intelligence". Litte wy in tichterby besjen wat der efter de wurden "Augmented Analytics" sit.

Augmented analytics, lykas augmented reality, is basearre op ferskate algemiene postulaten:

  • de mooglikheid om te kommunisearjen mei help fan NLP (Natural Language Processing), d.w.s. yn minsklike taal;
  • it brûken fan keunstmjittige yntelliginsje, dit betsjut dat de gegevens wurde pre-ferwurke troch masine yntelliginsje;
  • en fansels, oanbefellings beskikber foar de brûker fan it systeem, dy't waarden oanmakke troch keunstmjittige yntelliginsje.

Neffens de fabrikanten fan analytyske platfoarms sil har gebrûk beskikber wêze foar brûkers dy't gjin spesjale feardichheden hawwe, lykas kennis fan SQL of in ferlykbere skripttaal, dy't gjin statistyske of wiskundige training hawwe, dy't gjin kennis hawwe fan populêre talen spesjalisearre yn gegevensferwurking en oerienkommende bibleteken. Sokke minsken, neamd "Citizen Data Scientists", moatte allinich útsûnderlike saaklike kwalifikaasjes hawwe. Harren taak is om saaklike ynsjoch te fangen út 'e tips en prognosen dy't keunstmjittige yntelliginsje har sil jaan, en se kinne har rieden ferfine mei NLP.

It beskriuwen fan it proses fan brûkers dy't wurkje mei systemen fan dizze klasse, kinne jo de folgjende ôfbylding foarstelle. In persoan dy't oan it wurk komt en de korrespondearjende applikaasje lanseart, neist de gewoane set rapporten en dashboards dy't kinne wurde analysearre mei standert oanpak (sortearje, groepearje, útfiere rekenkundige operaasjes), sjocht bepaalde tips en oanbefellings, sa as: "Yn Om KPI, oantal ferkeapen te berikken, moatte jo in koarting tapasse op produkten út 'e kategory "Túnbou". Derneist kin in persoan kontakt opnimme mei in bedriuwsmessenger: Skype, Slack, ensfh. Kin de robot fragen stelle, troch tekst of stim: "Jou my de fiif meast rendabele kliïnten." Nei't er it passende antwurd krigen hat, moat hy it bêste beslút nimme op basis fan syn saaklike ûnderfining en winst bringe oan it bedriuw.

As jo ​​​​in stap werom nimme en sjogge nei de gearstalling fan 'e ynformaasje dy't wurdt analysearre, en op dit stadium kinne augmentearre analytyske produkten it libben fan minsken makliker meitsje. Ideaallik wurdt oannommen dat de brûker allinich it analytyske produkt oan 'e boarnen fan' e winske ynformaasje sil moatte wize, en it programma sels sil soargje foar it meitsjen fan in gegevensmodel, keppeljen fan tabellen en ferlykbere taken.

Dit alles moat foarearst soargje foar de "demokratisearring" fan gegevens, d.w.s. Elke persoan kin it heule oanbod fan ynformaasje analysearje dy't beskikber is foar it bedriuw. It beslútfoarmingproses moat wurde stipe troch statistyske analysemetoaden. Gegevens tagongstiid moat minimaal wêze, dus d'r is gjin ferlet om skripts en SQL-fragen te skriuwen. En fansels kinne jo jild besparje op heech betelle Data Science-spesjalisten.

Hypotetysk biedt technology heul ljochte perspektiven foar bedriuw.

Wat ferfangt Big Data?

Mar feitlik begon ik myn artikel mei Big Data. En ik koe dit ûnderwerp net ûntwikkelje sûnder in koarte ekskurzje yn moderne BI-ark, wêrfan de basis faaks Big Data is. It lot fan grutte gegevens is no dúdlik bepaald, en it is wolktechnology. Ik rjochte my op deals makke mei BI-leveransiers om te demonstrearjen dat no elk analytysk systeem wolkopslach efter him hat, en wolktsjinsten BI as frontend hawwe.

Net ferjitte oer sokke pylders op it mêd fan databases as ORACLE en Microsoft, is it nedich om te notearjen harren keazen rjochting fan saaklike ûntwikkeling en dit is de wolk. Alle oanbeane tsjinsten binne te finen yn 'e wolk, mar guon wolktsjinsten binne net mear beskikber op it plak. Se hawwe signifikant wurk dien oan it brûken fan modellen foar masine-learen, biblioteken makke beskikber foar brûkers, en ynterfaces konfigureare foar it gemak fan wurkjen mei modellen fan selektearing oant it ynstellen fan de starttiid.

In oar wichtich foardiel fan it brûken fan wolktsjinsten, dy't troch fabrikanten útsprutsen wurdt, is de beskikberens fan hast ûnbeheinde datasets oer elk ûnderwerp foar trainingsmodellen.

De fraach ûntstiet lykwols: hoe fier sille wolktechnologyen yn ús lân woartelje?

Boarne: www.habr.com

Add a comment