Paghina ng panahon ng Big Data

Maraming mga dayuhang may-akda ang sumasang-ayon na ang panahon ng Big Data ay natapos na. At sa kasong ito, ang terminong Big Data ay tumutukoy sa mga teknolohiyang batay sa Hadoop. Maraming mga may-akda ang maaaring may kumpiyansa na pangalanan ang petsa kung kailan umalis ang Big Data sa mundong ito at ang petsang ito ay 05.06.2019/XNUMX/XNUMX.

Ano ang nangyari sa makabuluhang araw na ito?

Sa araw na ito, nangako ang MAPR na sususpindihin ang trabaho nito kung hindi ito makakahanap ng pondo para sa karagdagang operasyon. Ang MAPR ay nakuha ng HP noong Agosto 2019. Ngunit sa pagbabalik sa Hunyo, hindi maaaring hindi mapansin ng isa ang trahedya ng panahong ito para sa merkado ng Big Data. Sa buwang ito, nagkaroon ng pagbagsak sa mga presyo ng stock ng CLOUDERA, isang nangungunang manlalaro sa merkado, na sumanib sa hindi kumikitang HORTOWORKS noong Enero ng parehong taon. Ang pagbagsak ay medyo makabuluhan at umabot sa 43%; sa huli, ang capitalization ng CLOUDERA ay bumaba mula 4,1 hanggang 1,4 bilyong dolyar.

Imposibleng hindi sabihin na ang mga alingawngaw ng isang bubble sa larangan ng Hadoop-based na mga teknolohiya ay umiikot mula noong Disyembre 2014, ngunit ito ay buong tapang na nananatili sa loob ng halos limang taon. Ang mga alingawngaw na ito ay batay sa pagtanggi ng Google, ang kumpanya kung saan nagmula ang teknolohiya ng Hadoop, mula sa imbensyon nito. Ngunit nag-ugat ang teknolohiya sa panahon ng paglipat ng mga kumpanya sa mga tool sa pagproseso ng ulap at ang mabilis na pag-unlad ng artificial intelligence. Samakatuwid, sa pagbabalik-tanaw, masasabi nating may kumpiyansa na inaasahan ang kamatayan.

Kaya, ang panahon ng Big Data ay natapos na, ngunit sa proseso ng pagtatrabaho sa Big Data, napagtanto ng mga kumpanya ang lahat ng mga nuances ng pagtatrabaho dito, ang mga benepisyo na maidudulot ng Big Data sa negosyo, at natutunan din na gumamit ng artipisyal. katalinuhan upang kunin ang halaga mula sa hilaw na data.

Mas nagiging interesante ang tanong kung ano ang papalit sa teknolohiyang ito at kung paano bubuo ang mga teknolohiya ng analytics.

Augmented Analytics

Sa panahon ng mga kaganapang inilarawan, ang mga kumpanyang nagtatrabaho sa larangan ng pagsusuri ng data ay hindi umupo. Ano ang maaaring hatulan batay sa impormasyon tungkol sa mga transaksyon na naganap noong 2019. Sa taong ito, ang pinakamalaking transaksyon sa merkado ay isinagawa - ang pagkuha ng analytical platform na Tableau ng Salesforce para sa $15,7 bilyon. Isang mas maliit na deal ang naganap sa pagitan ng Google at Looker. At siyempre, hindi maaaring hindi mapansin ng isang tao ang pagkuha ng Qlik ng malaking platform ng data na Attunity.

Ang mga pinuno ng merkado ng BI at mga eksperto sa Gartner ay nag-aanunsyo ng isang napakalaking pagbabago sa mga diskarte sa pagsusuri ng data; ang pagbabagong ito ay ganap na sisira sa merkado ng BI at hahantong sa pagpapalit ng BI sa AI. Sa kontekstong ito, dapat tandaan na ang pagdadaglat ng AI ay hindi "Artificial intelligence" ngunit "Augmented Intelligence". Tingnan natin kung ano ang nasa likod ng mga salitang "Augmented Analytics."

Ang augmented analytics, tulad ng augmented reality, ay batay sa ilang pangkalahatang postulate:

  • ang kakayahang makipag-usap gamit ang NLP (Natural Language Processing), i.e. sa wika ng tao;
  • ang paggamit ng artificial intelligence, nangangahulugan ito na ang data ay pre-processed ng machine intelligence;
  • at siyempre, ang mga rekomendasyong available sa user ng system, na nabuo ng artificial intelligence.

Ayon sa mga tagagawa ng analytical platform, ang kanilang paggamit ay magagamit sa mga user na walang mga espesyal na kasanayan, tulad ng kaalaman sa SQL o isang katulad na scripting language, na walang statistical o mathematical na pagsasanay, na walang kaalaman sa mga sikat na wika. dalubhasa sa pagproseso ng data at kaukulang mga aklatan. Ang ganitong mga tao, na tinatawag na "Citizen Data Scientists", ay dapat lamang magkaroon ng mga natitirang kwalipikasyon sa negosyo. Ang kanilang gawain ay kumuha ng mga insight sa negosyo mula sa mga tip at hula na ibibigay sa kanila ng artificial intelligence, at maaari nilang pinuhin ang kanilang mga hula gamit ang NLP.

Inilalarawan ang proseso ng mga gumagamit na nagtatrabaho sa mga sistema ng klase na ito, maiisip ng isa ang sumusunod na larawan. Ang isang tao, na papasok sa trabaho at naglulunsad ng kaukulang aplikasyon, bilang karagdagan sa karaniwang hanay ng mga ulat at dashboard na maaaring masuri gamit ang mga karaniwang diskarte (pag-uuri, pagpapangkat, pagsasagawa ng mga pagpapatakbo ng aritmetika), ay nakakakita ng ilang mga tip at rekomendasyon, tulad ng: "Sa upang makamit ang KPI, bilang ng mga benta, dapat kang maglapat ng diskwento sa mga produkto mula sa kategoryang "Paghahardin." Bilang karagdagan, ang isang tao ay maaaring makipag-ugnayan sa isang corporate messenger: Skype, Slack, atbp. Maaaring magtanong sa robot, sa pamamagitan ng text o boses: "Bigyan mo ako ng limang pinakakumikitang kliyente." Ang pagkakaroon ng natanggap na naaangkop na sagot, dapat siyang gumawa ng pinakamahusay na desisyon batay sa kanyang karanasan sa negosyo at magdala ng kita sa kumpanya.

Kung aatras ka at titingnan ang komposisyon ng impormasyong sinusuri, at sa yugtong ito, ang mga produktong augmented na analytics ay maaaring gawing mas madali ang buhay ng mga tao. Sa isip, ipinapalagay na kakailanganin lamang ng user na ituro ang analytical na produkto sa mga pinagmumulan ng nais na impormasyon, at ang programa mismo ang bahala sa paglikha ng isang modelo ng data, pag-link ng mga talahanayan at mga katulad na gawain.

Ang lahat ng ito ay dapat, una sa lahat, tiyakin ang "demokratisasyon" ng data, i.e. Maaaring suriin ng sinumang tao ang buong hanay ng impormasyong magagamit ng kumpanya. Ang proseso ng paggawa ng desisyon ay dapat na suportado ng mga pamamaraan ng pagsusuri sa istatistika. Ang oras ng pag-access ng data ay dapat na minimal, kaya hindi na kailangang magsulat ng mga script at SQL query. At siyempre, makakatipid ka ng pera sa mataas na bayad na mga espesyalista sa Data Science.

Hypothetically, nag-aalok ang teknolohiya ng napakaliwanag na mga prospect para sa negosyo.

Ano ang pinapalitan ang Big Data?

Ngunit, sa katunayan, sinimulan ko ang aking artikulo sa Big Data. At hindi ko mabuo ang paksang ito nang walang maikling iskursiyon sa mga modernong tool ng BI, na kadalasan ay Big Data ang batayan. Ang kapalaran ng malaking data ay malinaw na ngayon na tinutukoy, at ito ay teknolohiya ng ulap. Nakatuon ako sa mga deal na ginawa sa mga vendor ng BI upang ipakita na ngayon ang bawat analytical system ay may cloud storage sa likod nito, at ang cloud services ay may BI bilang front end.

Hindi nalilimutan ang tungkol sa mga naturang haligi sa larangan ng mga database tulad ng ORACLE at Microsoft, kinakailangang tandaan ang kanilang napiling direksyon ng pag-unlad ng negosyo at ito ang ulap. Ang lahat ng inaalok na serbisyo ay makikita sa cloud, ngunit ang ilang serbisyo sa cloud ay hindi na available on-premise. Nakagawa sila ng makabuluhang gawain sa paggamit ng mga modelo ng machine learning, gumawa ng mga library na available sa mga user, at nag-configure ng mga interface para sa kadalian ng pagtatrabaho sa mga modelo mula sa pagpili sa mga ito hanggang sa pagtatakda ng oras ng pagsisimula.

Ang isa pang mahalagang bentahe ng paggamit ng mga serbisyo ng ulap, na ipinahayag ng mga tagagawa, ay ang pagkakaroon ng halos walang limitasyong mga set ng data sa anumang paksa para sa mga modelo ng pagsasanay.

Gayunpaman, ang tanong ay lumitaw: hanggang saan mag-ugat ang mga teknolohiya ng ulap sa ating bansa?

Pinagmulan: www.habr.com

Magdagdag ng komento