Crìonadh àm an Dàta Mhòir

Tha mòran ùghdaran cèin ag aontachadh gu bheil àm an Dàta Mòr air tighinn gu crìch. Agus anns a 'chùis seo, tha an teirm Dàta Mòr a' toirt iomradh air teicneòlasan stèidhichte air Hadoop. Faodaidh mòran ùghdaran eadhon le misneachd ainmeachadh an ceann-latha nuair a dh’ fhàg Dàta Mòr an saoghal seo agus is e an ceann-latha seo 05.06.2019/XNUMX/XNUMX.

Dè thachair air an latha chudromach seo?

Air an latha seo, gheall MAPR an obair aca a chuir dheth mura b’ urrainn dhaibh airgead a lorg airson tuilleadh obrachaidh. Chaidh MAPR fhaighinn nas fhaide air adhart le HP san Lùnastal 2019. Ach a’ tilleadh chun Ògmhios, chan urrainn dhuinn cuideachadh le bhith toirt fa-near bròn-chluich na h-ùine seo airson margaidh an Dàta Mòr. Air a’ mhìos seo chaidh tuiteam ann am prìsean stoc CLOUDERA, prìomh chluicheadair sa mhargaidh, a thàinig còmhla ris na HORTOWORKS a bha neo-phrothaideach san Fhaoilleach den aon bhliadhna. Bha an tuiteam gu math cudromach agus thàinig e gu 43%; aig a ’cheann thall, chaidh calpachadh CLOUDERA sìos bho 4,1 gu 1,4 billean dolar.

Tha e do-dhèanta gun a bhith ag ràdh gu bheil fathannan mu builgean ann an raon theicneòlasan stèidhichte air Hadoop air a bhith a’ cuairteachadh bhon Dùbhlachd 2014, ach chùm e air adhart gu gaisgeil airson faisg air còig bliadhna eile. Bha na fathannan sin stèidhichte air diùltadh Google, a’ chompanaidh às an tàinig teicneòlas Hadoop, bhon innleachd aige. Ach ghabh an teicneòlas freumhachadh nuair a ghluais companaidhean gu innealan giollachd sgòthan agus leasachadh luath air inntleachd fuadain. Mar sin, a’ coimhead air ais, faodaidh sinn a ràdh le misneachd gun robh dùil ris a’ bhàs.

Mar sin, tha àm an Dàta Mòr air tighinn gu crìch, ach ann am pròiseas a bhith ag obair air Dàta Mòr, tha companaidhean air a h-uile nuances a bhith ag obair air, na buannachdan a bheir Dàta Mòr a thoirt do ghnìomhachas, agus cuideachd air ionnsachadh cleachdadh fuadain. fiosrachadh gus luach a tharraing à dàta amh.

Mar as inntinniche thig a’ cheist air dè a thèid an àite an teicneòlais seo agus mar a leasaicheas teicneòlasan anailis tuilleadh.

Analytics Meudaichte

Rè na tachartasan a chaidh a mhìneachadh, cha do shuidh companaidhean a bha ag obair ann an raon mion-sgrùdadh dàta fhathast. Dè as urrainnear a bhreithneachadh stèidhichte air fiosrachadh mu ghnothaichean a thachair ann an 2019. Am-bliadhna, chaidh an gnothach as motha sa mhargaidh a dhèanamh - togail an àrd-ùrlar anailis Tableau le Salesforce airson $ 15,7 billean. Thachair cùmhnant nas lugha eadar Google agus Looker. Agus gu dearbh, chan urrainn dhuinn fàiligeadh a bhith mothachail gu bheil Qlik air an àrd-ùrlar dàta mòr Attunity fhaighinn.

Tha stiùirichean margaidh BI agus eòlaichean Gartner ag ainmeachadh gluasad mòr ann an dòighean-obrach airson mion-sgrùdadh dàta; sgriosaidh an gluasad seo margaidh BI gu tur agus leanaidh e gu bhith a ’cur AI an àite BI. Anns a ’cho-theacsa seo, bu chòir a thoirt fa-near nach e“ Artificial Intelligence ”a th’ anns a ’gheàrr-chunntas AI ach“ Eòlas Meudaichte ”. Bheir sinn sùil nas mionaidiche air na tha air cùl nam faclan "Augmented Analytics."

Tha mion-sgrùdadh leasaichte, mar fhìrinn leasaichte, stèidhichte air grunn phuist coitcheann:

  • an comas conaltradh le bhith a’ cleachdadh NLP (Pròiseas Cànain Nàdarra), i.e. ann an cànan daonna;
  • cleachdadh inntleachd fuadain, tha seo a’ ciallachadh gum bi an dàta air a phròiseasadh ro-làimh le fiosrachadh inneal;
  • agus gu dearbh, molaidhean a bha rim faighinn le neach-cleachdaidh an t-siostaim, a chaidh a chruthachadh le inntleachd fuadain.

A rèir luchd-saothrachaidh àrd-ùrlaran anailis, bidh an cleachdadh ri fhaighinn do luchd-cleachdaidh aig nach eil sgilean sònraichte, leithid eòlas air SQL no cànan sgrìobhaidh coltach ris, aig nach eil trèanadh staitistigeil no matamataigeach, aig nach eil eòlas air cànanan mòr-chòrdte. gu sònraichte ann an giullachd dàta agus leabharlannan co-fhreagarrach. Feumaidh teisteanasan gnìomhachais air leth a bhith aig na daoine sin, ris an canar “Citizen Data Scientists”. Is e an obair aca seallaidhean gnìomhachais a ghlacadh bho na molaidhean agus na ro-innsean a bheir innleachdas fuadain dhaibh, agus faodaidh iad na tuairmsean aca ùrachadh le bhith a’ cleachdadh NLP.

A 'toirt cunntas air a' phròiseas de luchd-cleachdaidh ag obair le siostaman den chlas seo, faodaidh aon smaoineachadh air an dealbh a leanas. Bidh neach, a ’tighinn a dh’ obair agus a’ cur air bhog an tagradh co-fhreagarrach, a bharrachd air an t-seata àbhaisteach de dh ’aithisgean agus clàran-dannsa a dh’ fhaodar a sgrùdadh le bhith a’ cleachdadh dhòighean àbhaisteach (seòrsachadh, cruinneachadh, coileanadh gnìomhachd àireamhachd), a ’faicinn cuid de mholaidhean agus mholaidhean, rudeigin mar:“ Ann an Gus KPI a choileanadh, an àireamh de reic, bu chòir dhut lasachadh a chuir air toraidhean bhon roinn “Gàrradaireachd”. A bharrachd air an sin, faodaidh neach fios a chuir gu teachdaire corporra: Skype, Slack, msaa. Is urrainn dhomh ceistean fhaighneachd don robot, le teacsa no guth: “Thoir dhomh na còig teachdaichean as prothaidiche.” Às deidh dha am freagairt iomchaidh fhaighinn, feumaidh e an co-dhùnadh as fheàrr a dhèanamh stèidhichte air an eòlas gnìomhachais aige agus prothaid a thoirt don chompanaidh.

Ma bheir thu ceum air ais agus coimhead air co-dhèanamh an fhiosrachaidh a thathar a’ sgrùdadh, agus aig an ìre seo, faodaidh toraidhean anailis leasaichte beatha dhaoine a dhèanamh nas fhasa. Mas fheàrr, thathas a’ gabhail ris nach fheum an neach-cleachdaidh ach an toradh anailis a chomharrachadh gu stòran an fhiosrachaidh a tha a dhìth, agus bidh am prògram fhèin a’ gabhail cùram mu bhith a’ cruthachadh modal dàta, a’ ceangal chlàran agus gnìomhan coltach ris.

Bu chòir seo uile, an toiseach, dèanamh cinnteach à “deamocratachadh” dàta, i.e. Faodaidh neach sam bith mion-sgrùdadh a dhèanamh air an raon fiosrachaidh gu lèir a tha ri fhaighinn leis a’ chompanaidh. Feumaidh modhan sgrùdaidh staitistigeil taic a thoirt don phròiseas co-dhùnaidh. Cha bu chòir ùine ruigsinneachd dàta a bhith cho beag, agus mar sin chan eil feum air sgriobtaichean agus ceistean SQL a sgrìobhadh. Agus gu dearbh, faodaidh tu airgead a shàbhaladh air eòlaichean Saidheans Dàta le tuarastal àrd.

Gu beachd-bharail, tha teicneòlas a’ tabhann chothroman fìor shoilleir airson gnìomhachas.

Dè a th’ ann an àite Dàta Mòr?

Ach, gu dearbh, thòisich mi air an artaigil agam le Big Data. Agus cha b’ urrainn dhomh an cuspair seo a leasachadh às aonais turas goirid gu innealan BI an latha an-diugh, agus is e Dàta Mòr am bunait airson sin gu tric. Tha mar a thachair do dhàta mòr a-nis air a dhearbhadh gu soilleir, agus is e teicneòlas sgòthan a th’ ann. Chuir mi fòcas air gnothaichean a chaidh a dhèanamh le luchd-reic BI gus sealltainn gu bheil stòradh neòil aig a h-uile siostam anailis a-nis air a chùlaibh, agus gu bheil BI aig seirbheisean sgòthan mar cheann-aghaidh.

Gun a bhith a 'dìochuimhneachadh mu na colbhan sin ann an raon nan stòran-dàta mar ORACLE agus Microsoft, feumar a bhith mothachail air an stiùireadh a thagh iad airson leasachadh gnìomhachais agus is e seo an sgòth. Gheibhear a h-uile seirbheis a tha air a thabhann san sgòth, ach chan eil cuid de sheirbheisean sgòthan rim faighinn san togalach tuilleadh. Tha iad air obair chudromach a dhèanamh air cleachdadh mhodalan ionnsachadh innealan, air leabharlannan a chruthachadh a tha rim faighinn le luchd-cleachdaidh, agus air eadar-aghaidh a dhealbhadh airson a bhith furasta obrachadh le modalan bho bhith gan taghadh gu bhith a’ suidheachadh an ùine tòiseachaidh.

Is e buannachd chudromach eile a bhith a’ cleachdadh seirbheisean neòil, a tha luchd-saothrachaidh a’ cur an cèill, na tha ri fhaighinn de sheataichean dàta cha mhòr gun chrìoch air cuspair sam bith airson modalan trèanaidh.

Ach, tha a’ cheist ag èirigh: dè cho fada ‘s a bheir teicneòlasan sgòthan freumhachadh san dùthaich againn?

Source: www.habr.com

Cuir beachd ann