MÅ«sdienÄs par lielajiem datiem nav dzirdÄjuÅ”i tikai tie cilvÄki, kuriem nav ÄrÄju sakaru ar Ärpasauli. HabrÄ tÄma par lielo datu analÄ«zi un ar to saistÄ«tÄs tÄmas ir populÄra. TaÄu nespeciÄlistiem, kuri vÄlÄtos veltÄ«t sevi lielo datu izpÄtei, ne vienmÄr ir skaidrs, kÄdas ir Ŕīs jomas perspektÄ«vas, kur var pielietot lielo datu analÄ«zi un uz ko var paļauties labs analÄ«tiÄ·is. MÄÄ£inÄsim to izdomÄt.
CilvÄku radÄ«tÄs informÄcijas apjoms katru gadu palielinÄs. LÄ«dz 2020. gadam glabÄjamo datu apjoms palielinÄsies lÄ«dz 40ā44 zettabaitiem (1 ZB ~ 1 miljards GB). LÄ«dz 2025. gadam - lÄ«dz aptuveni 400 zetabaitiem. AttiecÄ«gi strukturÄtu un nestrukturÄtu datu pÄrvaldÄ«ba, izmantojot modernÄs tehnoloÄ£ijas, ir joma, kas kļūst arvien svarÄ«gÄka. Par lielajiem datiem interesÄ gan atseviŔķi uzÅÄmumi, gan veselas valstis.
Starp citu, tieÅ”i diskusijÄ par informÄcijas bumu un cilvÄku radÄ«to datu apstrÄdes metodÄm radÄs termins Big Data. Tiek uzskatÄ«ts, ka to 2008. gadÄ pirmo reizi ierosinÄja žurnÄla Nature redaktors Klifords LinÄs.
KopÅ” tÄ laika lielo datu tirgus katru gadu ir palielinÄjies par vairÄkiem desmitiem procentu. Un Ŕī tendence, pÄc ekspertu domÄm, turpinÄsies. TÄdÄjÄdi, pÄc uzÅÄmuma aplÄsÄm
KÄpÄc mums ir nepiecieÅ”ama lielo datu analÄ«ze?
Tas ļauj identificÄt ÄrkÄrtÄ«gi vÄrtÄ«gu informÄciju no strukturÄtÄm vai nestrukturÄtÄm datu kopÄm. Pateicoties tam, uzÅÄmums var, piemÄram, noteikt tendences, paredzÄt ražoÅ”anas veiktspÄju un optimizÄt savas izmaksas. Skaidrs, ka, lai samazinÄtu izmaksas, uzÅÄmumi ir gatavi ieviest jaunÄkos risinÄjumus.
Tehnoloģijas un analīzes metodes, kas tiek izmantotas lielo datu analīzei:
- Datu ieguve;
- pūļa piegÄde;
- datu sajaukÅ”ana un integrÄcija;
- maŔīnmÄcÄ«ba;
- mÄkslÄ«gie neironu tÄ«kli;
- modeļa atpazīŔana;
- paredzamÄ analÄ«tika;
- simulÄcijas modelÄÅ”ana;
- telpiskÄ analÄ«ze;
- StatistiskÄ analÄ«ze;
- analÄ«tisko datu vizualizÄcija.
Lielo datu analÄ«ze pasaulÄ
Lielo datu analÄ«zi tagad izmanto vairÄk nekÄ 50% uzÅÄmumu visÄ pasaulÄ. Neskatoties uz to, ka 2015. gadÄ Å”is rÄdÄ«tÄjs bija tikai 17%. Lielos datus visaktÄ«vÄk izmanto uzÅÄmumi, kas darbojas telekomunikÄciju un finanÅ”u pakalpojumu nozarÄs. PÄc tam ir uzÅÄmumi, kas specializÄjas veselÄ«bas aprÅ«pes tehnoloÄ£ijÄs. MinimÄla lielo datu analÄ«tikas izmantoÅ”ana izglÄ«tÄ«bas uzÅÄmumos: vairumÄ gadÄ«jumu Ŕīs jomas pÄrstÄvji paziÅoja par nodomu tuvÄkajÄ nÄkotnÄ izmantot tehnoloÄ£iju.
Amerikas SavienotajÄs ValstÄ«s Big Data analytics tiek izmantota visaktÄ«vÄk: vairÄk nekÄ 55% uzÅÄmumu no dažÄdÄm jomÄm strÄdÄ ar Å”o tehnoloÄ£iju. EiropÄ un ÄzijÄ pieprasÄ«jums pÄc lielo datu analÄ«tikas nav daudz zemÄks - aptuveni 53%.
KÄ ar Krieviju?
PÄc IDC analÄ«tiÄ·u domÄm,
DaudzÄjÄdÄ ziÅÄ Å”Ä« straujÄ tirgus attÄ«stÄ«ba ir saistÄ«ta ar Ŕīs jomas izaugsmi KrievijÄ. 2018. gadÄ ieÅÄmumi no attiecÄ«go risinÄjumu pÄrdoÅ”anas Krievijas FederÄcijÄ veidoja 40% no kopÄjÄm investÄ«cijÄm Big Data apstrÄdes tehnoloÄ£ijÄs visÄ reÄ£ionÄ.
Krievijas FederÄcijÄ lielo datu apstrÄdei visvairÄk tÄrÄ banku un valsts sektora, telekomunikÄciju nozares un rÅ«pniecÄ«bas uzÅÄmumi.
Ko dara lielo datu analÄ«tiÄ·is un cik viÅÅ” nopelna KrievijÄ?
Lielo datu analÄ«tiÄ·is ir atbildÄ«gs par liela apjoma informÄcijas, gan daļÄji strukturÄtas, gan nestrukturÄtas, pÄrbaudi. Banku organizÄcijÄm tie ir darÄ«jumi, operatoriem - zvani un satiksme, mazumtirdzniecÄ«bÄ - klientu apmeklÄjumi un pirkumi. KÄ minÄts iepriekÅ”, lielo datu analÄ«ze ļauj mums atklÄt sakarÄ«bas starp dažÄdiem āneapstrÄdÄtÄs informÄcijas vÄsturesā faktoriem, piemÄram, ražoÅ”anas procesu vai Ä·Ä«misku reakciju. Balstoties uz analÄ«zes datiem, tiek izstrÄdÄtas jaunas pieejas un risinÄjumi dažÄdÄs jomÄs ā no ražoÅ”anas lÄ«dz medicÄ«nai.
Lielo datu analÄ«tiÄ·im nepiecieÅ”amÄs prasmes:
- SpÄja Ätri izprast iezÄ«mes apgabalÄ, kuram tiek veikta analÄ«ze, un iegremdÄties vÄlamÄs jomas aspektos. TÄ varÄtu bÅ«t mazumtirdzniecÄ«ba, naftas un gÄzes rÅ«pniecÄ«ba, medicÄ«na utt.
- ZinÄÅ”anas par statistiskÄs datu analÄ«zes metodÄm, matemÄtisko modeļu konstruÄÅ”anu (neironu tÄ«kli, Bajesa tÄ«kli, klasterizÄcija, regresijas, faktoru, dispersijas un korelÄcijas analÄ«zes uc).
- SpÄt iegÅ«t datus no dažÄdiem avotiem, pÄrveidot tos analÄ«zei un ielÄdÄt tos analÄ«tiskÄ datu bÄzÄ.
- PÄrvalda SQL.
- Angļu valodas zinÄÅ”anas pietiekamÄ lÄ«menÄ«, lai viegli lasÄ«tu tehnisko dokumentÄciju.
- ZinÄÅ”anas par Python (vismaz pamatus), Bash (bez tÄ darba procesÄ ir ļoti grÅ«ti iztikt), plus vÄlams zinÄt Java un Scala pamatus (nepiecieÅ”ams aktÄ«vai Spark lietoÅ”anai, viena no populÄrÄkie ietvari darbam ar lielajiem datiem).
- SpÄja strÄdÄt ar Hadoop.
Nu, cik nopelna lielo datu analītiķis?
Big Data speciÄlistu tagad trÅ«kst, pieprasÄ«jums pÄrsniedz piedÄvÄjumu. Tas ir tÄpÄc, ka bizness nÄk pie izpratnes: attÄ«stÄ«bai ir vajadzÄ«gas jaunas tehnoloÄ£ijas, bet tehnoloÄ£iju attÄ«stÄ«bai nepiecieÅ”ami speciÄlisti.
TÄtad, datu zinÄtnieks un datu analÄ«ze ASV
KrievijÄ maŔīnmÄcÄ«bas speciÄlisti mÄnesÄ« saÅem no 130 lÄ«dz 300 tÅ«kstoÅ”iem rubļu, lielo datu analÄ«tiÄ·i - no 73 lÄ«dz 200 tÅ«kstoÅ”iem rubļu. Tas viss ir atkarÄ«gs no pieredzes un kvalifikÄcijas. Protams, ir vakances ar mazÄkÄm algÄm, un citas ar lielÄkÄm. MaksimÄlais pieprasÄ«jums pÄc lielo datu analÄ«tiÄ·iem MaskavÄ un SanktpÄterburgÄ. MaskavÄ, kas nav pÄrsteidzoÅ”i, ir aptuveni 50% no aktÄ«vajÄm vakancÄm (saskaÅÄ ar hh.ru). Daudz mazÄks pieprasÄ«jums ir MinskÄ un KijevÄ. Ir vÄrts atzÄ«mÄt, ka dažas vakances piedÄvÄ elastÄ«gu darba laiku un attÄlinÄtu darbu. Bet kopumÄ uzÅÄmumiem ir nepiecieÅ”ami speciÄlisti, kas strÄdÄ birojÄ.
Laika gaitÄ mÄs varam sagaidÄ«t pieprasÄ«juma pieaugumu pÄc Big Data analÄ«tiÄ·iem un saistÄ«to specialitÄÅ”u pÄrstÄvjiem. KÄ minÄts iepriekÅ”, personÄla trÅ«kums tehnoloÄ£iju sektorÄ nav novÄrsts. Bet, protams, lai kļūtu par Big Data analÄ«tiÄ·i, ir jÄmÄcÄs un jÄstrÄdÄ, pilnveidojot gan iepriekÅ” minÄtÄs, gan papildus prasmes. Viena no iespÄjÄm uzsÄkt Big Data analÄ«tiÄ·a ceļu ir
Avots: www.habr.com