Einnseanair Dàta agus Neach-saidheans Dàta: dè an diofar?

Bidh dreuchdan Neach-saidheans DĂ ta agus Einnseanair DĂ ta gu tric troimh-chèile. Tha a mion-fhiosrachadh fhèin aig gach companaidh mu bhith ag obair le dĂ ta, diofar adhbharan airson an anailis agus beachd eadar-dhealaichte air dè an speisealaiche a bu chòir dèiligeadh ris dè am pĂ irt den obair, agus mar sin tha a riatanasan fhèin aig gach fear. 

Feuch an obraich sinn a-mach dè an diofar a tha eadar na h-eòlaichean sin, dè na duilgheadasan gnìomhachais a dh’ fhuasglas iad, dè na sgilean a th ’aca agus dè an ìre a tha iad a’ cosnadh. Thionndaidh an stuth gu bhith mòr, agus mar sin roinn sinn e ann an dà fhoillseachadh.

Anns a 'chiad artaigil, Elena Gerasimova, ceannard na roinne "Saidheans Dàta agus Analytics" ann an Netology, ag innse dè an diofar a th’ ann eadar Neach-saidheans Dàta agus Einnseanair Dàta agus dè na h-innealan leis a bheil iad ag obair.

Mar a tha dreuchdan innleadairean agus luchd-saidheans eadar-dhealaichte

Tha innleadair dàta na eòlaiche a bhios, air an aon làimh, a’ leasachadh, a’ dèanamh deuchainn agus a’ cumail suas bun-structar dàta: stòran-dàta, siostaman stòraidh agus mòr-ghiollachd. Air an làimh eile, is e seo an tè a bhios a 'glanadh agus a' "cìreadh" dàta airson a chleachdadh le luchd-anailis agus luchd-saidheans dàta, is e sin, a 'cruthachadh pìoban giollachd dàta.

Bidh Neach-saidheans Dàta a’ cruthachadh agus a’ trèanadh mhodalan ro-innseach (agus eile) a’ cleachdadh algoirmean ionnsachaidh inneal agus lìonraidhean neural, a’ cuideachadh ghnìomhachasan gus pàtrain falaichte a lorg, leasachaidhean a ro-innse agus prìomh phròiseasan gnìomhachais a bharrachadh.

Is e am prĂŹomh eadar-dhealachadh eadar Neach-saidheans DĂ ta agus Einnseanair DĂ ta gu bheil amasan eadar-dhealaichte aca mar as trice. Bidh an dĂ  chuid ag obair gus dèanamh cinnteach gu bheil dĂ ta ruigsinneach agus de chĂ ileachd Ă rd. Ach bidh Neach-saidheans DĂ ta a’ lorg fhreagairtean dha na ceistean aige agus a’ dèanamh deuchainn air barailean ann an eag-shiostam dĂ ta (mar eisimpleir, stèidhichte air Hadoop), agus bidh Einnseanair DĂ ta a’ cruthachadh loidhne-phĂŹoban airson a bhith a’ seirbheiseachadh algairim ionnsachaidh inneal air a sgrĂŹobhadh le neach-saidheans dĂ ta ann am brabhsair Spark taobh a-staigh an aon rud. eag-shiostam. 

Bheir innleadair dĂ ta luach do ghnĂŹomhachas le bhith ag obair mar phĂ irt de sgioba. Is e an obair aige a bhith na cheangal cudromach eadar diofar chom-pĂ irtichean: bho luchd-leasachaidh gu luchd-cleachdaidh gnĂŹomhachais aithris, agus Ă rdachadh cinneasachd luchd-anailis, bho mhargaidheachd is toradh gu BI. 

Tha Neach-saidheans Dàta, air an làimh eile, a 'gabhail pàirt gnÏomhach ann an ro-innleachd a' chompanaidh agus a 'toirt a-mach lèirsinn, a' dèanamh cho-dhÚnaidhean, a 'cur an gnÏomh algorithms fèin-ghluasaid, a' modaladh agus a 'cruthachadh luach bho dhàta.
Einnseanair Dàta agus Neach-saidheans Dàta: dè an diofar?

Tha obrachadh le dĂ ta fo smachd prionnsapal GIGO (sgudal a-steach - sgudal a-mach): ma bhios sgrĂšdaichean agus luchd-saidheans dĂ ta a’ dèiligeadh ri dĂ ta neo-ullaichte agus a dh’ fhaodadh a bhith ceĂ rr, bidh na toraidhean eadhon a ’cleachdadh na h-algorithms anailis as ionnsaichte ceĂ rr. 

Bidh innleadairean dĂ ta a’ fuasgladh na duilgheadas seo le bhith a’ togail phĂŹoban airson a bhith a’ giullachd, a’ glanadh agus ag atharrachadh dĂ ta agus a’ leigeil le luchd-saidheans dĂ ta obrachadh le dĂ ta Ă rd-inbhe. 

Tha mòran innealan air a’ mhargaidh airson obrachadh le dĂ ta a tha a’ còmhdach gach ĂŹre: bho choltas dĂ ta gu toradh gu deas-bhòrd airson a’ bhĂšird stiĂširidh. Agus tha e cudromach gu bheil an co-dhĂšnadh airson an cleachdadh air a dhèanamh le innleadair - chan ann air sgĂ th gu bheil e fasanta, ach a chionn 's gu bheil e gu mòr a' cuideachadh obair chom-pĂ irtichean eile sa phròiseas. 

Gu gnàthach: ma dh’ fheumas companaidh ceanglaichean a dhèanamh eadar BI agus ETL - a’ luchdachadh dàta agus ag ùrachadh aithisgean, seo bunait dìleab àbhaisteach ris am feum Einnseanair Dàta dèiligeadh (tha e math ma tha ailtire air an sgioba cuideachd).

Dleastanasan innleadair dĂ ta

  • Leasachadh, togail agus cumail suas bun-structair giollachd dĂ ta.
  • A’ lĂ imhseachadh mhearachdan agus a’ cruthachadh pĂŹoban giullachd dĂ ta earbsach.
  • A’ toirt dĂ ta neo-structaraichte bho dhiofar thĂšsan fiĂšghantach chun fhoirm a tha riatanach airson obair sgrĂšdairean.
  • A’ toirt seachad molaidhean gus cunbhalachd agus cĂ ileachd dĂ ta a leasachadh.
  • A’ toirt seachad agus a’ cumail suas an ailtireachd dĂ ta a bhios luchd-saidheans dĂ ta agus luchd-anailis dĂ ta a’ cleachdadh.
  • Pròiseas agus stòradh dĂ ta gu cunbhalach agus gu h-èifeachdach ann am buidheann sgaoilte de dheich no ceudan de luchd-frithealaidh.
  • Dèan measadh air malairt theicnigeach innealan gus ailtirean sĂŹmplidh ach lĂ idir a chruthachadh a mhaireas buaireadh.
  • Smachd agus taic do shruthan dĂ ta agus siostaman co-cheangailte (a’ stèidheachadh sgrĂšdadh agus rabhaidhean).

Tha speisealachadh eile taobh a-staigh slighe Innleadair Dàta - innleadair ML. Ann an ùine ghoirid, tha na h-innleadairean sin gu sònraichte a’ toirt mhodalan ionnsachaidh innealan gu buileachadh agus cleachdadh gnìomhachais. Gu tric, bidh modail a gheibhear bho neach-saidheans dàta mar phàirt de sgrùdadh agus is dòcha nach obraich e ann an suidheachaidhean sabaid.

Dleastanasan neach-saidheans dĂ ta

  • A 'toirt a-mach feartan bho dhĂ ta gus algorithms ionnsachadh innealan a chur an sĂ s.
  • A’ cleachdadh diofar innealan ionnsachaidh inneal gus pĂ train ann an dĂ ta a ro-innse agus a sheòrsachadh.
  • Ag adhartachadh coileanadh agus neo-mhearachdachd algorithms ionnsachadh innealan le bhith a’ gleusadh agus a’ dèanamh an fheum as fheĂ rr de na h-algorithms.
  • Cruthachadh barailean “lĂ idir” a rèir ro-innleachd na companaidh a dh’ fheumar a dhearbhadh.

Bidh an dà chuid Einnseanair Dàta agus Neach-saidheans Dàta a’ cur gu mòr ri leasachadh cultar dàta, tron ​​​​urrainn do chompanaidh prothaidean a bharrachd a ghineadh no cosgaisean a lughdachadh.

Dè na cànanan agus innealan leis a bheil innleadairean agus luchd-saidheans ag obair?

An-diugh, tha na dĂšilean airson luchd-saidheans dĂ ta air atharrachadh. Roimhe sin, chruinnich innleadairean ceistean mòra SQL, sgrĂŹobh iad le lĂ imh MapReduce agus giullachd dĂ ta a’ cleachdadh innealan leithid Informatica ETL, Pentaho ETL, Talend. 

Ann an 2020, chan urrainn dha speisealaiche dèanamh gun eòlas air Python agus innealan àireamhachaidh ùr-nodha (mar eisimpleir, Airflow), tuigse air prionnsapalan obrachadh le àrd-ùrlaran sgòthan (gan cleachdadh gus sàbhaladh air bathar-cruaidh, fhad ‘s a tha iad a’ cumail ri prionnsapalan tèarainteachd).

Tha SAP, Oracle, MySQL, Redis nan innealan traidiseanta airson innleadairean dĂ ta ann an companaidhean mòra. Tha iad math, ach tha cosgais cheadan cho Ă rd is nach eil ionnsachadh a bhith ag obair còmhla riutha a’ dèanamh ciall ach ann am pròiseactan gnĂŹomhachais. Aig an aon Ă m, tha roghainn eile an-asgaidh ann an cruth Postgres - tha e an-asgaidh agus freagarrach chan ann a-mhĂ in airson trèanadh. 

Einnseanair Dàta agus Neach-saidheans Dàta: dè an diofar?
Gu h-eachdraidheil, lorgar iarrtasan airson Java agus Scala gu tric, ged mar a bhios teicneòlasan agus dòighean-obrach a’ fàs, tha na cànanan sin a’ seargadh a-steach don chùl-raon.

Ach, chan eil cruaidh-chruaidh BigData: Hadoop, Spark agus an còrr den sĂš riatanach tuilleadh airson innleadair dĂ ta, ach seòrsa de dh’ innealan airson fuasgladh fhaighinn air duilgheadasan nach gabh fhuasgladh le ETL traidiseanta. 

Is e an gluasad seirbheisean airson innealan a chleachdadh gun eòlas air a ’chànan anns a bheil iad sgrìobhte (mar eisimpleir, Hadoop gun eòlas air Java), a bharrachd air a bhith a’ toirt seachad seirbheisean deiseil airson a bhith a ’giullachd dàta sruthadh (aithneachadh guth no aithneachadh ìomhaigh air bhidio). ).

Tha fèill mhòr air fuasglaidhean gnÏomhachais bho SAS agus SPSS, agus tha Tableau, Rapidminer, Stata agus Julia cuideachd air an cleachdadh gu farsaing le luchd-saidheans dàta airson gnÏomhan ionadail.

Einnseanair Dàta agus Neach-saidheans Dàta: dè an diofar?
Nochd an comas pĂŹoban a thogail iad fhèin do luchd-anailis agus luchd-saidheans dĂ ta dĂŹreach bliadhna no dhĂ  air ais: mar eisimpleir, tha e comasach mar-thĂ  dĂ ta a chuir gu stòr stèidhichte air PostgreSQL a ’cleachdadh sgriobtaichean an ĂŹre mhath sĂŹmplidh. 

Mar as trice, tha cleachdadh pÏoban agus structaran dàta amalaichte fhathast an urra ri innleadairean dàta. Ach an-diugh, tha an gluasad airson eòlaichean cumadh T le comasan farsaing ann an raointean co-cheangailte nas làidire na bha e a-riamh, leis gu bheil innealan an-còmhnaidh air an sÏmpleachadh.

Carson a bhios Einnseanair Dàta agus Neach-saidheans Dàta ag obair còmhla

Le bhith ag obair gu dlùth le innleadairean, faodaidh Luchd-saidheans Dàta fòcas a chuir air an taobh rannsachaidh, a’ cruthachadh algoirmean ionnsachaidh inneal deiseil airson cinneasachadh.
Agus feumaidh innleadairean fòcas a chuir air scalability, ath-chleachdadh dàta, agus dèanamh cinnteach gu bheil pìoban cuir a-steach agus toraidh dàta anns gach pròiseact fa leth a’ cumail ri ailtireachd na cruinne.

Tha an dealachadh seo de dhleastanasan a’ dèanamh cinnteach Ă  cunbhalachd thar sgiobaidhean a tha ag obair air diofar phròiseactan ionnsachadh innealan. 

Bidh co-obrachadh a’ cuideachadh le bhith a’ cruthachadh thoraidhean Ăšra gu h-èifeachdach. Tha astar agus cĂ ileachd air an coileanadh tro chothromachadh eadar a bhith a’ cruthachadh seirbheis airson a h-uile duine (stòradh cruinne no amalachadh clĂ ran-dannsa) agus a’ buileachadh gach feum no pròiseact sònraichte (loidhne-phĂŹoban air leth sònraichte, a’ ceangal stòran taobh a-muigh). 

Le bhith ag obair gu dlùth le luchd-saidheans dàta agus luchd-anailis bidh innleadairean a’ leasachadh sgilean mion-sgrùdaidh agus rannsachaidh gus còd nas fheàrr a sgrìobhadh. Bidh roinneadh fiosrachaidh am measg luchd-cleachdaidh taigh-bathair agus lochan dàta a’ leasachadh, a’ dèanamh phròiseactan nas sùbailte agus a’ lìbhrigeadh toraidhean fad-ùine nas seasmhaiche.

Ann an companaidhean a tha ag amas air cultar a leasachadh de bhith ag obair le dĂ ta agus a’ togail phròiseasan gnĂŹomhachais stèidhichte orra, bidh Neach-saidheans DĂ ta agus Einnseanair DĂ ta a’ cur ri chèile agus a’ cruthachadh siostam sgrĂšdaidh dĂ ta iomlan. 

Anns an ath artaigil bruidhnidh sinn mu dè an seòrsa foghlaim a bu chòir a bhith aig Einnseanair Dàta agus Luchd-saidheans Dàta, dè na sgilean a dh’ fheumas iad a leasachadh agus mar a tha a’ mhargaidh ag obair.

Bho luchd-deasachaidh Netology

Ma tha thu a’ coimhead air dreuchd Einnseanair Dàta no Neach-saidheans Dàta, tha sinn a’ toirt cuireadh dhut na prògraman cùrsa againn a sgrùdadh:

Source: www.habr.com