TL;DR ir ieraksts jautÄjumiem/atbildÄm par datu zinÄtni un to, kÄ iekļūt profesijÄ un attÄ«stÄ«ties tajÄ. RakstÄ analizÄÅ”u pamatprincipus un FAQ un esmu gatavs atbildÄt uz JÅ«su konkrÄtajiem jautÄjumiem - rakstiet komentÄros (vai privÄtÄ ziÅÄ), mÄÄ£inÄÅ”u uz visu atbildÄt dažu dienu laikÄ.
LÄ«dz ar piezÄ«mju sÄrijas āSatanist Dateā parÄdÄ«Å”anos tika saÅemti daudzi ziÅojumi un komentÄri ar jautÄjumiem par to, kÄ sÄkt un kur rakt, un Å”odien mÄs analizÄsim galvenÄs prasmes un jautÄjumus, kas radÄs pÄc publikÄcijÄm.
Viss Å”eit teiktais nepretendÄ uz galÄ«go patiesÄ«bu un ir autora subjektÄ«vs viedoklis. ApskatÄ«sim galvenÄs lietas, kas Å”ajÄ procesÄ Å”Ä·iet vissvarÄ«gÄkÄs.
KÄpÄc tieÅ”i tas ir vajadzÄ«gs?
Lai mÄrÄ·is bÅ«tu labÄk sasniedzams, lai tas izskatÄs vismaz kaut cik specifisks ā vÄlies kļūt par DS vai pÄtnieku Facebook/Apple/Amazon/Netflix/Google ā apskati prasÄ«bas, valodas un nepiecieÅ”amÄs prasmes konkrÄti kuram amatam. KÄds ir darbÄ pieÅemÅ”anas process? KÄ paiet parasta diena Å”ÄdÄ lomÄ? KÄ izskatÄs vidÄjais tur strÄdÄjoÅ”Ä cilvÄka profils?
Bieži vien kopÄjÄ aina ir tÄda, ka cilvÄks Ä«sti nesaprot, ko tieÅ”i viÅÅ” vÄlas un nav lÄ«dz galam skaidrs, kÄ Å”im neskaidrajam tÄlam sagatavoties ā tÄpÄc ir vÄrts izveidot vismaz aptuvenu plÄnu, ko tieÅ”i vÄlies.
KonkrÄt paÅ”reizÄjo mÄrÄ·a skatu
Pat ja tas mainÄs ceÄ¼Ä un parasti ir normÄli mainÄ«t plÄnus lugas laikÄ, ir vÄrts izvirzÄ«t mÄrÄ·i un koncentrÄties uz to, periodiski izvÄrtÄt un pÄrdomÄt.
Vai tÄ bÅ«s vai joprojÄm ir aktuÄla?
LÄ«dz tam laikam, kad izaugsi amatÄ.
IedomÄjieties, ka pirms amata jums jÄiegÅ«st doktora grÄds, jÄnostrÄdÄ 2-3 gadi nozarÄ un vispÄr jÄgriež mati, meditÄjot klosterÄ« - vai datu zinÄtnÄ situÄcija nebÅ«s tÄda pati kÄ kÄdreiz ar ekonomistiem un juristi? Vai jomÄ, ar kuru vÄlies nodarboties, viss mainÄ«sies lÄ«dz nepazÄ«Å”anai?
Vai nav lielas izredzes, ka tagad visi steigsies tur, un mÄs redzÄsim attÄlu, kurÄ ir plaÅ”s cilvÄku slÄnis, kas cenÅ”as iekļūt profesijÄ - un bÅ«s vienkÄrÅ”i niecÄ«ga starta pozÄ«cija.
IzvÄloties ceļu, iespÄjams, ir vÄrts Åemt vÄrÄ paÅ”reizÄjÄs tendences, ne tikai paÅ”reizÄjo stÄvokli darba tirgÅ«, bet arÄ« savu priekÅ”statu par to, kÄ tas mainÄs un kur tas atrodas.
PiemÄram, autors neplÄnoja kļūt par sÄtanistu, bet doktora grÄda iegÅ«Å”anas laikÄ strÄdÄja pie treÅ”o puÅ”u projektiem, kuriem bija spÄcÄ«gas kopÄ«gas prasmes ar DS, un pÄc augstskolas beigÄm viÅÅ” dabiski pÄrgÄja uz vidi, redzot labu pozÄ«ciju.
Ja lugas gaitÄ izrÄdÄ«sies, ka vajadzÄs pÄrcelties kaut kur citur - jo tur Å”obrÄ«d ir visvairÄk kustÄ«bu un notiek visa interesantÄkÄ darbÄ«ba, tad mÄs tur pÄrcelsimies dabiski.
Prasmju sadalījums
Å Ä«s ir nosacÄ«tas prasmju kategorijas, kas man Ŕķiet galvenÄs pilnvÄrtÄ«gam un efektÄ«vam darbam DS. AtseviŔķi izcelÅ”u angļu valodu ā mÄcieties visu, ko darÄt CS. TÄlÄk ir galvenÄs kategorijas.
ProgrammÄÅ”ana/skriptÄÅ”ana
Ar kÄdÄm valodÄm jÅ«s noteikti iepazÄ«sities? Python? Java? Shell skriptÄÅ”ana? Lua? SQL? C++?
Kas tieÅ”i jums ir jÄprot un kÄpÄc programmÄÅ”anas ziÅÄ - pozÄ«ciju klÄsts Å”eit ir ļoti atŔķirÄ«gs.
PiemÄram, man bieži ir jÄÄ«steno sarežģīta loÄ£ika, vaicÄjumi, modeļi, analÄ«tika un vispÄrÄji jÄizstrÄdÄ interpretÄtas sistÄmas, taÄu gandrÄ«z nekad nav prasÄ«bas attiecÄ«bÄ uz koda Ätrumu, izÅemot vispÄrÄ«gÄkÄs un saprÄtÄ«gÄkÄs.
TÄpÄc mans prasmju kopums ļoti atŔķiras no tiem, kuri raksta Tensorflow bibliotÄku un domÄ par koda optimizÄciju efektÄ«vai l1 keÅ”atmiÅas izmantoÅ”anai un tamlÄ«dzÄ«gÄm lietÄm, tÄpÄc paskatieties, kas tieÅ”i jums nepiecieÅ”ams, un novÄrtÄjiet pareizo ceļu uz mÄcÄ«Å”anos.
PiemÄram, pitonam cilvÄki jau izdomÄ
Protams, jÅ«su vajadzÄ«bÄm jau ir pieredzÄjuÅ”i padomi un labi avoti - jums ir jÄizlemj par sarakstu un jÄsÄk pie tÄ strÄdÄt.
Izpratne par biznesa procesiem
Bez tÄ jÅ«s nekur nevarat iziet: jums ir jÄsaprot, kÄpÄc jÅ«s esat vajadzÄ«gs Å”ajÄ procesÄ, ko jÅ«s darÄt un kÄpÄc. Bieži vien tas var ietaupÄ«t daudz laika, palielinÄt jÅ«su labumu un netÄrÄt laiku un resursus muļķībÄm.
Parasti es sev uzdodu Å”Ädus jautÄjumus:
- Ko Ä«sti es daru uzÅÄmumÄ?
- KÄpÄc?
- Kas un kÄ to izmantos?
- KÄdas iespÄjas man ir?
- KÄdas ir parametru robežas?
Å eit ir nedaudz sÄ«kÄk par parametriem: jÅ«s bieži varat ievÄrojami mainÄ«t darba scenÄriju, ja zinÄt, ka kaut ko var upurÄt: piemÄram, interpretÄjamÄ«ba vai otrÄdi, pÄris procenti Å”eit nespÄlÄs lomu, un mums ir ļoti Ätrs. risinÄjums, un klientam tas ir vajadzÄ«gs, jo viÅÅ” maksÄ par cauruļvada darbÄ«bas laiku AWS.
MatemÄtika
Å eit tu pats visu domÄ un saproti - bez elementÄrÄm matemÄtikas zinÄÅ”anÄm jÅ«s neesat nekas vairÄk kÄ mÄrkaÄ·i ar granÄtu (piedodiet Random Forest) - tÄtad jÄsaprot vismaz elementÄras lietas. Ja es sastÄdÄ«tu ļoti minimÄlu sarakstu, tajÄ bÅ«tu:
- LineÄrÄ algebra - ļoti daudz resursu ir viegli pÄrmeklÄt Google, meklÄjiet sev piemÄrotÄko;
- MatemÄtiskÄ analÄ«ze - (vismaz pirmajos divos semestros);
- VarbÅ«tÄ«bu teorija ir visur maŔīnmÄcÄ«bÄ;
- Kombinatorika ā tÄ faktiski papildina teoriju;
- Grafu teorija - vismaz BASIC;
- Algoritmi - vismaz pirmajos divos semestros (sk. Kormena ieteikumus viÅa grÄmatÄ);
- Mathlogic - vismaz pamata.
PraktiskÄ datu analÄ«ze un vizualizÄcija
Viena no svarÄ«gÄkajÄm lietÄm ir nebaidÄ«ties nosmÄrÄt savus datus ar datiem un veikt visaptveroÅ”u datu kopas, projekta analÄ«zi un izveidot Ätru datu vizualizÄciju.
IzpÄtes datu analÄ«zei vienkÄrÅ”i jÄkļūst par kaut ko dabisku, tÄpat kÄ visÄm citÄm datu transformÄcijÄm un iespÄjai no unix mezgliem izveidot vienkÄrÅ”u konveijeru (skat. iepriekÅ”Äjos rakstus) vai uzrakstÄ«t lasÄmu un saprotamu piezÄ«mju grÄmatiÅu.
Es gribÄtu pieminÄt vizualizÄciju: labÄk vienu reizi redzÄt, nekÄ simts reizes dzirdÄt.
Diagrammas parÄdÄ«Å”ana pÄrvaldniekam ir simts reižu vieglÄka un skaidrÄka nekÄ skaitļu kopa, tÄpÄc matplotlib, seaborn un ggplot2 ir jÅ«su draugi.
MÄ«kstÄs prasmes
Tikpat svarÄ«gi ir spÄt komunicÄt citiem savas idejas, kÄ arÄ« rezultÄtus un bažas (utt.) ā pÄrliecinieties, ka varat skaidri formulÄt uzdevumu gan tehniskÄ, gan biznesa ziÅÄ.
JÅ«s varat izskaidrot kolÄÄ£iem, vadÄ«tÄjiem, priekÅ”niekiem, klientiem un ikvienam citam, kam tas ir nepiecieÅ”ams, kas notiek, kÄdus datus izmantojat un kÄdus rezultÄtus esat ieguvis.
JÅ«su diagrammas un dokumentÄcija ir jÄlasa bez jums. Tas ir, jums nav jÄdodas pie jums, lai saprastu, kas tur ir rakstÄ«ts.
Varat izveidot skaidru prezentÄciju, lai saprastu bÅ«tÄ«bu un/vai dokumentÄtu projektu/savu darbu.
JÅ«s varat izteikt savu nostÄju argumentÄti un bez emocijÄm, pateikt ājÄ/nÄā vai apÅ”aubÄ«t/atbalstÄ«t lÄmumu.
treniÅÅ”
Ir daudz dažÄdu vietu, kur to visu var apgÅ«t. IesniegÅ”u Ä«su sarakstu - no tÄ izmÄÄ£inÄju visu un, godÄ«gi sakot, katrai precei ir savi plusi un mÄ«nusi. IzmÄÄ£iniet to un izlemiet, kas jums ir piemÄrots, taÄu es ļoti iesaku izmÄÄ£inÄt vairÄkas iespÄjas un nepieÄ·erties pie vienas.
- TieŔsaistes kursi: coursera, udacity, Edx utt.;
- Jaunas skolas: tieÅ”saistÄ un bezsaistÄ - SkillFactory, Shad, MADE;
- KlasiskÄs skolas: augstskolu maÄ£istra programmas un kvalifikÄcijas paaugstinÄÅ”anas kursi;
- Projekti - jÅ«s varat vienkÄrÅ”i atlasÄ«t uzdevumus, kas jÅ«s interesÄ, un izgriezt tos, augÅ”upielÄdÄjot tos github;
- Prakse - Å”eit ir grÅ«ti kaut ko ieteikt, jums ir jÄmeklÄ, kas ir pieejams, un jÄatrod piemÄrotas iespÄjas.
Vai tas ir nepiecieŔams?
NobeigumÄ es droÅ”i vien pievienoÅ”u trÄ«s personiskos principus, kurus cenÅ”os ievÄrot pats.
- JÄbÅ«t interesantam;
- Nesiet iekÅ”Äju baudu (= vismaz nesagÄdÄjiet cieÅ”anas);
- "Lai būtu tavs."
KÄpÄc viÅi? Ir grÅ«ti iedomÄties, ka darÄm kaut ko katru dienu un neizbaudi to vai neinteresÄ. IedomÄjieties, ka esat Ärsts un jums nepatÄ«k sazinÄties ar cilvÄkiem - tas, protams, var kaut kÄ nostrÄdÄt, taÄu jÅ«s pastÄvÄ«gi jutÄ«sities neÄrti, jo pacientu plÅ«sma vÄlas jums kaut ko jautÄt. Tas nedarbojas ilgtermiÅÄ.
KÄpÄc es Ä«paÅ”i pieminÄju iekÅ”Äjo baudu? Man Ŕķiet, ka tas ir nepiecieÅ”ams tÄlÄkai attÄ«stÄ«bai un principÄ arÄ« mÄcÄ«bu procesam. Man ļoti patÄ«k, kad izdodas pabeigt kÄdu sarežģītu funkciju un izveidot modeli vai aprÄÄ·inÄt svarÄ«gu parametru. Man patÄ«k, ja mans kods ir estÄtiski skaists un labi uzrakstÄ«ts. TÄpÄc apgÅ«t ko jaunu ir interesanti un tieÅ”i neprasa nekÄdu bÅ«tisku motivÄciju.
āBÅ«t tavamā ir tÄda pati sajÅ«ta, ka tas ir aptuveni tas, ko tu vÄlÄjies darÄ«t. Man ir neliels stÄsts. KopÅ” bÄrnÄ«bas mani interesÄ rokmÅ«zika (un metÄls - SALMON!), un, tÄpat kÄ daudzas citas, es vÄlÄjos iemÄcÄ«ties spÄlÄt, un tas arÄ« viss. IzrÄdÄ«jÄs, ka man nebija ne dzirdes, ne balss - tas mani nemaz netraucÄja (un jÄsaka, ka tas netraucÄ daudzus izpildÄ«tÄjus tieÅ”i uz skatuves), un, kad es vÄl mÄcÄ«jos skolÄ, es dabÅ«ju Ä£itÄru... un kļuva skaidrs, ka man ļoti nepatÄ«k stundÄm ilgi sÄdÄt un spÄlÄt. GÄja grÅ«ti, man vienmÄr Ŕķita, ka iznÄk kaut kÄdas muļķības - es no tÄ nesaÅÄmu nekÄdu prieku un vienkÄrÅ”i jutos draÅÄ·Ä«gs, stulbs un pilnÄ«gi nespÄjÄ«gs. Es burtiski piespiedu sevi apsÄsties uz nodarbÄ«bÄm un vispÄr zirgam tÄ nebija laba barÄ«ba.
TajÄ paÅ”Ä laikÄ es varÄju diezgan mierÄ«gi sÄdÄt stundÄm ilgi, izstrÄdÄjot kÄdu rotaļlietu, izmantojot skriptu, lai kaut ko animÄtu uz zibatmiÅas (vai kaut ko citu), un man bija mežonÄ«ga motivÄcija pabeigt spÄles elementus vai nodarboties ar kustÄ«bu un/vai mehÄniku. treÅ”o puÅ”u bibliotÄku, spraudÅu un visa pÄrÄjÄ savienoÅ”ana.
Un kÄdÄ brÄ«dÄ« es sapratu, ka Ä£itÄras spÄle nav mana lieta un man ļoti patÄ«k klausÄ«ties, nevis spÄlÄt. Un manas acis mirdzÄja, kad rakstÄ«ju spÄles un kodu (tajÄ brÄ«dÄ« klausÄ«jos visdažÄdÄko metÄlu), un tas man toreiz patika, un ar to man arÄ« vajadzÄja nodarboties.
Vai jums ir vÄl kÄdi jautÄjumi?
Protams, mÄs nevarÄjÄm izskatÄ«t visas tÄmas un jautÄjumus, tÄpÄc rakstiet komentÄrus un rakstiet man PM ā vienmÄr priecÄjos par jautÄjumiem.
Avots: www.habr.com