Piezīmes Datums Zinātnieks: ar ko sākt un vai tas ir nepiecieŔams?

Piezīmes Datums Zinātnieks: ar ko sākt un vai tas ir nepiecieŔams?

TL;DR ir ieraksts jautājumiem/atbildēm par datu zinātni un to, kā iekļūt profesijā un attÄ«stÄ«ties tajā. Rakstā analizÄ“Å”u pamatprincipus un FAQ un esmu gatavs atbildēt uz JÅ«su konkrētajiem jautājumiem - rakstiet komentāros (vai privātā ziņā), mēģināŔu uz visu atbildēt dažu dienu laikā.

LÄ«dz ar piezÄ«mju sērijas ā€œSatanist Dateā€ parādÄ«Å”anos tika saņemti daudzi ziņojumi un komentāri ar jautājumiem par to, kā sākt un kur rakt, un Å”odien mēs analizēsim galvenās prasmes un jautājumus, kas radās pēc publikācijām.

Viss Å”eit teiktais nepretendē uz galÄ«go patiesÄ«bu un ir autora subjektÄ«vs viedoklis. ApskatÄ«sim galvenās lietas, kas Å”ajā procesā Ŕķiet vissvarÄ«gākās.

Kāpēc tieÅ”i tas ir vajadzÄ«gs?

Lai mērÄ·is bÅ«tu labāk sasniedzams, lai tas izskatās vismaz kaut cik specifisks ā€“ vēlies kļūt par DS vai pētnieku Facebook/Apple/Amazon/Netflix/Google ā€“ apskati prasÄ«bas, valodas un nepiecieÅ”amās prasmes konkrēti kuram amatam. Kāds ir darbā pieņemÅ”anas process? Kā paiet parasta diena Ŕādā lomā? Kā izskatās vidējais tur strādājoŔā cilvēka profils?

Bieži vien kopējā aina ir tāda, ka cilvēks Ä«sti nesaprot, ko tieÅ”i viņŔ vēlas un nav lÄ«dz galam skaidrs, kā Å”im neskaidrajam tēlam sagatavoties ā€“ tāpēc ir vērts izveidot vismaz aptuvenu plānu, ko tieÅ”i vēlies.

Konkrēt paÅ”reizējo mērÄ·a skatu

Pat ja tas mainās ceļā un parasti ir normāli mainīt plānus lugas laikā, ir vērts izvirzīt mērķi un koncentrēties uz to, periodiski izvērtēt un pārdomāt.

Vai tā būs vai joprojām ir aktuāla?

Līdz tam laikam, kad izaugsi amatā.

Iedomājieties, ka pirms amata jums jāiegÅ«st doktora grāds, jānostrādā 2-3 gadi nozarē un vispār jāgriež mati, meditējot klosterÄ« - vai datu zinātnē situācija nebÅ«s tāda pati kā kādreiz ar ekonomistiem un juristi? Vai jomā, ar kuru vēlies nodarboties, viss mainÄ«sies lÄ«dz nepazÄ«Å”anai?

Vai nav lielas izredzes, ka tagad visi steigsies tur, un mēs redzēsim attēlu, kurā ir plaÅ”s cilvēku slānis, kas cenÅ”as iekļūt profesijā - un bÅ«s vienkārÅ”i niecÄ«ga starta pozÄ«cija.

Izvēloties ceļu, iespējams, ir vērts ņemt vērā paÅ”reizējās tendences, ne tikai paÅ”reizējo stāvokli darba tirgÅ«, bet arÄ« savu priekÅ”statu par to, kā tas mainās un kur tas atrodas.

Piemēram, autors neplānoja kļūt par sātanistu, bet doktora grāda iegÅ«Å”anas laikā strādāja pie treÅ”o puÅ”u projektiem, kuriem bija spēcÄ«gas kopÄ«gas prasmes ar DS, un pēc augstskolas beigām viņŔ dabiski pārgāja uz vidi, redzot labu pozÄ«ciju.

Ja lugas gaitā izrādÄ«sies, ka vajadzēs pārcelties kaut kur citur - jo tur Å”obrÄ«d ir visvairāk kustÄ«bu un notiek visa interesantākā darbÄ«ba, tad mēs tur pārcelsimies dabiski.

Prasmju sadalījums

Å Ä«s ir nosacÄ«tas prasmju kategorijas, kas man Ŕķiet galvenās pilnvērtÄ«gam un efektÄ«vam darbam DS. AtseviŔķi izcelÅ”u angļu valodu ā€” mācieties visu, ko darāt CS. Tālāk ir galvenās kategorijas.

ProgrammēŔana/skriptēŔana

Ar kādām valodām jÅ«s noteikti iepazÄ«sities? Python? Java? Shell skriptÄ“Å”ana? Lua? SQL? C++?

Kas tieÅ”i jums ir jāprot un kāpēc programmÄ“Å”anas ziņā - pozÄ«ciju klāsts Å”eit ir ļoti atŔķirÄ«gs.

Piemēram, man bieži ir jāīsteno sarežģīta loģika, vaicājumi, modeļi, analītika un vispārēji jāizstrādā interpretētas sistēmas, taču gandrīz nekad nav prasības attiecībā uz koda ātrumu, izņemot vispārīgākās un saprātīgākās.

Tāpēc mans prasmju kopums ļoti atŔķiras no tiem, kuri raksta Tensorflow bibliotēku un domā par koda optimizāciju efektÄ«vai l1 keÅ”atmiņas izmantoÅ”anai un tamlÄ«dzÄ«gām lietām, tāpēc paskatieties, kas tieÅ”i jums nepiecieÅ”ams, un novērtējiet pareizo ceļu uz mācÄ«Å”anos.

Piemēram, pitonam cilvēki jau izdomā karte valodu apguve.

Protams, jÅ«su vajadzÄ«bām jau ir pieredzējuÅ”i padomi un labi avoti - jums ir jāizlemj par sarakstu un jāsāk pie tā strādāt.

Izpratne par biznesa procesiem

Bez tā jÅ«s nekur nevarat iziet: jums ir jāsaprot, kāpēc jÅ«s esat vajadzÄ«gs Å”ajā procesā, ko jÅ«s darāt un kāpēc. Bieži vien tas var ietaupÄ«t daudz laika, palielināt jÅ«su labumu un netērēt laiku un resursus muļķībām.

Parasti es sev uzdodu Ŕādus jautājumus:

  • Ko Ä«sti es daru uzņēmumā?
  • Kāpēc?
  • Kas un kā to izmantos?
  • Kādas iespējas man ir?
  • Kādas ir parametru robežas?

Å eit ir nedaudz sÄ«kāk par parametriem: jÅ«s bieži varat ievērojami mainÄ«t darba scenāriju, ja zināt, ka kaut ko var upurēt: piemēram, interpretējamÄ«ba vai otrādi, pāris procenti Å”eit nespēlēs lomu, un mums ir ļoti ātrs. risinājums, un klientam tas ir vajadzÄ«gs, jo viņŔ maksā par cauruļvada darbÄ«bas laiku AWS.

Matemātika

Å eit tu pats visu domā un saproti - bez elementārām matemātikas zināŔanām jÅ«s neesat nekas vairāk kā mērkaÄ·i ar granātu (piedodiet Random Forest) - tātad jāsaprot vismaz elementāras lietas. Ja es sastādÄ«tu ļoti minimālu sarakstu, tajā bÅ«tu:

  • Lineārā algebra - ļoti daudz resursu ir viegli pārmeklēt Google, meklējiet sev piemērotāko;
  • Matemātiskā analÄ«ze - (vismaz pirmajos divos semestros);
  • VarbÅ«tÄ«bu teorija ir visur maŔīnmācÄ«bā;
  • Kombinatorika ā€“ tā faktiski papildina teoriju;
  • Grafu teorija - vismaz BASIC;
  • Algoritmi - vismaz pirmajos divos semestros (sk. Kormena ieteikumus viņa grāmatā);
  • Mathlogic - vismaz pamata.

Praktiskā datu analīze un vizualizācija

Viena no svarÄ«gākajām lietām ir nebaidÄ«ties nosmērēt savus datus ar datiem un veikt visaptveroÅ”u datu kopas, projekta analÄ«zi un izveidot ātru datu vizualizāciju.

Izpētes datu analÄ«zei vienkārÅ”i jākļūst par kaut ko dabisku, tāpat kā visām citām datu transformācijām un iespējai no unix mezgliem izveidot vienkārÅ”u konveijeru (skat. iepriekŔējos rakstus) vai uzrakstÄ«t lasāmu un saprotamu piezÄ«mju grāmatiņu.

Es gribētu pieminēt vizualizāciju: labāk vienu reizi redzēt, nekā simts reizes dzirdēt.

Diagrammas parādÄ«Å”ana pārvaldniekam ir simts reižu vieglāka un skaidrāka nekā skaitļu kopa, tāpēc matplotlib, seaborn un ggplot2 ir jÅ«su draugi.

Mīkstās prasmes

Tikpat svarÄ«gi ir spēt komunicēt citiem savas idejas, kā arÄ« rezultātus un bažas (utt.) ā€“ pārliecinieties, ka varat skaidri formulēt uzdevumu gan tehniskā, gan biznesa ziņā.

JÅ«s varat izskaidrot kolēģiem, vadÄ«tājiem, priekÅ”niekiem, klientiem un ikvienam citam, kam tas ir nepiecieÅ”ams, kas notiek, kādus datus izmantojat un kādus rezultātus esat ieguvis.

Jūsu diagrammas un dokumentācija ir jālasa bez jums. Tas ir, jums nav jādodas pie jums, lai saprastu, kas tur ir rakstīts.

Varat izveidot skaidru prezentāciju, lai saprastu būtību un/vai dokumentētu projektu/savu darbu.

JÅ«s varat izteikt savu nostāju argumentēti un bez emocijām, pateikt ā€œjā/nēā€ vai apÅ”aubÄ«t/atbalstÄ«t lēmumu.

treniņŔ

Ir daudz dažādu vietu, kur to visu var apgÅ«t. IesniegÅ”u Ä«su sarakstu - no tā izmēģināju visu un, godÄ«gi sakot, katrai precei ir savi plusi un mÄ«nusi. Izmēģiniet to un izlemiet, kas jums ir piemērots, taču es ļoti iesaku izmēģināt vairākas iespējas un nepieÄ·erties pie vienas.

  • TieÅ”saistes kursi: coursera, udacity, Edx utt.;
  • Jaunas skolas: tieÅ”saistē un bezsaistē - SkillFactory, Shad, MADE;
  • Klasiskās skolas: augstskolu maÄ£istra programmas un kvalifikācijas paaugstināŔanas kursi;
  • Projekti - jÅ«s varat vienkārÅ”i atlasÄ«t uzdevumus, kas jÅ«s interesē, un izgriezt tos, augÅ”upielādējot tos github;
  • Prakse - Å”eit ir grÅ«ti kaut ko ieteikt, jums ir jāmeklē, kas ir pieejams, un jāatrod piemērotas iespējas.

Vai tas ir nepiecieŔams?

Nobeigumā es droÅ”i vien pievienoÅ”u trÄ«s personiskos principus, kurus cenÅ”os ievērot pats.

  • JābÅ«t interesantam;
  • Nesiet iekŔēju baudu (= vismaz nesagādājiet cieÅ”anas);
  • "Lai bÅ«tu tavs."

Kāpēc viņi? Ir grūti iedomāties, ka darām kaut ko katru dienu un neizbaudi to vai neinteresē. Iedomājieties, ka esat ārsts un jums nepatīk sazināties ar cilvēkiem - tas, protams, var kaut kā nostrādāt, taču jūs pastāvīgi jutīsities neērti, jo pacientu plūsma vēlas jums kaut ko jautāt. Tas nedarbojas ilgtermiņā.

Kāpēc es Ä«paÅ”i pieminēju iekŔējo baudu? Man Ŕķiet, ka tas ir nepiecieÅ”ams tālākai attÄ«stÄ«bai un principā arÄ« mācÄ«bu procesam. Man ļoti patÄ«k, kad izdodas pabeigt kādu sarežģītu funkciju un izveidot modeli vai aprēķināt svarÄ«gu parametru. Man patÄ«k, ja mans kods ir estētiski skaists un labi uzrakstÄ«ts. Tāpēc apgÅ«t ko jaunu ir interesanti un tieÅ”i neprasa nekādu bÅ«tisku motivāciju.

ā€œBÅ«t tavamā€ ir tāda pati sajÅ«ta, ka tas ir aptuveni tas, ko tu vēlējies darÄ«t. Man ir neliels stāsts. KopÅ” bērnÄ«bas mani interesē rokmÅ«zika (un metāls - SALMON!), un, tāpat kā daudzas citas, es vēlējos iemācÄ«ties spēlēt, un tas arÄ« viss. IzrādÄ«jās, ka man nebija ne dzirdes, ne balss - tas mani nemaz netraucēja (un jāsaka, ka tas netraucē daudzus izpildÄ«tājus tieÅ”i uz skatuves), un, kad es vēl mācÄ«jos skolā, es dabÅ«ju Ä£itāru... un kļuva skaidrs, ka man ļoti nepatÄ«k stundām ilgi sēdēt un spēlēt. Gāja grÅ«ti, man vienmēr Ŕķita, ka iznāk kaut kādas muļķības - es no tā nesaņēmu nekādu prieku un vienkārÅ”i jutos draņķīgs, stulbs un pilnÄ«gi nespējÄ«gs. Es burtiski piespiedu sevi apsēsties uz nodarbÄ«bām un vispār zirgam tā nebija laba barÄ«ba.

Tajā paŔā laikā es varēju diezgan mierÄ«gi sēdēt stundām ilgi, izstrādājot kādu rotaļlietu, izmantojot skriptu, lai kaut ko animētu uz zibatmiņas (vai kaut ko citu), un man bija mežonÄ«ga motivācija pabeigt spēles elementus vai nodarboties ar kustÄ«bu un/vai mehāniku. treÅ”o puÅ”u bibliotēku, spraudņu un visa pārējā savienoÅ”ana.

Un kādā brīdī es sapratu, ka ģitāras spēle nav mana lieta un man ļoti patīk klausīties, nevis spēlēt. Un manas acis mirdzēja, kad rakstīju spēles un kodu (tajā brīdī klausījos visdažādāko metālu), un tas man toreiz patika, un ar to man arī vajadzēja nodarboties.

Vai jums ir vēl kādi jautājumi?

Protams, mēs nevarējām izskatÄ«t visas tēmas un jautājumus, tāpēc rakstiet komentārus un rakstiet man PM ā€” vienmēr priecājos par jautājumiem.

Piezīmes Datums Zinātnieks: ar ko sākt un vai tas ir nepiecieŔams?

Piezīmes Datums Zinātnieks: ar ko sākt un vai tas ir nepiecieŔams?

Avots: www.habr.com

Pievieno komentāru