Mga Nota Petsa Scientist: asa magsugod ug kinahanglan ba kini?

Mga Nota Petsa Scientist: asa magsugod ug kinahanglan ba kini?

Ang TL; DR usa ka post alang sa mga pangutana / tubag bahin sa Data Science ug kung giunsa ang pagsulod sa propesyon ug pag-uswag niini. Sa artikulo akong analisahon ang mga sukaranan nga mga prinsipyo ug FAQ ug andam ko nga tubagon ang imong piho nga mga pangutana - isulat sa mga komento (o sa usa ka pribado nga mensahe), sulayan nako nga tubagon ang tanan sulod sa pipila ka mga adlaw.

Uban sa pag-abut sa "Satanist Date" nga serye sa mga nota, daghang mga mensahe ug komento ang miabut uban ang mga pangutana kon unsaon pagsugod ug asa pagkalot, ug karon atong analisahon ang mga nag-unang kahanas ug mga pangutana nga mitungha human sa mga publikasyon.

Ang tanan nga gipahayag dinhi wala mag-angkon nga ang katapusang kamatuoran ug mao ang suhetibong opinyon sa tagsulat. Atong tan-awon ang mga nag-unang butang nga ingon og labing hinungdanon sa proseso.

Ngano nga gikinahanglan gayud kini?

Aron ang tumong mahimong mas maayo nga makab-ot, aron kini tan-awon sa labing menos medyo espesipiko - gusto nimo nga mahimong DS o Research Scientist sa Facebook/Apple/Amazon/Netflix/Google - tan-awa ang mga kinahanglanon, pinulongan ug gikinahanglan nga kahanas ilabi na alang sa unsa nga posisyon. Unsa ang proseso sa pag-hire? Sa unsang paagi ang usa ka kasagarang adlaw moagi sa ingon nga tahas? Unsa ang hitsura sa kasagaran nga profile sa usa ka tawo nga nagtrabaho didto?

Kasagaran ang kinatibuk-ang hulagway mao nga ang usa ka tawo wala gayud makasabut kon unsa gayud ang iyang gusto ug kini dili hingpit nga tin-aw kung unsaon pag-andam alang niining dili klaro nga hulagway - busa kini angay nga adunay labing menos usa ka kasarangan nga plano kung unsa gayud ang imong gusto.

Konkreto ang kasamtangang panglantaw sa tumong

Bisan kung kini magbag-o sa dalan, ug kasagaran normal ang pagbag-o sa mga plano sa panahon sa dula, takus nga adunay usa ka katuyoan ug ipunting kini, matag karon ug unya nga pagtimbang-timbang ug paghunahuna pag-usab.

Mahimo ba kini o kini may kalabutan pa?

Sa panahon nga motubo ka sa usa ka posisyon.

Hunahunaa nga sa wala pa ang imong posisyon kinahanglan nimo nga makakuha usa ka PhD, pagtrabaho sulod sa 2-3 ka tuig sa industriya ug kasagarang putlon ang imong buhok samtang mamalandong sa usa ka monasteryo - dili ba ang kahimtang sa Data Science parehas sa kaniadto sa mga ekonomista ug abogado? Mausab ba ang tanan nga dili mailhan sa lugar nga gusto nimong ipadayon?

Dili ba adunay usa ka maayo nga higayon nga ang tanan magdali karon ug makita namon ang usa ka litrato diin adunay usa ka halapad nga layer sa mga tawo nga naningkamot nga mosulod sa propesyon - ug adunay usa ka gamay nga posisyon sa pagsugod.

Mahimong angay nga tagdon ang karon nga mga uso kung nagpili usa ka agianan, dili lamang ang karon nga kahimtang sa merkado sa pamuo, apan usab ang imong ideya kung giunsa kini pagbag-o ug kung diin kini.

Pananglitan, ang tagsulat wala magplano nga mahimong usa ka Satanista, apan sa panahon sa iyang PhD nagtrabaho siya sa ikatulo nga-partido nga mga proyekto nga adunay lig-on nga mga kahanas sa komon nga uban sa DS, ug sa katapusan sa graduate school siya natural nga mibalhin sa palibot, nga nakakita sa usa ka maayo. posisyon.

Kung sa panahon sa dula nahimo nga kinahanglan nga mobalhin sa laing lugar - tungod kay adunay karon ang labing kadaghan nga paglihok ug ang tanan nga labing makapaikag nga aksyon nahitabo, nan natural nga mobalhin kami didto.

Pagkaguba sa Kahanas

Kini ang mga kondisyonal nga kategorya sa mga kahanas nga para nako mao ang yawe alang sa hingpit ug epektibo nga trabaho sa DS. Gilain nako nga i-highlight ang English - pagkat-on kung unsa ang imong buhaton sa CS. Sunod mao ang yawe nga mga kategorya.

Programming/Scripting

Unsang mga lengguwahe ang sigurado nimong masinati? Python? Java? Shell scripting? Lua? Sql? C++?

Unsa gyud ang kinahanglan nimo nga mahimo ug ngano sa mga termino sa programming - ang lainlaing mga posisyon dinhi magkalainlain kaayo.

Pananglitan, sa kasagaran kinahanglan nakong ipatuman ang komplikadong lohika, mga pangutana, mga modelo, analytics, ug sa kinatibuk-an nga pagpalambo sa mga sistema nga gihubad, apan halos wala'y mga kinahanglanon alang sa katulin sa code, gawas sa labing kasagaran ug makatarunganon nga mga.

Busa, ang akong set sa kahanas lahi kaayo sa mga nagsulat sa Tensorflow library ug naghunahuna bahin sa pag-optimize sa code alang sa episyente nga paggamit sa l1 cache ug parehas nga mga butang, busa tan-awa kung unsa gyud ang imong kinahanglan ug susihon ang husto nga dalan sa pagkat-on.

Pananglitan, alang sa sawa, ang mga tawo naghimo na card pagkat-on sa pinulongan.

Sa tinuud, aduna nay eksperyensiyadong tambag ug maayong mga tinubdan alang sa imong mga panginahanglan - kinahanglan ka nga magdesisyon sa usa ka lista ug magsugod sa pagtrabaho niini.

Pagsabut sa mga proseso sa negosyo

Dili ka makaadto bisan asa kung wala kini: kinahanglan nimong masabtan kung nganong gikinahanglan ka niini nga proseso, unsa ang imong gibuhat ug ngano. Kanunay kini nga makaluwas kanimo usa ka tonelada nga oras, mapadako ang imong mga benepisyo, ug malikayan ang pag-usik sa oras ug mga kahinguhaan sa crap.

Kasagaran, mangutana ko sa akong kaugalingon sa mosunod nga mga pangutana:

  • Unsa man gyud ang akong buhaton sa kompanya?
  • Ngano?
  • Kinsa ang mogamit niini ug unsaon?
  • Unsa akong mga kapilian?
  • Unsa ang mga limitasyon sa mga parameter?

Ania ang usa ka gamay nga dugang nga detalye bahin sa mga parameter: kanunay nimo nga mabag-o ang senaryo sa trabaho kung nahibal-an nimo nga mahimo’g isakripisyo ang usa ka butang: pananglitan, ang interpretability o vice versa, usa ka pares nga porsyento ang dili magdula usa ka papel dinhi ug kami adunay kusog kaayo. solusyon, ug gikinahanglan kini sa kliyente, tungod kay nagbayad siya sa oras nga ang pipeline nagdagan sa AWS.

Matematika

Dinhi imong gihunahuna ug nasabtan ang tanan sa imong kaugalingon - kung wala’y kahibalo sa sukaranan nga matematika, wala ka labi sa mga unggoy nga adunay granada (pasensya Random Forest) - busa kinahanglan nimo nga masabtan ang labing gamay nga sukaranan nga mga butang. Kung mag-compile ako usa ka gamay kaayo nga lista, maglakip kini:

  • Linear algebra - usa ka dako nga gidaghanon sa mga kapanguhaan sayon ​​sa Google, pangitaa kung unsa ang labing angay kanimo;
  • Pagtuki sa matematika - (labing menos sa unang duha ka semestre);
  • Ang teorya sa kalagmitan anaa bisan asa sa pagkat-on sa makina;
  • Combinatorics - kini sa tinuud nga komplementaryo sa teorya;
  • Teorya sa graph - labing menos BASIC;
  • Algorithm - labing menos sa unang duha ka semestre (tan-awa ang mga rekomendasyon ni Cormen sa iyang libro);
  • Mathlogic - labing menos sukaranan.

Praktikal nga pagtuki sa datos ug paghanduraw

Usa sa labing hinungdanon nga mga butang mao ang dili mahadlok nga mahugawan ang imong mga kamot sa datos ug maghimo usa ka komprehensibo nga pagtuki sa dataset, proyekto, ug paghimo usa ka dali nga pagtan-aw sa datos.

Ang pagtuki sa datos sa eksplorasyon kinahanglan nga mahimong natural nga butang, sama sa tanan nga mga pagbag-o sa datos ug ang abilidad sa paghimo sa usa ka yano nga pipeline gikan sa mga unix node (tan-awa ang miaging mga artikulo) o pagsulat usa ka mabasa ug masabtan nga notebook.

Gusto nakong hisgutan ang paghanduraw: mas maayo nga makakita kausa kaysa makadungog sa usa ka gatos ka beses.

Ang pagpakita sa usa ka graph ngadto sa usa ka manedyer usa ka gatos ka pilo nga mas sayon ​​ug mas klaro kaysa usa ka hugpong sa mga numero, mao nga ang matplotlib, seaborn ug ggplot2 imong mga higala.

Hinay nga kahanas

Parehas nga importante nga makahimo sa pagpakigsulti sa imong mga ideya, ingon man sa mga resulta ug mga kabalaka (ug uban pa) ngadto sa uban - siguroha nga imong klaro nga mapahayag ang buluhaton sa teknikal ug negosyo nga mga termino.

Mahimo nimong ipasabut sa mga kauban, manedyer, superyor, kliyente ug bisan kinsa nga nanginahanglan kung unsa ang nanghitabo, kung unsang datos ang imong gigamit ug kung unsa ang mga resulta nga imong nakuha.

Ang imong mga tsart ug dokumentasyon kinahanglang basahon nga wala ka. Sa ato pa, dili nimo kinahanglan nga moadto kanimo aron masabtan kung unsa ang nahisulat didto.

Makahimo ka ug tin-aw nga presentasyon aron makuha ang punto ug/o idokumento ang proyekto/imong trabaho.

Mahimo nimong ipahayag ang imong posisyon sa makatarunganon ug dili emosyonal nga paagi, isulti ang "oo / dili" o pangutana / pagsuporta sa usa ka desisyon.

Mga sesyon sa pagbansay

Adunay daghang lain-laing mga dapit diin kamo makakat-on sa tanan niini. Maghatag ako usa ka mubo nga lista - Gisulayan nako ang tanan gikan niini ug, sa tinuud, ang matag butang adunay mga bentaha ug disbentaha. Sulayi kini ug pagdesisyon kung unsa ang angay kanimo, apan girekomenda nako nga sulayan ang daghang mga kapilian ug dili mag-ipit sa usa.

  • Mga kurso sa online: coursera, udacity, Edx, ug uban pa;
  • Bag-ong mga eskwelahan: online ug offline - SkillFactory, ShAD, MADE;
  • Mga klasikal nga eskwelahan: mga programa sa master sa unibersidad ug mga advanced nga kurso sa pagbansay;
  • Mga proyekto - mahimo nimong pilion ang mga buluhaton nga makapainteres kanimo ug putlon kini, i-upload kini sa github;
  • Mga internship - lisud ang pagsugyot bisan unsa dinhi; kinahanglan nimo pangitaon kung unsa ang magamit ug pangitaa ang angay nga kapilian.

Kinahanglan ba kini?

Sa konklusyon, lagmit akong idugang ang tulo ka personal nga mga prinsipyo nga akong gisulayan nga sundon sa akong kaugalingon.

  • Kinahanglan nga makapaikag;
  • Pagdala sa sulod nga kalipay (= labing menos dili hinungdan sa pag-antos);
  • "Aron mahimong imo."

Ngano sila? Lisud mahanduraw ang pagbuhat sa usa ka butang kada adlaw ug dili malingaw niini o dili interesado. Hunahunaa nga ikaw usa ka doktor ug dili nimo gusto ang pagpakigsulti sa mga tawo - kini, siyempre, mahimo’g molihok, apan kanunay ka nga dili komportable sa dagan sa mga pasyente nga gusto mangutana kanimo. Dili kini molihok sa kadugayan.

Ngano nga espesipiko nakong gihisgutan ang internal nga kalipay? Para nako kini gikinahanglan alang sa dugang nga kalamboan ug, sa prinsipyo, ang proseso sa pagkat-on. Ganahan kaayo ko niini kung makompleto nako ang pipila ka komplikado nga bahin ug maghimo usa ka modelo o makalkula ang usa ka hinungdanon nga parameter. Nalingaw ko niini kung ang akong code nindot kaayo ug maayong pagkasulat. Busa, ang pagkat-on og bag-o makapainteres ug wala direkta nga nagkinahanglan og bisan unsang mahinungdanong panukmod.

Ang "imo" mao ang parehas nga pagbati nga kini halos ang gusto nimong buhaton. Naa koy gamay nga story. Sukad sa pagkabata, interesado na ko sa rock music (ug metal - SALMON!) Nahibal-an nga wala ako makadungog ug wala’y tingog - wala gyud kini makahasol kanako (ug kinahanglan nako isulti nga dili kini makahasol sa daghang mga performer sa entablado), ug sa nagtungha pa ako nakakuha ako usa ka gitara ... ug nahimong klaro nga dili gyud ko ganahan nga maglingkod ug daghang oras ug magdula niini. Naglisud kini, ingon sa akong panan-aw nga adunay usa ka matang sa kabuangan nga migawas - wala gyud ako nalipay gikan niini ug gibati nako nga dili maayo, hungog ug hingpit nga wala’y mahimo. Literal nga gipugos nako ang akong kaugalingon sa paglingkod para sa mga klase ug sa kinatibuk-an dili kini maayong pagkaon para sa kabayo.

Sa samang higayon, ako medyo kalmado nga naglingkod sulod sa daghang oras sa paghimo og dulaan, gamit ang usa ka script aron ma-animate ang usa ka butang sa flash (o uban pa) ug ako nadasig sa paghuman sa mga elemento sa dula o pag-atubang sa mga mekaniko sa paglihok ug/o pagkonektar sa mga librarya sa ikatulo nga partido, plugins ug uban pa.

Ug sa pipila ka mga punto nakaamgo ko nga ang pagtugtog sa gitara dili ako butang ug nga ako ganahan kaayo sa pagpaminaw, dili sa pagdula. Ug ang akong mga mata misidlak sa dihang nagsulat kog mga dula ug code (pagpaminaw sa tanang matang sa metal nianang higayuna) ug mao kana ang akong ganahan niadto, ug mao kana ang angay nakong buhaton.

Aduna ka bay laing pangutana?

Siyempre, dili namo mahisgotan ang tanan nga mga hilisgutan ug mga pangutana, busa pagsulat og mga komentaryo ug PM kanako - Kanunay kong malipayon nga adunay mga pangutana.

Mga Nota Petsa Scientist: asa magsugod ug kinahanglan ba kini?

Mga Nota Petsa Scientist: asa magsugod ug kinahanglan ba kini?

Source: www.habr.com

Idugang sa usa ka comment