Oharrak Data Zientzialaria: nondik hasi eta beharrezkoa al da?

Oharrak Data Zientzialaria: nondik hasi eta beharrezkoa al da?

TL;DR Datu Zientziari buruzko galdera/erantzunetarako argitalpena da eta lanbidean sartu eta garatzeko modua da. Artikuluan oinarrizko printzipioak eta FAQ aztertuko ditut eta zure galdera zehatzak erantzuteko prest nago - idatzi iruzkinetan (edo mezu pribatu batean), egun gutxiren buruan guztia erantzuten saiatuko naiz.

"Satanist Date" ohar sorta agertzearekin batera, mezu eta iruzkin ugari etorri ziren nola hasi eta non zulatu buruzko galderekin, eta gaur argitalpenen ondoren sortu ziren trebetasun eta galdera nagusiak aztertuko ditugu.

Hemen adierazitako guztiak ez du azken egia denik aldarrikatzen eta egilearen iritzi subjektiboa da. Prozesuan garrantzitsuenak iruditzen zaizkigun gauza nagusiak aztertuko ditugu.

Zergatik behar da hau zehazki?

Helburua hobeto lor dadin, gutxienez zehatz samarra izan dadin - Facebook/Apple/Amazon/Netflix/Google-n DS edo Research Scientist izan nahi duzu- begiratu eskakizunak, hizkuntzak eta beharrezko trebetasunak. zehazki zein postutarako. Zein da kontratazio prozesua? Nola pasatzen da egun arrunt bat horrelako rol batean? Nolakoa da bertan lan egiten duen pertsona baten batez besteko profila?

Askotan, irudi orokorra da pertsona batek ez duela benetan ulertzen zer nahi duen eta ez dago guztiz argi nola prestatu irudi ez-argi honetarako; beraz, merezi du gutxienez nahi duzuna planifikatzea.

Konkretu uneko helburuen ikuspegia

Nahiz eta bidean aldatzen joan, eta orokorrean normala den antzezlanean zehar planak aldatzea, merezi du helburu bat edukitzea eta horretan zentratzea, aldian-aldian ebaluatzea eta birpentsatzea.

Izango al da edo oraindik ere garrantzitsua da?

Posizio batean hazten zarenerako.

Imajinatu zure postuaren aurretik doktoretza lortu behar duzula, industrian 2-3 urtez lan egin eta, oro har, ilea moztu behar duzula monasterio batean meditatzen ari zaren bitartean. abokatuak? Dena aldatuko al da errekonozimendutik harago jarraitu nahi duzun eremuan?

Ez al dago aukera handirik orain denek hara korrika egiteko eta lanbidean sartzen saiatzen ari den jende geruza zabala dagoen argazki bat ikusiko dugu, eta hasierako postu eskasa izango da.

Bide bat aukeratzerakoan egungo joerak kontuan hartzea merezi du, ez bakarrik lan-merkatuaren egungo egoera, baita nola aldatzen ari den eta non dagoen zure ideia ere.

Esaterako, egileak ez zuen satanista izateko asmorik, baina doktoretzan zehar DSrekin komunean trebetasun handiak zituzten hirugarrenen proiektuetan lan egin zuen, eta graduondoko eskolaren amaieran ingurunera aldatu zen naturalki, ona ikusita. posizioa.

Antzezlanak irauten duen bitartean beste norabait mugitu beharko dela ikusten bada, orain mugimendu gehien dagoelako eta ekintza interesgarrienak gertatzen ari direlako, orduan naturaltasunez mugituko gara.

Trebetasunen Matxura

DS-n lan osoa eta eraginkorra izateko gakoak iruditzen zaizkidan gaitasun-kategoria baldintzatuak dira. Ingelesa bereizita nabarmenduko dut; ikasi CSn egiten duzuna. Ondoren, funtsezko kategoriak daude.

Programazioa/Scripting

Zein hizkuntza ezagutuko dituzu ziur? Python? Java? Shell script-a? Lua? Sql? C++?

Zer egin behar duzun zehatz-mehatz eta zergatik programazioari dagokionez - hemen posizioen sorta asko aldatzen da.

Adibidez, askotan logika, kontsultak, ereduak, analitika konplexuak ezarri behar izaten ditut eta, oro har, interpretatutako sistemak garatu behar izaten ditut, baina ez dago ia inoiz kodearen abiaduraren eskakizunik, orokorrenak eta arrazoizkoenak izan ezik.

Hori dela eta, nire trebetasun multzoa Tensorflow liburutegia idazten dutenengandik oso desberdina da eta l1 cachea eta antzeko gauzak modu eraginkorrean erabiltzeko kodea optimizatzea pentsatzen dutenak, beraz, begiratu zer behar duzun eta ebaluatu ikasteko bide egokia.

Adibidez, python-erako, jendeak dagoeneko osatzen du mapa bat hizkuntza ikastea.

Ziur aski, dagoeneko esperientziadun aholkuak eta iturri onak daude zure beharretarako - zerrenda bat erabaki eta lanean hasi behar duzu.

Negozio-prozesuak ulertzea

Ezin zara inora joan hura gabe: ulertu behar duzu zergatik zaren beharrezkoa prozesu honetan, zer egiten ari zaren eta zergatik. Askotan, hori da denbora asko aurrezten zaituena, etekina maximizatu eta denbora eta baliabideak ez galtzea tontakeriatan.

Normalean, galdera hauek egiten dizkiot neure buruari:

  • Zer egiten dut zehazki enpresan?
  • Zergatik?
  • Nork eta nola erabiliko du?
  • Zein aukera ditut?
  • Zeintzuk dira parametroen mugak?

Hona hemen parametroei buruzko zehaztasun apur bat: askotan asko alda dezakezu lanaren eszenatokia zerbait sakrifikatu daitekeela badakizu: adibidez, interpretagarritasuna edo alderantziz, ehuneko pare batek ez du zereginik izango hemen eta oso azkarra dugu. irtenbidea, eta bezeroak behar du, kanalizazioa AWSn exekutatzen ari den denboragatik ordaintzen duelako.

matematika

Hemen zuk zeuk pentsatzen eta ulertzen duzu dena - oinarrizko matematika jakin gabe, granadadun tximinoak baino ez zara (barkatu Random Forest) - beraz, oinarrizko gauzak ulertu behar dituzu gutxienez. Zerrenda minimo bat osatuko banu, honako hauek izango lirateke:

  • Aljebra lineala - baliabide ugari errazak dira Googlen, bilatu hobekien egokitzen zaizuna;
  • Analisi matematikoa - (lehen bi seihilekoetan gutxienez);
  • Probabilitatearen teoria nonahi dago ikaskuntza automatikoan;
  • Konbinatoria - benetan teoriaren osagarria da;
  • Grafikoen teoria - gutxienez OINARRIZKOA;
  • Algoritmoak - lehenengo bi seihilekoetarako gutxienez (ikus Cormenen gomendioak bere liburuan);
  • Matematika - oinarrizkoa gutxienez.

Datu praktikoak aztertzea eta bistaratzea

Garrantzitsuenetako bat da datuekin eskuak zikintzeko beldurrik ez edukitzea eta datu-multzoaren, proiektuaren azterketa integrala egitea eta datuen bistaratzea azkar bat sortzea.

Esplorazio-datuen analisia zerbait natural bihurtu behar da, beste datu-eraldaketa guztiak bezala eta unix nodoetatik kanalizazio sinple bat sortzeko gaitasuna (ikusi aurreko artikuluak) edo koaderno irakurgarri eta ulergarri bat idazteko gaitasuna.

Bisualizazioa aipatu nahiko nuke: hobe da behin ikustea ehun aldiz entzutea baino.

Kudeatzaile bati grafiko bat erakustea zenbaki multzo bat baino ehun aldiz errazagoa eta argiagoa da, beraz, matplotlib, seaborn eta ggplot2 dira zure lagunak.

Gaitasun bigunak

Era berean, garrantzitsua da zure ideiak, baita emaitzak eta kezkak (etab.) besteei helarazi ahal izatea. Ziurtatu zeregina argi eta garbi adierazi dezakezula termino teknikoetan zein negozioetan.

Lankideei, arduradunei, nagusiei, bezeroei eta behar duen edonori azal diezaiekezu zer gertatzen ari den, zer datu erabiltzen ari zaren eta zer emaitza lortu dituzun.

Zure taulak eta dokumentazioa zu gabe irakurri behar dira. Hau da, ez duzu zuregana joan behar bertan idatzitakoa ulertzeko.

Aurkezpen argi bat egin dezakezu puntua zabaltzeko eta/edo proiektua/zure lana dokumentatzeko.

Zure jarrera modu arrazoituan eta emozionalki helarazi dezakezu, "bai/ez" esan edo erabaki bat zalantzan jarri/onartu.

prestakuntza

Hau guztia ikasteko leku ezberdin asko daude. Zerrenda labur bat emango dut: dena probatu nuen eta, egia esateko, elementu bakoitzak bere alde onak eta txarrak ditu. Probatu eta erabaki zer komeni zaizun, baina gomendatzen dut hainbat aukera probatzea eta batean ez gelditzea.

  • Online ikastaroak: coursera, udacity, Edx, etab;
  • Eskola berriak: linean eta lineaz kanpo - SkillFactory, ShAD, MADE;
  • Eskola klasikoak: unibertsitateko masterrak eta goi-mailako prestakuntza ikastaroak;
  • Proiektuak - interesatzen zaizkizun zereginak hauta ditzakezu eta moztu, github-era igoz;
  • Praktikak - zaila da hemen ezer iradokitzea; eskuragarri dagoena bilatu eta aukera egokiak aurkitu behar dituzu.

Beharrezkoa al da?

Amaitzeko, ziurrenik neure burua jarraitzen saiatzen naizen hiru printzipio pertsonal gehituko ditut.

  • Interesgarria izan beharko luke;
  • Barne-plazerra ekarri (= sufrimendua ez eragin behintzat);
  • β€” Zurea izateko.

Zergatik haiek? Zaila da imajinatzea egunero zerbait egiten eta ez gozatzea edo interesatzen ez izatea. Imajinatu medikua zarela eta jendearekin komunikatzea gorroto duzula - honek, noski, nolabait funtziona dezake, baina etengabe deseroso egongo zara zerbait galdetu nahi dizuten pazienteen fluxuarekin. Horrek ez du funtzionatzen epe luzera.

Zergatik aipatu dut bereziki barne plazerra? Iruditzen zait hori beharrezkoa dela aurrerago garatzeko eta, printzipioz, ikaskuntza-prozesurako. Asko gustatzen zait ezaugarri konplexuren bat osatzea eta eredu bat eraikitzea edo parametro garrantzitsu bat kalkulatzea lortzen dudanean. Gozatzen dut nire kodea estetikoki ederra eta ondo idatzita dagoenean. Horregatik, zerbait berria ikastea interesgarria da eta ez du zuzenean motibazio handirik behar.

"Zurea izatea" hori dela gutxi gorabehera egin nahi zenuen sentsazio bera da. Istoriotxo bat daukat. Txikitatik, rock musika (eta metala - SALMON!) interesatzen zitzaidan eta, beste asko bezala, jotzen ikasi nahi nuen eta kitto. Agertu zen ez nuela entzumenik eta ahotsik ez nuela - horrek ez ninduen batere molestatzen (eta esan behar dut horrek ez dituela antzezle asko molestatzen oholtza gainean), eta oraindik eskolan nengoela gitarra bat hartu nuen... eta argi geratu zen ez zaidala asko gustatzen orduak eserita eta bertan jolastea. Gogorra zihoan, beti iruditu zitzaidan nolabaiteko txorakeria ateratzen ari zela; ez nuen batere plazerrik ateratzen eta zitala, ergela eta erabat ezina sentitzen nintzen. Hitzez hitz klaseetara esertzera behartu nintzen eta, oro har, ez zen janari ona zaldiarentzat.

Aldi berean, lasai asko esertzen nintzen orduz jostailuren bat garatzen, gidoi bat erabiliz zerbait animatzeko flash-en (edo beste zerbait) eta oso motibatuta nengoen jokoko elementuak amaitzeko edo mugimenduaren mekanika eta/edo jorratzeko. hirugarrenen liburutegiak, pluginak eta beste guztia konektatzea.

Eta noizbait konturatu nintzen gitarra jotzea ez dela nire gauza eta asko gustatzen zaidala entzutea, ez jotzea. Eta begiak distira egiten zidaten jolasak eta kodea idazterakoan (momentu horretan metal mota guztiak entzuten) eta horixe gustatu zitzaidan orduan, eta horixe egin behar nuen.

Beste galderarik baduzu?

Noski, ezin izan ditugu gai eta galdera guztiak aztertu, beraz, idatzi iruzkinak eta bidali mezu elektroniko bat - Beti pozik nago galderak izateaz.

Oharrak Data Zientzialaria: nondik hasi eta beharrezkoa al da?

Oharrak Data Zientzialaria: nondik hasi eta beharrezkoa al da?

Iturria: www.habr.com

Gehitu iruzkin berria