Vidokezo Tarehe Mwanasayansi: wapi kuanza na ni muhimu?

Vidokezo Tarehe Mwanasayansi: wapi kuanza na ni muhimu?

TL;DR ni chapisho la maswali/majibu kuhusu Sayansi ya Data na jinsi ya kuingiza taaluma na kujiendeleza ndani yake. Katika makala nitachambua kanuni za msingi na FAQ na niko tayari kujibu maswali yako maalum - kuandika katika maoni (au katika ujumbe wa kibinafsi), nitajaribu kujibu kila kitu ndani ya siku chache.

Pamoja na ujio wa safu ya "Tarehe ya Shetani", ujumbe na maoni mengi yalikuja na maswali juu ya jinsi ya kuanza na wapi kuchimba, na leo tutachambua ustadi kuu na maswali yaliyotokea baada ya machapisho.

Kila kitu kilichoelezwa hapa hakidai kuwa ukweli wa mwisho na ni maoni ya mwandishi. Tutaangalia mambo makuu ambayo yanaonekana kuwa muhimu zaidi katika mchakato.

Kwa nini hii hasa inahitajika?

Ili lengo liweze kufikiwa vyema, ili lionekane angalau maalum - unataka kuwa DS au Mwanasayansi wa Utafiti katika Facebook/Apple/Amazon/Netflix/Google - angalia mahitaji, lugha na ujuzi muhimu. hasa kwa nafasi gani. Je, mchakato wa kuajiri ni upi? Siku ya kawaida hupitaje katika jukumu kama hilo? Je, wasifu wa wastani wa mtu anayefanya kazi hapo unafananaje?

Mara nyingi picha ya jumla ni kwamba mtu haelewi haswa anachotaka na haijulikani kabisa jinsi ya kujiandaa kwa picha hii isiyo wazi - kwa hivyo inafaa kuwa na mpango mbaya wa kile unachotaka.

Thibitisha mtazamo wa sasa wa lengo

Hata kama itabadilika njiani, na kwa ujumla ni kawaida kubadilisha mipango wakati wa mchezo, inafaa kuwa na lengo na kulizingatia, kutathmini mara kwa mara na kufikiria upya.

Itakuwa au bado inafaa?

Kwa wakati unakua katika nafasi.

Fikiria kuwa kabla ya nafasi yako unahitaji kupata PhD, fanya kazi kwa miaka 2-3 kwenye tasnia na kukata nywele zako kwa ujumla wakati wa kutafakari kwenye nyumba ya watawa - hali ya Sayansi ya Takwimu haitakuwa sawa na ilivyokuwa hapo awali na wachumi na wanasheria? Je, kila kitu kitabadilika zaidi ya kutambuliwa katika eneo unalotaka kufuata?

Je, hakuna nafasi nzuri kwamba kila mtu atakimbilia huko sasa na tutaona picha ambapo kuna safu pana ya watu wanaojaribu kuingia kwenye taaluma - na kutakuwa na nafasi ndogo ya kuanzia.

Inaweza kuwa muhimu kuzingatia mwenendo wa sasa wakati wa kuchagua njia, sio tu hali ya sasa ya soko la ajira, lakini pia wazo lako la jinsi inabadilika na iko wapi.

Kwa mfano, mwandishi hakupanga kuwa Shetani, lakini wakati wa PhD yake alifanya kazi kwenye miradi ya mtu wa tatu ambayo ilikuwa na ustadi mkubwa sawa na DS, na mwisho wa shule ya kuhitimu alibadilika kwa mazingira, akiona hali nzuri. nafasi.

Ikiwa wakati wa kucheza inageuka kuwa itakuwa muhimu kuhamia mahali pengine - kwa sababu sasa kuna harakati nyingi na hatua zote za kuvutia zaidi zinatokea, basi tutahamia huko kwa kawaida.

Uchanganuzi wa Ujuzi

Hizi ni kategoria za masharti za ujuzi ambazo inaonekana kwangu kuwa muhimu kwa kazi kamili na yenye ufanisi katika DS. Nitaangazia Kiingereza kando - jifunze chochote unachofanya katika CS. Ifuatayo ni kategoria muhimu.

Kupanga/kuandika hati

Je, una uhakika wa kufahamiana na lugha gani? Chatu? Java? Uandishi wa shell? Lua? Sql? C++?

Nini hasa unahitaji kuwa na uwezo wa kufanya na kwa nini katika suala la programu - mbalimbali ya nafasi hapa inatofautiana sana.

Kwa mfano, mara nyingi mimi hulazimika kutekeleza mantiki ngumu, maswali, mifano, uchanganuzi, na kwa ujumla kukuza mifumo iliyotafsiriwa, lakini karibu hakuna mahitaji ya kasi ya nambari, isipokuwa yale ya jumla na ya busara.

Kwa hivyo, seti yangu ya ustadi ni tofauti sana na wale wanaoandika maktaba ya Tensorflow na wanafikiria juu ya kuboresha nambari kwa matumizi bora ya kache ya l1 na vitu sawa, kwa hivyo angalia ni nini unahitaji na tathmini njia sahihi ya kujifunza.

Kwa mfano, kwa python, watu tayari wanaunda ramani kujifunza lugha.

Hakika, tayari kuna ushauri wenye uzoefu na vyanzo vyema vya mahitaji yako - unahitaji kuamua kwenye orodha na kuanza kuifanyia kazi.

Kuelewa michakato ya biashara

Huwezi kwenda popote bila hiyo: unahitaji kuelewa kwa nini unahitajika katika mchakato huu, unafanya nini na kwa nini. Mara nyingi hii ndiyo inaweza kukuokoa muda mwingi, kuongeza manufaa yako na si kupoteza muda na rasilimali kwa dhulma.

Kwa kawaida, mimi hujiuliza maswali yafuatayo:

  • Nifanye nini hasa katika kampuni?
  • Kwa nini?
  • Nani atatumia na jinsi gani?
  • Je, nina chaguzi gani?
  • Ni mipaka gani ya vigezo?

Hapa kuna maelezo zaidi juu ya vigezo: mara nyingi unaweza kubadilisha sana hali ya kazi ikiwa unajua kuwa kitu kinaweza kutolewa dhabihu: kwa mfano, tafsiri au kinyume chake, asilimia kadhaa haitachukua jukumu hapa na tuna haraka sana. suluhisho, na mteja anaihitaji, kwa sababu analipa kwa wakati bomba linaendeshwa katika AWS.

Math

Hapa unafikiri na kuelewa kila kitu mwenyewe - bila ujuzi wa hisabati ya msingi wewe si kitu zaidi ya nyani na grenade (samahani Random Forest) - hivyo unahitaji kuelewa angalau mambo ya msingi. Ikiwa ningeunda orodha ndogo sana, ingejumuisha:

  • Linear algebra - idadi kubwa ya rasilimali ni rahisi kwa Google, tafuta kile kinachokufaa zaidi;
  • Uchambuzi wa hisabati - (angalau katika mihula miwili ya kwanza);
  • Nadharia ya uwezekano iko kila mahali katika kujifunza kwa mashine;
  • Combinatorics - kwa kweli ni nyongeza kwa nadharia;
  • Nadharia ya grafu - angalau BASIC;
  • Algorithms - angalau kwa mihula miwili ya kwanza (angalia mapendekezo ya Cormen katika kitabu chake);
  • Hisabati - angalau msingi.

Uchambuzi wa data kwa vitendo na taswira

Mojawapo ya mambo muhimu zaidi ni kutoogopa kuchafua mikono yako na data na kufanya uchambuzi wa kina wa seti ya data, mradi, na kuunda taswira ya haraka ya data.

Uchanganuzi wa data ya uchunguzi unapaswa kuwa kitu cha kawaida, kama mabadiliko mengine yote ya data na uwezo wa kuunda bomba rahisi kutoka kwa nodi moja (angalia nakala zilizotangulia) au kuandika daftari inayoweza kusomeka na inayoeleweka.

Ningependa kutaja taswira: ni bora kuona mara moja kuliko kusikia mara mia.

Kuonyesha grafu kwa msimamizi ni rahisi na wazi zaidi mara mia kuliko seti ya nambari, kwa hivyo matplotlib, seaborn na ggplot2 ni marafiki zako.

Ujuzi laini

Ni muhimu pia kuwa na uwezo wa kuwasiliana na mawazo yako, pamoja na matokeo na wasiwasi (n.k.) kwa wengine - hakikisha kwamba unaweza kusema wazi kazi katika masharti ya kiufundi na ya biashara.

Unaweza kuwaeleza wafanyakazi wenzako, wasimamizi, wakuu, wateja na mtu mwingine yeyote anayehitaji kinachoendelea, ni data gani unatumia na matokeo gani umepata.

Chati na hati zako zinapaswa kusomwa bila wewe. Hiyo ni, hauitaji kwenda kwako kuelewa kile kilichoandikwa hapo.

Unaweza kutoa wasilisho wazi ili kupata uhakika na/au kuandika mradi/kazi yako.

Unaweza kuwasilisha msimamo wako kwa njia ya kusababu na isiyo na hisia, sema "ndiyo/hapana" au swali/uunga mkono uamuzi.

Mafunzo ya

Kuna sehemu nyingi tofauti ambapo unaweza kujifunza haya yote. Nitatoa orodha fupi - nilijaribu kila kitu kutoka kwake na, kuwa waaminifu, kila kitu kina faida na hasara zake. Jaribu na uamue kile kinachokufaa, lakini ninapendekeza sana kujaribu chaguzi kadhaa na sio kukwama kwenye moja.

  • Kozi za mtandaoni: coursera, udacity, Edx, nk;
  • Shule mpya: mtandaoni na nje ya mtandao - SkillFactory, ShaD, MADE;
  • Shule za classical: mipango ya bwana wa chuo kikuu na kozi za mafunzo ya juu;
  • Miradi - unaweza kuchagua tu kazi zinazokuvutia na kuzikata, kuzipakia kwenye github;
  • Mafunzo - ni ngumu kupendekeza chochote hapa; itabidi utafute kile kinachopatikana na kupata chaguzi zinazofaa.

Je, ni lazima?

Kwa kumalizia, labda nitaongeza kanuni tatu za kibinafsi ambazo ninajaribu kufuata mwenyewe.

  • Inapaswa kuvutia;
  • Kuleta furaha ya ndani (= angalau si kusababisha mateso);
  • "Kuwa wako."

Kwa nini wao? Ni vigumu kufikiria kufanya jambo fulani kila siku na kutolifurahia au kutopendezwa nalo. Fikiria kuwa wewe ni daktari na unachukia kuwasiliana na watu - hii, bila shaka, inaweza kufanya kazi kwa namna fulani, lakini utakuwa na wasiwasi daima na mtiririko wa wagonjwa ambao wanataka kukuuliza kitu. Hii haifanyi kazi kwa muda mrefu.

Kwa nini nilitaja haswa raha ya ndani? Inaonekana kwangu kuwa hii ni muhimu kwa maendeleo zaidi na, kimsingi, mchakato wa kujifunza. Ninaifurahia sana ninapofanikiwa kukamilisha kipengele fulani changamano na kujenga kielelezo au kukokotoa kigezo muhimu. Ninafurahiya wakati nambari yangu ni nzuri na imeandikwa vizuri. Kwa hiyo, kujifunza kitu kipya ni cha kuvutia na hauhitaji moja kwa moja motisha yoyote muhimu.

"Kuwa wako" ni hisia sawa kwamba hii ni takribani kile ulitaka kufanya. Nina hadithi kidogo. Tangu utotoni, nimekuwa nikipendezwa na muziki wa roki (na chuma - SALMON!) na, kama wengine wengi, nilitaka kujifunza jinsi ya kucheza na ndivyo tu. Ilibadilika kuwa sikuwa na kusikia na hakuna sauti - hii haikunisumbua hata kidogo (na lazima niseme hii haisumbui wasanii wengi kwenye hatua), na nilipokuwa bado shuleni nilipata gitaa ... na ikawa wazi kuwa sipendi kukaa kwa masaa mengi na kucheza juu yake. Ilikuwa inaenda kwa bidii, kila mara ilionekana kwangu kuwa aina fulani ya ng'ombe ilikuwa ikitoka - sikupata raha yoyote kutoka kwayo na nilijihisi kuwa mnyonge, mjinga na siwezi kabisa. Nilijilazimisha kuketi kwa madarasa na kwa ujumla haikuwa chakula kizuri kwa farasi.

Wakati huo huo, ningeweza kukaa kwa utulivu kwa masaa mengi nikitengeneza toy, kwa kutumia hati kuhuisha kitu kwenye flash (au kitu kingine) na nilihamasishwa sana kumaliza vipengele kwenye mchezo au kushughulika na mitambo ya harakati na/ au. kuunganisha maktaba za watu wengine, programu-jalizi na kila kitu kingine.

Na wakati fulani niligundua kuwa kucheza gita sio jambo langu na kwamba napenda sana kusikiliza, sio kucheza. Na macho yangu yaling'aa nilipoandika michezo na msimbo (kusikiliza kila aina ya chuma wakati huo) na ndivyo nilivyopenda wakati huo, na ndivyo nilipaswa kufanya.

Je, una maswali mengine yoyote?

Bila shaka, hatukuweza kupitia mada na maswali yote, kwa hivyo niandikie maoni na uni PM - huwa na furaha kuwa na maswali.

Vidokezo Tarehe Mwanasayansi: wapi kuanza na ni muhimu?

Vidokezo Tarehe Mwanasayansi: wapi kuanza na ni muhimu?

Chanzo: mapenzi.com

Kuongeza maoni