Նշումներ Ամսաթիվ Գիտնական. որտեղի՞ց սկսել և արդյոք դա անհրաժեշտ է:

Նշումներ Ամսաթիվ Գիտնական. որտեղի՞ց սկսել և արդյոք դա անհրաժեշտ է:

TL;DR-ը տվյալների գիտության և մասնագիտության մեջ մտնելու և դրանում զարգանալու մասին հարցերի/պատասխանների գրառում է: Հոդվածում ես կվերլուծեմ հիմնական սկզբունքները և ՀՏՀ-ն և պատրաստ եմ պատասխանել ձեր կոնկրետ հարցերին. գրեք մեկնաբանություններում (կամ անձնական հաղորդագրության մեջ), կփորձեմ ամեն ինչին պատասխանել մի քանի օրվա ընթացքում:

«Սատանիստական ​​ժամադրություն» գրառումների շարքի գալուստով բազմաթիվ հաղորդագրություններ և մեկնաբանություններ եկան հարցերով, թե ինչպես սկսել և որտեղից փորել, և այսօր մենք կվերլուծենք հրապարակումներից հետո առաջացած հիմնական հմտություններն ու հարցերը:

Այստեղ նշված ամեն ինչ չի հավակնում լինել վերջնական ճշմարտության և հեղինակի սուբյեկտիվ կարծիքն է: Մենք կանդրադառնանք հիմնական բաներին, որոնք ամենակարևորն են թվում գործընթացում:

Ինչու՞ է դա անհրաժեշտ:

Որպեսզի նպատակն ավելի հասանելի լինի, որպեսզի այն գոնե որոշ չափով կոնկրետ երևա, դուք ցանկանում եք դառնալ DS կամ հետազոտող գիտնական Facebook/Apple/Amazon/Netflix/Google-ում. դիտեք պահանջները, լեզուները և անհրաժեշտ հմտությունները: կոնկրետ որ պաշտոնի համար: Ո՞րն է աշխատանքի ընդունման գործընթացը: Ինչպե՞ս է անցնում սովորական օրը նման դերում: Ինչպիսի՞ն է այնտեղ աշխատող մարդու միջին բնութագիրը:

Հաճախ ընդհանուր պատկերն այն է, որ մարդն իրականում չի հասկանում, թե կոնկրետ ինչ է ուզում, և ամբողջովին պարզ չէ, թե ինչպես պատրաստվել այս անհասկանալի պատկերին, ուստի արժե ունենալ գոնե մոտավոր ծրագիր, թե կոնկրետ ինչ ես ուզում:

Կոնկրետացնել ընթացիկ նպատակի տեսակետը

Նույնիսկ եթե այն փոխվում է ճանապարհին, և ընդհանուր առմամբ նորմալ է խաղի ընթացքում պլանները փոխելը, արժե ունենալ նպատակ և կենտրոնանալ դրա վրա, պարբերաբար գնահատել և վերանայել:

Կլինի՞, թե՞ դեռ ակտուալ է։

Մինչ դուք կվերածվեք դիրքի:

Պատկերացրեք, որ ձեր պաշտոնից առաջ դուք պետք է ստանաք PhD, աշխատեք 2-3 տարի արդյունաբերության մեջ և, ընդհանուր առմամբ, կտրեք ձեր մազերը մենաստանում մեդիտացիա անելիս. արդյոք Data Science-ի հետ կապված իրավիճակը նույնը չի լինի, ինչ նախկինում եղել է տնտեսագետների և տնտեսագետների հետ: իրավաբաններ? Արդյո՞ք ամեն ինչ անճանաչելիորեն կփոխվի այն ոլորտում, որտեղ ցանկանում եք զբաղվել:

Լավ հավանականություն չկա՞, որ հիմա բոլորը շտապեն այնտեղ, և մենք կտեսնենք մի նկար, որտեղ մարդկանց լայն շերտ կա, ովքեր փորձում են մտնել մասնագիտություն, և կլինի պարզապես սակավ մեկնարկային դիրք:

Հնարավոր է, որ արժե հաշվի առնել ընթացիկ միտումները ուղի ընտրելիս, ոչ միայն աշխատաշուկայի ներկայիս վիճակը, այլ նաև ձեր պատկերացումն այն մասին, թե ինչպես է այն փոխվում և որտեղ է այն:

Օրինակ, հեղինակը չէր նախատեսում դառնալ սատանիստ, բայց իր PhD-ի ընթացքում նա աշխատել է երրորդ կողմի նախագծերի վրա, որոնք ունեին ուժեղ հմտություններ DS-ի հետ, և ասպիրանտուրայի ավարտին նա բնականաբար անցավ շրջակա միջավայրին, տեսնելով լավը: դիրք.

Եթե ​​պիեսի ընթացքում պարզվի, որ անհրաժեշտ կլինի տեղափոխվել մեկ այլ տեղ, քանի որ այնտեղ այժմ ամենաշատ շարժումն է և տեղի է ունենում ամենահետաքրքիր գործողությունները, ապա մենք բնականաբար կտեղափոխվենք այնտեղ:

Հմտությունների բաշխում

Սրանք հմտությունների պայմանական կատեգորիաներ են, որոնք ինձ թվում են առանցքային են DS-ում լիարժեք և արդյունավետ աշխատանքի համար: Ես առանձին-առանձին կնշեմ անգլերենը. սովորեք այն, ինչ անում եք CS-ում: Հաջորդը հիմնական կատեգորիաներն են:

Ծրագրավորում/Սցենարավորում

Ի՞նչ լեզուների եք անպայման ծանոթանալու: Պիթոն? Java? Shell scripting? Լուա? Sql? C++?

Ինչ կոնկրետ դուք պետք է կարողանաք անել և ինչու ծրագրավորման առումով - այստեղ պաշտոնների շրջանակը շատ տարբեր է:

Օրինակ, ես հաճախ ստիպված եմ իրականացնել բարդ տրամաբանություն, հարցումներ, մոդելներ, վերլուծություն և ընդհանրապես մշակել մեկնաբանվող համակարգեր, բայց կոդի արագության համար գրեթե երբեք պահանջներ չկան, բացառությամբ ամենաընդհանուր և ողջամիտ պահանջների:

Հետևաբար, իմ հմտությունների հավաքածուն շատ է տարբերվում նրանցից, ովքեր գրում են Tensorflow գրադարանը և մտածում են l1 քեշի և նմանատիպ այլ բաների արդյունավետ օգտագործման կոդը օպտիմալացնելու մասին, այնպես որ տեսեք, թե կոնկրետ ինչ է ձեզ անհրաժեշտ և գնահատեք սովորելու ճիշտ ուղին:

Օրինակ՝ պիթոնի համար մարդիկ արդեն դիմահարդարվում են քարտը լեզվի ուսուցում.

Անշուշտ, արդեն կան փորձառու խորհուրդներ ձեր կարիքների համար, և կան լավ աղբյուրներ. դուք պետք է որոշեք ցուցակը և սկսեք աշխատել դրա վրա:

Հասկանալով բիզնես գործընթացները

Դուք ոչ մի տեղ չեք կարող գնալ առանց դրա. դուք պետք է հասկանաք, թե ինչու եք ձեզ անհրաժեշտ այս գործընթացում, ինչ եք անում և ինչու: Հաճախ դա այն է, ինչը կարող է խնայել ձեզ շատ ժամանակ, առավելագույնի հասցնել ձեր օգուտը և չվատնել ժամանակն ու ռեսուրսները հիմարությունների վրա:

Սովորաբար ես ինքս ինձ տալիս եմ հետևյալ հարցերը.

  • Կոնկրետ ի՞նչ եմ ես անում ընկերությունում:
  • Ինչու?
  • Ո՞վ և ինչպես կօգտագործի այն:
  • Ինչ տարբերակներ ունեմ:
  • Որո՞նք են պարամետրերի սահմանները:

Ահա մի փոքր ավելի մանրամասն պարամետրերի մասին. հաճախ կարող եք մեծապես փոխել աշխատանքային սցենարը, եթե գիտեք, որ ինչ-որ բան կարելի է զոհաբերել. օրինակ, մեկնաբանելիությունը կամ հակառակը, մի քանի տոկոսն այստեղ դեր չի խաղա, և մենք ունենք շատ արագ: լուծում, և հաճախորդը դրա կարիքն ունի, քանի որ նա վճարում է AWS-ով խողովակաշարի աշխատանքի ժամանակի համար:

Մաթեմատիկա

Այստեղ դուք ինքներդ եք մտածում և հասկանում ամեն ինչ. առանց տարրական մաթեմատիկայի իմացության դուք ոչ այլ ինչ եք, քան նռնակով կապիկներ (ներողություն, Random Forest) - այնպես որ դուք պետք է հասկանաք առնվազն հիմնական բաները: Եթե ​​ես շատ նվազագույն ցուցակ կազմեի, այն կներառեր.

  • Գծային հանրահաշիվ - հսկայական թվով ռեսուրսներ հեշտ է Google-ի համար, փնտրեք այն, ինչը ձեզ ավելի հարմար է.
  • Մաթեմատիկական վերլուծություն - (առնվազն առաջին երկու կիսամյակում);
  • Հավանականությունների տեսությունն ամենուր է մեքենայական ուսուցման մեջ.
  • Կոմբինատորիկա - այն իրականում լրացնում է տեսությանը.
  • Գրաֆիկի տեսություն - առնվազն ՀԻՄՆԱԿԱՆ;
  • Ալգորիթմներ - առնվազն առաջին երկու կիսամյակների համար (տես Քորմենի առաջարկությունները իր գրքում);
  • Մաթեմատիկա - առնվազն հիմնական:

Գործնական տվյալների վերլուծություն և վիզուալիզացիա

Ամենակարևոր բաներից մեկն այն է, որ կարողանաք չվախենալ ձեր ձեռքերը կեղտոտել տվյալների հետ և կատարել տվյալների հավաքածուի, նախագծի համապարփակ վերլուծություն և ստեղծել տվյալների արագ վիզուալիզացիա:

Հետախուզական տվյալների վերլուծությունը պարզապես պետք է դառնա բնական մի բան, ինչպես տվյալների բոլոր այլ փոխակերպումները և unix հանգույցներից պարզ խողովակաշար ստեղծելու ունակությունը (տես նախորդ հոդվածները) կամ գրել ընթեռնելի և հասկանալի նոթատետր:

Ես կցանկանայի նշել վիզուալիզացիան. ավելի լավ է մեկ անգամ տեսնել, քան հարյուր անգամ լսել:

Մենեջերին գծապատկեր ցույց տալը հարյուր անգամ ավելի հեշտ և պարզ է, քան մի շարք թվեր, ուստի matplotlib, seaborn և ggplot2-ը ձեր ընկերներն են:

Փափուկ հմտություններ

Նույնքան կարևոր է, որ կարողանաք ձեր գաղափարները, ինչպես նաև արդյունքներն ու մտահոգությունները (և այլն) փոխանցել ուրիշներին. համոզվեք, որ կարող եք հստակ ձևակերպել առաջադրանքը և՛ տեխնիկական, և՛ բիզնես առումով:

Դուք կարող եք բացատրել գործընկերներին, ղեկավարներին, վերադասներին, հաճախորդներին և բոլոր նրանց, ովքեր դրա կարիքն ունեն, թե ինչ է կատարվում, ինչ տվյալներ եք օգտագործում և ինչ արդյունքներ եք ստացել:

Ձեր գծապատկերները և փաստաթղթերը պետք է կարդալ առանց ձեզ: Այսինքն՝ ձեզ հարկավոր չէ գնալ ձեզ մոտ՝ հասկանալու համար, թե ինչ է այնտեղ գրված։

Դուք կարող եք հստակ ներկայացում կատարել՝ նպատակը հասկանալու և/կամ փաստաթղթավորելու նախագիծը/ձեր աշխատանքը:

Դուք կարող եք ձեր դիրքորոշումը փոխանցել պատճառաբանված և ոչ էմոցիոնալ կերպով, ասել «այո/ոչ» կամ կասկածել/աջակցել որոշմանը:

ուսուցում

Կան բազմաթիվ տարբեր վայրեր, որտեղ դուք կարող եք սովորել այս ամենը: Ես կարճ ցուցակ կտամ. ես ամեն ինչ փորձել եմ դրանից և, ճիշտն ասած, յուրաքանչյուր ապրանք ունի իր դրական և բացասական կողմերը: Փորձեք այն և որոշեք, թե ինչն է ձեզ հարմար, բայց ես խորհուրդ եմ տալիս փորձել մի քանի տարբերակ և չխրվել մեկի վրա:

  • Առցանց դասընթացներ՝ coursera, udacity, Edx և այլն;
  • Նոր դպրոցներ՝ առցանց և օֆլայն - SkillFactory, ShAD, MADE;
  • Դասական դպրոցներ. համալսարանական մագիստրոսական ծրագրեր և խորացված վերապատրաստման դասընթացներ;
  • Նախագծեր - կարող եք պարզապես ընտրել ձեզ հետաքրքրող առաջադրանքները և կտրել դրանք՝ վերբեռնելով դրանք github;
  • Պրակտիկա - այստեղ ինչ-որ բան առաջարկելը դժվար է, դուք պետք է փնտրեք այն, ինչ հասանելի է և գտնեք համապատասխան տարբերակներ:

Արդյո՞ք դա անհրաժեշտ է:

Եզրափակելով, ես հավանաբար կավելացնեմ երեք անձնական սկզբունքներ, որոնց ես փորձում եմ հետևել ինքս:

  • Պետք է հետաքրքիր լինի;
  • Ներքին հաճույք բերեք (= գոնե տառապանք չպատճառեք);
  • «Լինել քոնը»:

Ինչու՞ նրանք: Դժվար է պատկերացնել, որ ամեն օր ինչ-որ բան անես ու չվայելես կամ չհետաքրքրվես: Պատկերացրեք, որ բժիշկ եք և ատում եք մարդկանց հետ շփվելը. սա, իհարկե, կարող է ինչ-որ կերպ աշխատել, բայց դուք անընդհատ անհարմար կզգաք հիվանդների հոսքից, ովքեր ցանկանում են ձեզ ինչ-որ բան հարցնել: Սա երկարաժամկետ հեռանկարում չի աշխատում:

Ինչու ես հատուկ նշեցի ներքին հաճույքը: Ինձ թվում է, որ դա անհրաժեշտ է հետագա զարգացման և, սկզբունքորեն, ուսումնական գործընթացի համար։ Ես իսկապես հաճույք եմ ստանում, երբ ինձ հաջողվում է լրացնել ինչ-որ բարդ առանձնահատկություն և մոդել կառուցել կամ հաշվարկել կարևոր պարամետր: Ես վայելում եմ այն, երբ իմ ծածկագիրը էսթետիկորեն գեղեցիկ է և լավ գրված: Հետևաբար, նոր բան սովորելը հետաքրքիր է և ուղղակիորեն որևէ էական մոտիվացիա չի պահանջում։

«Լինել քոնը» նույն զգացումն է, որ մոտավորապես դա այն է, ինչ դու ուզում էիր անել: Ես մի փոքրիկ պատմություն ունեմ. Մանկուց ինձ հետաքրքրում էր ռոք երաժշտությունը (և մետալը՝ SALMON!) և, ինչպես շատ ուրիշներ, ես ուզում էի սովորել, թե ինչպես նվագել և վերջ: Պարզվեց, որ ես լսողություն և ձայն չունեի, սա ինձ ամենևին չէր անհանգստացնում (և պետք է ասեմ, որ դա չի անհանգստացնում շատ կատարողների հենց բեմում), և երբ ես դեռ դպրոցական էի, ես կիթառ ստացա... և պարզ դարձավ, որ ես իսկապես չեմ սիրում ժամերով նստել ու խաղալ դրա վրա։ Դժվար էր գնում, ինձ միշտ թվում էր, թե ինչ-որ հիմարություն է դուրս գալիս, ես ընդհանրապես ոչ մի հաճույք չէի ստանում դրանից և պարզապես ինձ ոջլոտ, հիմար և լիովին անկարող էի զգում: Ես ինձ բառացիորեն ստիպեցի նստել դասերի և ընդհանրապես դա ձիու համար լավ կերակուր չէր։

Միևնույն ժամանակ, ես կարող էի միանգամայն հանգիստ նստել ժամերով՝ մշակելով ինչ-որ խաղալիք՝ օգտագործելով սցենար՝ ինչ-որ բան կենդանացնելու համար ֆլեշի վրա (կամ այլ բան), և ես մեծ մոտիվացիա ունեի ավարտելու խաղի տարրերը կամ զբաղվելու շարժման մեխանիզմներով և/կամ միացնելով երրորդ կողմի գրադարանները, պլագինները և մնացած ամեն ինչ:

Եվ ինչ-որ պահի հասկացա, որ կիթառ նվագելն իմ գործը չէ, և որ ես իսկապես սիրում եմ լսել, ոչ թե նվագել: Եվ իմ աչքերը փայլում էին, երբ ես գրում էի խաղեր և ծածկագրեր (այդ պահին բոլոր տեսակի մետաղներ լսելով), և դա այն էր, ինչ ինձ դուր էր գալիս այն ժամանակ, և դա այն է, ինչ ես պետք է անեի:

Այլ հարցեր ունե՞ք։

Իհարկե, մենք չկարողացանք անցնել բոլոր թեմաների և հարցերի միջով, այնպես որ գրեք մեկնաբանություններ և գրեք ինձ PM-ով. ես միշտ ուրախ եմ հարցեր ունենալու համար:

Նշումներ Ամսաթիվ Գիտնական. որտեղի՞ց սկսել և արդյոք դա անհրաժեշտ է:

Նշումներ Ամսաթիվ Գիտնական. որտեղի՞ց սկսել և արդյոք դա անհրաժեշտ է:

Source: www.habr.com

Добавить комментарий