Жазбалар Күні Ғалым: неден бастау керек және бұл қажет пе?

Жазбалар Күні Ғалым: неден бастау керек және бұл қажет пе?

TL; DR - бұл Data Science және мамандыққа қалай түсу және оны дамыту туралы сұрақтарға/жауаптарға арналған пост. Мақалада мен негізгі принциптерді және жиі қойылатын сұрақтарды талдаймын және сіздің нақты сұрақтарыңызға жауап беруге дайынмын - түсініктемелерде (немесе жеке хабарламада) жазыңыз, мен бірнеше күн ішінде бәріне жауап беруге тырысамын.

«Сатанисттік күн» жазбалар сериясының пайда болуымен көптеген хабарламалар мен пікірлерді қалай бастау керек және қай жерден қазу керектігі туралы сұрақтар келді, және бүгін біз жарияланымдардан кейін пайда болған негізгі дағдылар мен сұрақтарды талдаймыз.

Мұнда айтылғандардың бәрі түпкілікті шындық емес және автордың субъективті пікірі болып табылады. Біз процесте ең маңызды болып көрінетін негізгі нәрселерді қарастырамыз.

Бұл дәл не үшін қажет?

Мақсатқа жақсырақ қол жеткізу үшін, ол кем дегенде нақты көрінуі үшін - сіз Facebook/Apple/Amazon/Netflix/Google-да DS немесе зерттеуші ғалым болғыңыз келеді - талаптарды, тілдерді және қажетті дағдыларды қараңыз. нақты қай лауазым үшін. Жұмысқа қабылдау процесі қандай? Мұндай рөлде әдеттегі күн қалай өтеді? Онда жұмыс істейтін адамның орташа профилі қандай?

Көбінесе жалпы сурет адамның нақты не қалайтынын түсінбейді және бұл түсініксіз бейнеге қалай дайындалу керектігі анық емес - сондықтан сіз нақты не қалайтыныңыздың кем дегенде шамамен жоспарын жасаған жөн.

Ағымдағы мақсат көрінісін нақтылаңыз

Ол жол бойы өзгерсе де және ойын барысында жоспарларды өзгерту қалыпты жағдай болса да, мақсат қойып, соған назар аударып, мерзімді түрде бағалап, қайта ойластырған жөн.

Бұл бола ма, әлде өзекті ме?

Сіз позицияға жеткенше.

Елестетіп көріңізші, сіздің лауазымыңыздан бұрын PhD дәрежесін алу, салада 2-3 жыл жұмыс істеу және әдетте монастырда медитация кезінде шашыңызды кесу керек - Data Science саласындағы жағдай бұрынғыдай экономистер мен экономистердегідей болмай ма? адвокаттар? Сіз іздегіңіз келетін салада бәрі адам танымастай өзгере ме?

Қазір барлығының асығуына жақсы мүмкіндік бар емес пе, және біз бұл мамандыққа кіруге тырысатын адамдардың кең қабаты бар суретті көреміз - және жай ғана бастапқы ұстаным болады.

Жолды таңдағанда, еңбек нарығының ағымдағы жай-күйін ғана емес, сонымен бірге оның қалай өзгеретіні және қайда екендігі туралы сіздің идеяңызды да ескерген жөн.

Мысалы, автор сатанист болуды жоспарламады, бірақ PhD докторы кезінде ол DS-мен ортақ дағдылары бар үшінші тарап жобаларында жұмыс істеді және аспирантураны аяқтаған кезде ол табиғи түрде қоршаған ортаға ауысты, жақсы нәрсені көрді. позиция.

Егер спектакль барысында басқа жерге көшу керек болып шықса - өйткені қазір ең көп қозғалыс және барлық қызықты әрекет болып жатқандықтан, біз ол жерге табиғи түрде көшеміз.

Дағдыларды бөлу

Бұл DS-те толық және тиімді жұмыс үшін негізгі болып көрінетін дағдылардың шартты категориялары. Мен ағылшын тілін бөлек бөлемін - CS-те не істесеңіз де үйреніңіз. Келесі негізгі санаттар.

Бағдарламалау/сценарийлеу

Қандай тілдерді міндетті түрде білу керек? Python? Java? Shell сценарийі? Луа? Sql? C++?

Сіз нақты не істей алуыңыз керек және неге бағдарламалау тұрғысынан - мұндағы позициялар ауқымы айтарлықтай өзгереді.

Мысалы, мен жиі күрделі логиканы, сұрауларды, модельдерді, аналитиканы енгізуге және жалпы түсіндірілетін жүйелерді әзірлеуге тура келеді, бірақ ең жалпы және ақылға қонымды талаптарды қоспағанда, код жылдамдығына ешқашан дерлік талаптар жоқ.

Сондықтан, менің дағдылар жиынтығым Tensorflow кітапханасын жазатындардан және l1 кэшін және ұқсас нәрселерді тиімді пайдалану үшін кодты оңтайландыру туралы ойлайтындардан өте ерекшеленеді, сондықтан сізге нақты не қажет екенін қараңыз және оқудың дұрыс жолын бағалаңыз.

Мысалы, питон үшін адамдар қазірдің өзінде жасайды карта тіл үйрену.

Әрине, сіздің қажеттіліктеріңіз үшін тәжірибелі кеңестер мен жақсы көздер бар - сіз тізімді таңдап, онымен жұмыс істеуге кірісуіңіз керек.

Бизнес-процестерді түсіну

Онсыз сіз ешқайда бара алмайсыз: сіз бұл процесте не үшін қажет екеніңізді, не істеп жатқаныңызды және неге екенін түсінуіңіз керек. Көбінесе бұл сізге көп уақытты үнемдеуге, пайдаңызды арттыруға және уақыт пен ресурстарды босқа жұмсауға жол бермеуге мүмкіндік береді.

Әдетте мен өзіме мынадай сұрақтар қоямын:

  • Мен компанияда нақты не істеймін?
  • Неліктен?
  • Оны кім және қалай пайдаланады?
  • Менде қандай опциялар бар?
  • Параметрлердің шектері қандай?

Параметрлер туралы толығырақ: егер сіз бірдеңені құрбан етуге болатынын білсеңіз, жұмыс сценарийін жиі өзгерте аласыз: мысалы, түсіндіру немесе керісінше, мұнда бірнеше пайыз рөл атқармайды және бізде өте жылдам. шешім, және ол клиентке қажет, өйткені ол құбырдың AWS жүйесінде жұмыс істеп тұрған уақытын төлейді.

Математика

Мұнда сіз бәрін өзіңіз ойлайсыз және түсінесіз - негізгі математиканы білмей, сіз гранатасы бар маймылдардан басқа ештеңе емессіз (кешіріңіз Random Forest) - сондықтан сіз ең болмағанда негізгі нәрселерді түсінуіңіз керек. Егер мен өте аз тізімді құрастыратын болсам, ол мыналарды қамтиды:

  • Сызықтық алгебра - ресурстардың үлкен саны Google-ге оңай, сізге сәйкес келетінін іздеңіз;
  • Математикалық талдау – (кем дегенде алғашқы екі семестрде);
  • Ықтималдық теориясы машиналық оқытудың барлық жерінде;
  • Комбинаторика – ол шын мәнінде теорияны толықтырады;
  • Графикалық теория – кемінде БАЗИК;
  • Алгоритмдер – кем дегенде алғашқы екі семестр үшін (Корменнің өз кітабындағы ұсыныстарын қараңыз);
  • Мателогикалық - кем дегенде негізгі.

Деректерді практикалық талдау және визуализация

Ең маңызды нәрселердің бірі - қолыңызды деректермен ластаудан қорықпау және деректер жиынын, жобаны жан-жақты талдау және жылдам деректер визуализациясын жасау.

Барлау деректерін талдау барлық басқа деректерді түрлендіру және unix түйіндерінен қарапайым конвейер құру (алдыңғы мақалаларды қараңыз) немесе оқылатын және түсінікті жазу кітапшасын жазу мүмкіндігі сияқты жай ғана табиғи нәрсе болуы керек.

Визуализацияны атап өткім келеді: жүз рет естігеннен бір рет көрген жақсы.

Менеджерге графикті көрсету сандар жиынынан жүз есе оңай және түсінікті, сондықтан matplotlib, seaborn және ggplot2 сіздің достарыңыз.

Жұмсақ дағдылар

Өз идеяларыңызды, сондай-ақ нәтижелер мен алаңдаушылықтарды (т.б.) басқаларға жеткізе білу бірдей маңызды - тапсырманы техникалық және іскерлік тұрғыдан анық айта алатыныңызға көз жеткізіңіз.

Сіз әріптестерге, менеджерлерге, басшыларға, клиенттерге және оны қажет ететін кез келген адамға не болып жатқанын, қандай деректерді пайдаланып жатқаныңызды және қандай нәтиже алғаныңызды түсіндіре аласыз.

Диаграммаларыңыз бен құжаттарыңыз сізсіз оқылады. Яғни, онда не жазылғанын түсіну үшін сізге барудың қажеті жоқ.

Сіз жобаны/жұмысыңызды нақты түсіну және/немесе құжаттау үшін нақты презентация жасай аласыз.

Сіз өз ұстанымыңызды дәлелді және эмоционалды түрде жеткізе аласыз, «иә/жоқ» деп айта аласыз немесе шешімді сұрай аласыз/қолдай аласыз.

Тренингтер

Мұның бәрін үйренуге болатын көптеген әртүрлі орындар бар. Мен қысқаша тізім беремін - мен оның бәрін сынап көрдім және шынымды айтсам, әрбір элементтің жақсы және жаман жақтары бар. Оны қолданып көріңіз және сізге не сәйкес келетінін шешіңіз, бірақ мен бірнеше нұсқаны қолданып көруді және біреуіне жабыспауды ұсынамын.

  • Онлайн курстар: coursera, udacity, Edx және т.б.;
  • Жаңа мектептер: онлайн және офлайн - SkillFactory, ShAD, MADE;
  • Классикалық мектептер: университеттің магистратура бағдарламалары мен біліктілігін арттыру курстары;
  • Жобалар - сіз жай ғана сізді қызықтыратын тапсырмаларды таңдай аласыз және оларды github-қа жүктей аласыз;
  • Тағылымдамалар – бұл жерде бірдеңе ұсыну қиын, сіз қол жетімді нәрсені іздеп, қолайлы нұсқаларды табуыңыз керек.

Бұл қажет пе?

Қорытындылай келе, мен өзім ұстануға тырысатын үш жеке қағиданы қосқым келеді.

  • Қызықты болуы керек;
  • Ішкі рахат әкеліңіз (= кем дегенде қайғы-қасірет туғызбаңыз);
  • «Сіздікі болу үшін».

Неліктен олар? Күнделікті бірдеңе істеп, одан ләззат алмау немесе қызықпауды елестету қиын. Сіз дәрігер екеніңізді елестетіп көріңіз және сіз адамдармен сөйлесуді жек көресіз - бұл, әрине, қандай да бір жолмен жұмыс істеуі мүмкін, бірақ сізден бірдеңе сұрағысы келетін пациенттердің ағыны сізді үнемі ыңғайсыз сезінеді. Бұл ұзақ мерзімді перспективада жұмыс істемейді.

Неліктен мен ішкі рахат туралы ерекше атап өттім? Меніңше, бұл әрі қарай даму және негізінен оқу үдерісі үшін қажет. Мен қандай да бір күрделі функцияны аяқтап, үлгіні құрастырып немесе маңызды параметрді есептегенде, бұл маған өте ұнайды. Менің кодым эстетикалық әдемі және жақсы жазылған кезде мен оны ұнатамын. Сондықтан жаңа нәрсені үйрену қызықты және ешқандай маңызды мотивацияны тікелей қажет етпейді.

«Сіздікі болу» - бұл шамамен сіз істегіңіз келетін нәрсені сезіну. Менің шағын әңгімем бар. Мен бала кезімнен рок-музыкаға (және металға - SALMON!) қызығатынмын және басқалар сияқты мен де ойнауды үйренгім келді, барлығы осы. Менің естуім де, дауысым да жоқ екені белгілі болды - бұл мені мүлдем алаңдатпады (және бұл көптеген орындаушыларды сахнада алаңдатпайтынын айту керек), мен әлі мектепте оқып жүргенімде гитара алдым ... және сағаттап отырып ойнағанды ​​ұнатпайтыным белгілі болды. Бұл қиын болды, маған әрқашан бір ақымақтық шығып жатқандай көрінетін - мен одан мүлдем ләззат алмадым және жай ғана өзімді жаман, ақымақ және мүлде қабілетсіз сезіндім. Мен өзімді сабаққа отыруға мәжбүрледім және бұл жылқыға жақсы тамақ болмады.

Сонымен қатар, мен бірнеше сағат бойы ойыншық жасап, сценарийді пайдаланып, флеште (немесе басқа нәрседе) бір нәрсені жандандыру үшін өте тыныш отыра аламын және мен ойынның элементтерін аяқтауға немесе қозғалыс механикасымен және/немесе жұмыс істеуге ынталы болдым. үшінші тарап кітапханаларын, плагиндерді және басқаларды қосу.

Бір кезде мен гитарада ойнау менің ісім емес екенін және ойнағанды ​​емес, тыңдағанды ​​ұнататынымды түсіндім. Ойындар мен кодтарды жазғанда (сол кезде металдың барлық түрлерін тыңдайтын) көзім жарқырап кетті, бұл маған ұнады, мен мұны істеуім керек еді.

Басқа сұрақтарыңыз бар ма?

Әрине, біз барлық тақырыптар мен сұрақтарды қарастыра алмадық, сондықтан түсініктемелер жазыңыз және маған PM жіберіңіз - сұрақтарыңыз болса әрқашан қуаныштымын.

Жазбалар Күні Ғалым: неден бастау керек және бұл қажет пе?

Жазбалар Күні Ғалым: неден бастау керек және бұл қажет пе?

Ақпарат көзі: www.habr.com

пікір қалдыру