Тэмдэглэл Огноо Эрдэмтэн: хаанаас эхлэх вэ, шаардлагатай юу?

Тэмдэглэл Огноо Эрдэмтэн: хаанаас эхлэх вэ, шаардлагатай юу?

TL;DR бол мэдээллийн шинжлэх ухаан, мэргэжлээр хэрхэн орж, хэрхэн хөгжих талаар асуулт/хариулт өгөх нийтлэл юм. Нийтлэлд би үндсэн зарчим, түгээмэл асуултуудад дүн шинжилгээ хийх бөгөөд таны тодорхой асуултуудад хариулахад бэлэн байна - тайлбар дээр (эсвэл хувийн мессежээр) бичээрэй, би хэдхэн хоногийн дотор бүх зүйлд хариулахыг хичээх болно.

"Сатанист огноо" цуврал тэмдэглэл гарч ирснээр хэрхэн эхлэх, хаана ухах талаар олон мессеж, тайлбар ирсэн бөгөөд өнөөдөр бид нийтлэлийн дараа үүссэн гол ур чадвар, асуултуудад дүн шинжилгээ хийх болно.

Энд дурдсан бүх зүйл нь туйлын үнэн биш бөгөөд зохиогчийн субъектив үзэл бодол юм. Бид үйл явцад хамгийн чухал мэт санагдах гол зүйлсийг авч үзэх болно.

Энэ яг яагаад хэрэгтэй вэ?

Зорилгоо илүү сайн биелүүлэхийн тулд, энэ нь дор хаяж тодорхой харагдахын тулд - та Facebook/Apple/Amazon/Netflix/Google-д DS эсвэл Судалгааны ажилтан болохыг хүсч байна - тавигдах шаардлага, хэл, шаардлагатай ур чадварыг харна уу. ялангуяа аль албан тушаалд зориулагдсан. Ажилд авах үйл явц юу вэ? Ийм дүрд ердийн нэг өдөр яаж өнгөрдөг вэ? Тэнд ажиллаж байгаа хүний ​​дундаж үзүүлэлт ямар байх бол?

Ихэнхдээ ерөнхий дүр зураг нь хүн яг юу хүсч байгаагаа үнэхээр ойлгодоггүй бөгөөд энэ тодорхойгүй дүр төрхийг хэрхэн бэлтгэх нь бүрэн тодорхойгүй байдаг тул та яг юу хүсч байгаагаа дор хаяж бүдүүлэг төлөвлөгөөтэй байх нь зүйтэй юм.

Одоогийн зорилгын үзэл бодлыг тодорхой болгох

Тоглоомын явцад энэ нь өөрчлөгдөж, ерөнхийдөө төлөвлөгөөгөө өөрчлөх нь хэвийн үзэгдэл байсан ч гэсэн зорилго тавьж, түүндээ анхаарлаа төвлөрүүлж, үе үе дүгнэж, дахин бодож байх нь зүйтэй.

Энэ нь байх уу эсвэл хамааралтай хэвээр байна уу?

Та албан тушаалд томрох үед.

Албан тушаалд хүрэхээсээ өмнө докторын зэрэг хамгаалж, салбартаа 2-3 жил ажиллаж, сүм хийдэд бясалгал хийж байхдаа ерөнхийдөө үсээ тайрах хэрэгтэй гэж төсөөлөөд үз дээ - Data Science-ийн нөхцөл байдал эдийн засагч болон эдийн засагчдад байсантай ижил байх биш гэж үү. хуульчид? Таны хөөцөлдөхийг хүсч буй салбарт бүх зүйл танигдахын аргагүй өөрчлөгдөх болов уу?

Одоо бүгд тийшээ яарах боломж байхгүй гэж үү, бид энэ мэргэжлээр орохыг хичээж буй хүмүүсийн өргөн давхарга байгаа зургийг харах болно - зүгээр л өчүүхэн эхлэлийн байр суурь байх болно.

Замаа сонгохдоо зөвхөн хөдөлмөрийн зах зээлийн өнөөгийн байдал төдийгүй энэ нь хэрхэн өөрчлөгдөж, хаана байгаа талаарх таны санааг харгалзан үзэх нь зүйтэй болов уу.

Жишээлбэл, зохиолч Сатанист болно гэж төлөвлөөгүй ч докторын зэрэг хамгаалж байх хугацаандаа DS-тэй ижил төстэй ур чадвар бүхий гуравдагч талын төслүүд дээр ажиллаж байсан бөгөөд төгсөлтийн сургуулиа төгсөөд байгальд шилжиж, сайн сайхныг олж харжээ. байрлал.

Хэрэв жүжгийн явцад өөр газар нүүх шаардлагатай болох нь тогтоогдвол - одоо хамгийн их хөдөлгөөн өрнөж, хамгийн сонирхолтой үйлдлүүд болж байгаа тул бид аяндаа тийшээ шилжих болно.

Ур чадварын задаргаа

Эдгээр нь DS-д бүрэн, үр дүнтэй ажиллахад гол түлхүүр юм шиг санагддаг болзолт ур чадварын ангилал юм. Би англи хэлийг тусад нь онцлох болно - CS дээр юу ч хийсэн сур. Дараа нь гол ангилалууд.

Програмчлал/скрипт бичих

Та ямар хэлтэй заавал танилцах вэ? Python? Java? Бүрхүүлийн скрипт үү? Луа? Sql? C++?

Та яг юу хийх чадвартай байх ёстой вэ, яагаад програмчлалын хувьд - энд байгаа албан тушаалын хүрээ маш их ялгаатай.

Жишээлбэл, би ихэвчлэн нарийн төвөгтэй логик, асуулга, загвар, аналитикийг хэрэгжүүлэх, ерөнхийд нь тайлбарласан системийг боловсруулах шаардлагатай болдог боловч хамгийн ерөнхий бөгөөд боломжийн шаардлагаас бусад тохиолдолд кодын хурдны шаардлага бараг хэзээ ч байдаггүй.

Тиймээс миний ур чадвар нь Tensorflow номын сан бичиж, l1 кэш болон үүнтэй төстэй зүйлсийг үр ашигтай ашиглахын тулд кодыг оновчтой болгох талаар бодож байгаа хүмүүсээс тэс өөр тул яг юу хэрэгтэй байгааг харж, суралцах зөв замыг үнэлээрэй.

Жишээлбэл, python-ийн хувьд хүмүүс аль хэдийн бүрдүүлдэг газрын зураг хэл сурах.

Таны хэрэгцээнд тохирсон туршлагатай зөвлөгөө, сайн эх сурвалжууд байгаа нь гарцаагүй - та жагсаалтаа шийдэж, үүн дээр ажиллаж эхлэх хэрэгтэй.

Бизнесийн үйл явцыг ойлгох

Үүнгүйгээр та хаашаа ч явж чадахгүй: та энэ үйл явцад яагаад хэрэгтэй, юу хийж байгаагаа, яагаад гэдгийг ойлгох хэрэгтэй. Ихэнхдээ энэ нь танд маш их цаг хэмнэж, ашиг тусаа нэмэгдүүлж, цаг хугацаа, нөөцийг дэмий хоосон зүйлд үрэхгүй байх болно.

Би ихэвчлэн дараах асуултуудыг өөрөөсөө асуудаг.

  • Би компанид яг юу хийдэг вэ?
  • Яагаад?
  • Үүнийг хэн, хэрхэн ашиглах вэ?
  • Надад ямар сонголт байна вэ?
  • Параметрүүдийн хязгаар нь юу вэ?

Параметрүүдийн талаар бага зэрэг дэлгэрэнгүй авч үзье: хэрэв та ямар нэг зүйлийг золиослох боломжтой гэдгийг мэддэг бол ажлын хувилбарыг ихэвчлэн өөрчлөх боломжтой: жишээлбэл, тайлбарлах чадвар эсвэл эсрэгээр, энд хэдэн хувь нь ямар ч үүрэг гүйцэтгэхгүй бөгөөд бидэнд маш хурдан байдаг. шийдэл бөгөөд AWS-д дамжуулах хоолой ажиллаж байгаа хугацааны төлбөрийг төлдөг тул үйлчлүүлэгчид хэрэгтэй.

Математик

Энд та бүх зүйлийг өөрөө бодож, ойлгодог - үндсэн математикийн мэдлэггүй бол та гранат барьсан сармагчингаас өөр юу ч биш (санамсаргүй ойг уучлаарай) - тиймээс та ядаж үндсэн зүйлийг ойлгох хэрэгтэй. Хэрэв би маш бага жагсаалт гаргах юм бол дараахь зүйлийг багтаана.

  • Шугаман алгебр - асар олон тооны нөөцийг Google-д ашиглахад хялбар байдаг тул өөрт хамгийн тохиромжтой зүйлийг хайж олох;
  • Математикийн шинжилгээ - (хамгийн багадаа эхний хоёр семестр);
  • Машины сургалтын явцад магадлалын онол хаа сайгүй байдаг;
  • Комбинаторик - энэ нь үнэндээ онолын нэмэлт зүйл юм;
  • График онол - наад зах нь BASIC;
  • Алгоритмууд - хамгийн багадаа эхний хоёр семестр (Кормены номон дээрх зөвлөмжийг үзнэ үү);
  • Мателогик - наад зах нь суурь.

Практик өгөгдөлд дүн шинжилгээ хийх, дүрслэх

Хамгийн чухал зүйлсийн нэг бол өгөгдөлд гараа бохирдуулахаас айхгүй байх, өгөгдлийн багц, төсөлд иж бүрэн дүн шинжилгээ хийж, хурдан өгөгдлийн дүрслэлийг бий болгох явдал юм.

Хайгуулын мэдээллийн дүн шинжилгээ нь бусад бүх өгөгдлийн хувиргалт, unix зангилаанаас энгийн дамжуулах хоолой үүсгэх (өмнөх нийтлэлүүдийг үзнэ үү) эсвэл унших боломжтой, ойлгомжтой тэмдэглэлийн дэвтэр бичих чадвартай адил энгийн зүйл болох ёстой.

Би дүрслэлийг дурдмаар байна: зуун удаа сонссоноос нэг удаа харсан нь дээр.

Менежерт график үзүүлэх нь олон тооны тооноос зуу дахин хялбар бөгөөд ойлгомжтой байдаг тул matplotlib, seaborn, ggplot2 нь таны найзууд юм.

Зөөлөн ур чадвар

Өөрийнхөө санаа, үр дүн, санаа зовоосон асуудлаа (гэх мэт) бусдад дамжуулах чадвартай байх нь нэгэн адил чухал бөгөөд та даалгавраа техникийн болон бизнесийн аль алинд нь тодорхой хэлж чадах эсэхийг шалгаарай.

Та хамтран ажиллагсад, менежерүүд, дээд удирдлагууд, үйлчлүүлэгчид болон хэрэгтэй байгаа бусад хүмүүст юу болж байгаа, ямар өгөгдөл ашиглаж байгаа, ямар үр дүнд хүрсэн талаар тайлбарлаж болно.

Таны график, баримт бичгийг чамгүйгээр унших ёстой. Өөрөөр хэлбэл, тэнд юу бичсэнийг ойлгохын тулд тан руу очих шаардлагагүй.

Та зорилгоо ойлгохын тулд тодорхой танилцуулга хийж, төсөл/өөрийнхөө ажлыг баримтжуулж болно.

Та өөрийн байр суурийг үндэслэлтэй, сэтгэл хөдлөлгүй илэрхийлж, "тийм/үгүй" гэж хэлэх эсвэл шийдвэрээ асуух/дэмжлэх боломжтой.

Сургалтын үеэр

Энэ бүгдийг сурч болох олон янзын газар байдаг. Би богино жагсаалт өгөх болно - би бүх зүйлийг туршиж үзсэн бөгөөд үнэнийг хэлэхэд зүйл бүр өөрийн гэсэн давуу болон сул талуудтай. Үүнийг туршиж үзээд өөрт тохирохыг нь шийдээрэй, гэхдээ би хэд хэдэн сонголтыг туршиж үзэхийг зөвлөж байна.

  • Онлайн курсууд: coursera, udacity, Edx гэх мэт;
  • Шинэ сургуулиуд: онлайн болон офлайн - SkillFactory, ShAD, MADE;
  • Сонгодог сургуулиуд: их сургуулийн магистрын хөтөлбөр, ахисан түвшний сургалтууд;
  • Төслүүд - та зүгээр л сонирхож буй ажлуудаа сонгоод, github-д байршуулж болно;
  • Дадлага хийх - энд ямар нэгэн зүйл санал болгоход хэцүү байдаг; та боломжтой зүйлийг хайж, тохирох сонголтыг олох хэрэгтэй.

Шаардлагатай юу?

Эцэст нь хэлэхэд, би өөрийнхөө дагаж мөрдөхийг хичээдэг гурван хувийн зарчмыг нэмж хэлэх болно.

  • Сонирхолтой байх ёстой;
  • Дотоод таашаал авчрах (= ядаж зовлон учруулахгүй байх);
  • "Чинийх байх."

Яагаад тэд? Өдөр бүр ямар нэг зүйл хийж байгаад таашаал авахгүй, сонирхохгүй байна гэж төсөөлөхөд бэрх. Та эмч хүн бөгөөд хүмүүстэй харилцахыг үзэн яддаг гэж төсөөлөөд үз дээ - энэ нь мэдээжийн хэрэг ямар нэгэн байдлаар ажиллах болно, гэхдээ танаас ямар нэг зүйл асуухыг хүссэн өвчтөнүүдийн урсгалд та байнга эвгүй байх болно. Энэ нь урт хугацаанд ажиллахгүй.

Би яагаад дотоод таашаалыг тусгайлан дурьдсан бэ? Энэ нь цаашдын хөгжил, зарчмын хувьд сургалтын үйл явцад зайлшгүй шаардлагатай юм шиг санагдаж байна. Би ямар нэг нарийн төвөгтэй функцийг дуусгаж, загвар бүтээх эсвэл чухал параметрийг тооцоолоход үнэхээр баяртай байна. Миний код нь гоо зүйн хувьд үзэсгэлэнтэй, сайн бичигдсэн байх нь надад таалагддаг. Тиймээс шинэ зүйл сурах нь сонирхолтой бөгөөд ямар нэгэн чухал сэдэл шууд шаарддаггүй.

"Чинийх байх" гэдэг нь таны хийхийг хүссэн зүйлтэй ижил мэдрэмж юм. Надад бяцхан түүх байна. Би багаасаа рок хөгжим (мөн металл - SALMON!) сонирхдог байсан бөгөөд бусад хүмүүсийн адилаар хэрхэн тоглож сурахыг хүсдэг байсан, тэгээд л болоо. Би сонсголгүй, дуу хоолойгүй болсон - энэ нь надад огтхон ч саад болоогүй (мөн энэ нь тайзан дээр олон жүжигчдийг зовоодоггүй гэдгийг хэлэх ёстой), би сургуульд байхдаа гитар авсан ... мөн Би олон цагаар суугаад түүн дээр тоглох дургүй болох нь тодорхой болсон. Энэ нь хэцүү байсан, надад ямар нэг тэнэг зүйл гарч ирж байгаа юм шиг санагддаг - би үүнээс огт таашаал аваагүй бөгөөд зүгээр л муухай, тэнэг, бүрэн чадваргүй мэт санагдсан. Би шууд утгаараа хичээлдээ суух гэж өөрийгөө албадсан бөгөөд ерөнхийдөө энэ нь моринд сайн хоол биш байсан.

Үүний зэрэгцээ би хэдэн цагийн турш тайван сууж, тоглоом бүтээж, скрипт ашиглан флаш (эсвэл өөр зүйл) дээр ямар нэг зүйлийг хөдөлгөөнт дүрслэх боломжтой байсан бөгөөд би тоглоомын элементүүдийг дуусгах эсвэл хөдөлгөөний механиктай харьцах хүсэл эрмэлзэлтэй байсан. гуравдагч этгээдийн номын сан, залгаасууд болон бусад бүх зүйлийг холбох.

Тэгээд хэзээ нэгэн цагт би гитар тоглох нь миний хийх зүйл биш бөгөөд тоглох биш харин сонсох дуртай гэдгээ ойлгосон. Тоглоом, код бичих үед (тэр үед бүх төрлийн метал сонсож байсан) нүд минь гялалзаж, тэр үед надад таалагдаж байсан, би үүнийг хийх ёстой байсан.

Танд өөр асуулт байна уу?

Мэдээжийн хэрэг, бид бүх сэдэв, асуултуудыг үзэж чадаагүй тул сэтгэгдэл бичиж, надад PM илгээнэ үү - Би асуулт асуухдаа үргэлж баяртай байдаг.

Тэмдэглэл Огноо Эрдэмтэн: хаанаас эхлэх вэ, шаардлагатай юу?

Тэмдэглэл Огноо Эрдэмтэн: хаанаас эхлэх вэ, шаардлагатай юу?

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх