Cathetan Tanggal Ilmuwan: ngendi kanggo miwiti lan iku perlu?

Cathetan Tanggal Ilmuwan: ngendi kanggo miwiti lan iku perlu?

TL; DR minangka kiriman kanggo pitakonan / wangsulan babagan Ilmu Data lan kepiye mlebu profesi lan berkembang. Ing artikel kasebut, aku bakal nganalisa prinsip dhasar lan FAQ lan siap mangsuli pitakon tartamtu - tulis ing komentar (utawa ing pesen pribadi), aku bakal nyoba njawab kabeh sajrone sawetara dina.

Kanthi tekane saka seri cathetan "Tanggal Setan", akeh pesen lan komentar teka karo pitakonan babagan carane miwiti lan ngendi kanggo dig, lan dina iki kita bakal njelasno skills utama lan pitakonan sing muncul sawise publikasi.

Kabeh sing kasebut ing kene ora ngaku minangka bebener sing paling utama lan minangka pendapat subyektif saka penulis. Kita bakal ndeleng perkara utama sing katon paling penting ing proses kasebut.

Apa persis iki dibutuhake?

Supaya gol bisa luwih apik, supaya katon paling ora spesifik - sampeyan pengin dadi DS utawa Ilmuwan Riset ing Facebook/Apple/Amazon/Netflix/Google - deleng syarat, basa lan katrampilan sing dibutuhake khusus kanggo posisi sing. Apa proses hiring? Kepiye carane dina sing biasane ditindakake ing peran kasebut? Apa profil rata-rata wong sing kerja ing kana katon kaya?

Asring gambaran sakabèhé yaiku wong ora ngerti apa sing dikarepake lan ora jelas carane nyiyapake gambar sing ora jelas iki - mula kudu ana rencana kasar babagan apa sing dikarepake.

Concretize tampilan goal saiki

Malah yen owah-owahan ing dalan, lan iku umume normal kanggo ngganti plans sak Course saka muter, iku worth a goal lan fokus ing, periodik ngevaluasi lan rethiking.

Apa bakal dadi utawa isih relevan?

Nalika sampeyan tuwuh dadi posisi.

Bayangake sadurunge posisi sampeyan kudu entuk gelar PhD, kerja suwene 2-3 taun ing industri lan umume ngethok rambut nalika semedi ing biara - apa kahanan Ilmu Data ora bakal padha karo para ahli ekonomi lan pengacara? Apa kabeh bakal owah ngluwihi pangenalan ing wilayah sing pengin sampeyan tindakake?

Apa ora ana kesempatan sing apik yen kabeh wong bakal cepet-cepet ana saiki lan kita bakal weruh gambar ing ngendi ana lapisan akeh wong sing nyoba mlebu profesi - lan mung ana posisi wiwitan sing sithik.

Sampeyan bisa uga kudu nimbang tren saiki nalika milih dalan, ora mung kahanan pasar tenaga kerja saiki, nanging uga ide sampeyan babagan owah-owahan lan ing endi.

Contone, penulis ora rencana kanggo dadi Satanist, nanging sak PhD dheweke makarya ing proyèk pihak katelu sing wis skills kuwat ing umum karo DS, lan ing mburi lulusan sekolah alamiah pindhah menyang lingkungan, ndeleng apik. posisi.

Yen sajrone dolanan kasebut, mesthine kudu pindhah menyang papan liya - amarga saiki ana gerakan sing paling akeh lan kabeh tumindak sing paling menarik, mula kita bakal pindhah kanthi alami.

Skill Breakdown

Iki kategori saratipun saka skills sing koyone kula tombol kanggo karya lengkap lan efektif ing DS. Aku bakal nyorot basa Inggris kanthi kapisah - sinau apa wae sing sampeyan lakoni ing CS. Sabanjure yaiku kategori utama.

Pemrograman/Scripting

Apa basa sing sampeyan mesthi bakal kenal? Python? Jawa? Shell scripting? Lua? Sql? C++?

Apa persis sing kudu sampeyan lakoni lan kenapa babagan pemrograman - macem-macem posisi ing kene beda-beda.

Contone, aku kerep kudu ngetrapake logika kompleks, pitakon, model, analytics, lan umume ngembangake sistem sing diinterpretasikake, nanging meh ora ana syarat kanggo kacepetan kode, kajaba sing paling umum lan cukup.

Mulane, set skill saya beda banget karo wong-wong sing nulis perpustakaan Tensorflow lan mikir babagan ngoptimalake kode kanggo nggunakake cache l1 sing efisien lan bab sing padha, mula ndeleng apa sing sampeyan butuhake lan ngevaluasi dalan sing bener kanggo sinau.

Contone, kanggo python, wong wis nggawe peta sinau basa.

Mesthine, wis ana saran sing berpengalaman lan sumber sing apik kanggo kabutuhan sampeyan - sampeyan kudu mutusake dhaptar lan miwiti nggarap.

Ngerteni proses bisnis

Sampeyan ora bisa menyang ngendi wae tanpa: sampeyan kudu ngerti sebabe sampeyan dibutuhake ing proses iki, apa sing sampeyan lakoni lan kenapa. Asring iki sing bisa ngirit wektu, nggedhekake keuntungan lan ora mbuwang wektu lan sumber daya ing omong kosong.

Biasane, aku takon dhewe pitakonan ing ngisor iki:

  • Apa persis aku ing perusahaan?
  • Kenapa?
  • Sapa sing bakal nggunakake lan kepiye carane?
  • opsi apa aku duwe?
  • Apa watesan paramΓ¨ter?

Mangkene luwih rinci babagan paramèter: sampeyan bisa asring ngganti skenario kerja yen sampeyan ngerti manawa ana sing bisa dikorbanake: contone, interpretability utawa kosok balene, sawetara persen ora bakal main peran ing kene lan kita duwe cepet banget. solusi, lan klien mbutuhake, amarga dheweke mbayar wektu pipo mlaku ing AWS.

MatΓ©matika

Kene sampeyan mikir lan ngerti kabeh dhewe - tanpa kawruh matΓ©matika dhasar sampeyan ora luwih saka kethek karo granat (nuwun sewu Random Forest) - supaya sampeyan kudu ngerti paling bab dhasar. Yen aku nggawe dhaptar sing paling tithik, kalebu:

  • Aljabar linier - akeh sumber daya gampang kanggo Google, goleki apa sing paling cocog karo sampeyan;
  • Analisis matematika - (paling ora ing rong semester pisanan);
  • Teori probabilitas ana ing ngendi wae ing machine learning;
  • Combinatorics - iku bener nglengkapi teori;
  • Teori grafik - paling ora BASIC;
  • Algoritma - paling ora kanggo rong semester pisanan (pirsani rekomendasi Cormen ing bukune);
  • Mathlogic - paling dhasar.

Analisis data lan visualisasi praktis

Salah sawijining perkara sing paling penting yaiku supaya ora wedi nggawe tangan sampeyan reged karo data lan nganakake analisis lengkap dataset, proyek, lan nggawe visualisasi data kanthi cepet.

Analisis data eksplorasi mung kudu dadi alam, kaya kabeh transformasi data liyane lan kemampuan kanggo nggawe pipa prasaja saka simpul unix (ndeleng artikel sadurunge) utawa nulis notebook sing bisa diwaca lan bisa dingerteni.

Aku pengin nyebutake visualisasi: luwih becik ndeleng sapisan tinimbang ngrungokake kaping satus.

Nuduhake grafik menyang manajer iku kaping satus luwih gampang lan luwih jelas tinimbang sakumpulan nomer, mula matplotlib, seaborn lan ggplot2 dadi kanca.

Katrampilan alus

Sampeyan uga penting kanggo bisa ngandhani gagasan sampeyan, uga asil lan keprihatinan (dsb.) marang wong liya - priksa manawa sampeyan bisa nyatakake tugas kanthi jelas ing istilah teknis lan bisnis.

Sampeyan bisa nerangake marang kolega, manajer, atasan, klien lan sapa wae sing mbutuhake apa sing kedadeyan, data apa sing sampeyan gunakake lan asil apa sing sampeyan entuk.

Denah lan dokumentasi sampeyan kudu diwaca tanpa sampeyan. Tegese, sampeyan ora perlu menyang sampeyan kanggo mangerteni apa sing ditulis ing kono.

Sampeyan bisa nggawe presentasi sing jelas kanggo ngerteni lan / utawa nyathet proyek / karya sampeyan.

Sampeyan bisa ngirim posisi kanthi alasan lan ora emosional, ujar "ya / ora" utawa pitakon / ndhukung keputusan.

Sesi latihan

Ana akeh macem-macem panggonan ngendi sampeyan bisa sinau kabeh iki. Aku bakal menehi dhaptar singkat - Aku nyoba kabeh saka iku lan, jujur, saben item wis Pros lan cons. Coba lan mutusake apa sing cocog karo sampeyan, nanging aku nyaranake nyoba sawetara opsi lan ora macet ing salah siji.

  • Kursus online: coursera, udacity, Edx, lsp;
  • Sekolah anyar: online lan offline - SkillFactory, ShAD, MADE;
  • Sekolah klasik: program master universitas lan kursus pelatihan lanjutan;
  • Proyek - sampeyan mung bisa milih tugas sing sampeyan minati lan dipotong, diunggah menyang github;
  • Internships - angel menehi saran apa wae ing kene; sampeyan kudu nggoleki apa sing kasedhiya lan golek pilihan sing cocog.

Apa perlu?

Ing kesimpulan, aku bakal nambah telung prinsip pribadhi sing aku coba tindakake dhewe.

  • Mesthine menarik;
  • Nggawa kasenengan batin (= paling ora njalari kasangsaran);
  • "Dadi sampeyan."

Kenapa wong-wong mau? Pancen angel mbayangno tumindak saben dina lan ora seneng utawa ora kasengsem. Mbayangno yen sampeyan dokter lan sampeyan ora seneng sesambungan karo wong - iki, mesthi, bisa uga, nanging sampeyan bakal terus-terusan ora nyaman karo aliran pasien sing pengin takon sampeyan. Iki ora bisa digunakake ing jangka panjang.

Yagene aku khusus nyebutake rasa seneng internal? Iku misale jek kula iki perlu kanggo pangembangan luwih lan, ing asas, proses learning. Aku seneng banget nalika aku ngatur kanggo ngrampungake sawetara fitur Komplek lan mbangun model utawa ngetung parameter penting. Aku seneng nalika kode sandi ayu estetis lan uga ditulis. Mula, sinau bab anyar iku menarik lan ora langsung mbutuhake motivasi sing signifikan.

"Dadi sampeyan" iku perasaan sing padha yen iki kira-kira sing dikarepake. Aku duwe crita sethithik. Wiwit cilik, aku wis kasengsem ing musik rock (lan metal - SALMON!) Lan, kaya akeh liyane, aku wanted kanggo sinau carane muter lan iku kabeh. Ternyata aku ora krungu lan ora duwe swara - iki ora ngganggu aku (lan aku kudu ngomong iki ora ngganggu akeh pemain ing panggung), lan nalika aku isih sekolah aku entuk gitar... dadi cetha yen aku ora seneng lungguh nganti pirang-pirang jam lan muter. Iku angel banget, aku tansah katon kaya omong kosong sing metu - aku ora seneng banget lan mung rumangsa ala, bodho lan ora bisa. Aku secara harfiah dipeksa aku kanggo njagong mudhun kanggo kelas lan ing umum iku ora apik pangan kanggo jaran.

Ing wektu sing padha, aku bisa lungguh kanthi tenang nganti pirang-pirang jam ngembangake dolanan, nggunakake skrip kanggo nggawe animasi ing lampu kilat (utawa liyane) lan aku motivasi banget kanggo ngrampungake unsur ing game kasebut utawa ngatasi mekanika gerakan lan / utawa nyambungake perpustakaan pihak katelu, plugins lan kabeh liya.

Lan ing sawetara titik aku temen maujud sing muter gitar iku dudu bab kula lan aku pancene seneng ngrungokake, ora muter. Lan mripatku sparkled nalika aku nulis game lan kode (ngrungokake kabeh limo logam ing wayahe) lan apa aku disenengi banjur, lan apa aku kudu wis dilakoni.

Apa sampeyan duwe pitakonan liyane?

Mesthi, kita ora bisa mbukak kabeh topik lan pitakonan, supaya nulis komentar lan PM kula - Aku tansah seneng duwe pitakonan.

Cathetan Tanggal Ilmuwan: ngendi kanggo miwiti lan iku perlu?

Cathetan Tanggal Ilmuwan: ngendi kanggo miwiti lan iku perlu?

Source: www.habr.com

Add a comment