Notlar Tarih Bilimcisi: nereden başlamalı ve gerekli mi?

Notlar Tarih Bilimcisi: nereden başlamalı ve gerekli mi?

TL;DR, Veri Bilimi ve mesleğe nasıl girileceği ve bu alanda nasıl gelişileceği ile ilgili soru/cevapların yer aldığı bir gönderidir. Makalede temel ilkeleri ve SSS'yi analiz edeceğim ve özel sorularınızı yanıtlamaya hazırım - yorumlara (veya özel mesaja) yazın, birkaç gün içinde her şeyi yanıtlamaya çalışacağım.

“Satanist Date” not serisinin ortaya çıkışıyla birlikte, nasıl başlayacağımız ve nereden kazacağımıza dair sorular içeren birçok mesaj ve yorum geldi ve bugün, yayınlardan sonra ortaya çıkan temel becerileri ve soruları analiz edeceğiz.

Burada belirtilen her şey nihai gerçek olduğunu iddia etmez ve yazarın öznel görüşüdür. Süreçte en önemli görünen ana şeylere bakacağız.

Buna tam olarak neden ihtiyaç duyuluyor?

Hedefin daha iyi ulaşılabilir olması ve en azından biraz spesifik görünmesi için - Facebook/Apple/Amazon/Netflix/Google'da DS veya Araştırma Bilimcisi olmak istiyorsunuz - gereksinimlere, dillere ve gerekli becerilere bakın özellikle hangi pozisyon için. İşe alım süreci nedir? Böyle bir rolde sıradan bir gününüz nasıl geçiyor? Orada çalışan bir kişinin ortalama profili nasıl görünüyor?

Genellikle genel tablo, bir kişinin tam olarak ne istediğini gerçekten anlamadığı ve bu belirsiz görüntüye nasıl hazırlanacağının tam olarak belli olmadığı yönündedir - bu nedenle, tam olarak ne istediğinize dair en azından kaba bir plana sahip olmaya değer.

Mevcut hedef görünümünü somutlaştırın

Yol boyunca değişse ve oyun sırasında planların değiştirilmesi genellikle normal olsa da, bir hedef belirlemeye ve ona odaklanmaya, periyodik olarak değerlendirmeye ve yeniden düşünmeye değer.

Olacak mı yoksa hala geçerli mi?

Zamanla bir pozisyona ulaşacaksınız.

Pozisyonunuza gelmeden önce doktora yapmanız, sektörde 2-3 yıl çalışmanız ve genellikle bir manastırda meditasyon yaparken saçınızı kesmeniz gerektiğini düşünün - Veri Bilimi'nin durumu bir zamanlar ekonomistler ve bilim adamları ile aynı olmayacak mı? avukatlar mı? Takip etmek istediğiniz alanda her şey tanınmayacak kadar değişecek mi?

Şimdi herkesin oraya koşması ve mesleğe girmeye çalışan geniş bir insan katmanının olduğu ve sadece yetersiz bir başlangıç ​​\uXNUMXb\uXNUMXbpozisyonunun olacağı bir resim görme ihtimalimiz yüksek değil mi?

Bir yol seçerken sadece işgücü piyasasının mevcut durumunu değil, aynı zamanda onun nasıl değiştiğine ve nerede olduğuna dair fikrinizi de dikkate almak, mevcut eğilimleri dikkate almaya değer olabilir.

Örneğin, yazar bir Satanist olmayı planlamamıştı, ancak doktorası sırasında DS ile güçlü ortak becerilere sahip üçüncü taraf projeler üzerinde çalıştı ve yüksek lisans eğitiminin sonunda doğal olarak çevreye geçti ve iyi bir şey gördü. konum.

Oyun sırasında başka bir yere taşınmanın gerekli olacağı ortaya çıkarsa - çünkü artık en fazla hareket var ve en ilginç aksiyonun tamamı gerçekleşiyor, o zaman doğal olarak oraya hareket edeceğiz.

Beceri Dağılımı

Bunlar bana DS'de tam ve etkili çalışmanın anahtarı gibi görünen koşullu beceri kategorileridir. İngilizceyi ayrıca vurgulayacağım - CS'de ne yaparsanız yapın öğrenin. Sonraki anahtar kategorilerdir.

Programlama/Komut Dosyası Yazma

Hangi dilleri tanıyacağınızdan eminsiniz? Piton mu? Java'yı mı? Kabuk komut dosyası mı? Lua mı? Sql mi? C++ mı?

Programlama açısından tam olarak neyi yapabilmeniz gerekiyor ve neden - buradaki pozisyon aralığı büyük ölçüde farklılık gösteriyor.

Örneğin, genellikle karmaşık mantık, sorgular, modeller, analitikler uygulamak ve genel olarak yorumlanmış sistemler geliştirmek zorunda kalıyorum, ancak en genel ve makul olanlar dışında neredeyse hiçbir zaman kod hızına yönelik gereksinimler olmuyor.

Bu nedenle benim becerilerim, Tensorflow kütüphanesini yazan ve l1 önbelleğinin verimli kullanımı ve benzeri şeyler için kodu optimize etmeyi düşünenlerden çok farklı; bu yüzden tam olarak neye ihtiyacınız olduğuna bakın ve öğrenmeye giden doğru yolu değerlendirin.

Örneğin python için insanlar zaten makyaj yapıyor harita Dil öğrenmek.

Elbette ihtiyaçlarınıza yönelik deneyimli tavsiyeler ve iyi kaynaklar zaten var - bir listeye karar vermeniz ve üzerinde çalışmaya başlamanız gerekiyor.

İş süreçlerini anlamak

Onsuz hiçbir yere gidemezsiniz: Bu süreçte neden size ihtiyaç duyulduğunu, ne yaptığınızı ve nedenini anlamalısınız. Çoğu zaman bu size çok zaman kazandırabilir, faydanızı en üst düzeye çıkarabilir ve zamanınızı ve kaynaklarınızı saçmalıklarla boşa harcamanıza engel olabilir.

Genellikle kendime şu soruları soruyorum:

  • Şirkette tam olarak ne yapıyorum?
  • Neden?
  • Kim ve nasıl kullanacak?
  • Hangi seçeneklere sahibim?
  • Parametrelerin limitleri nelerdir?

Parametreler hakkında biraz daha ayrıntı verelim: Bir şeyin feda edilebileceğini biliyorsanız, çalışma senaryosunu genellikle büyük ölçüde değiştirebilirsiniz: örneğin, yorumlanabilirlik veya tam tersi, yüzde birkaçı burada bir rol oynamayacaktır ve çok hızlı bir şekilde hareket ediyoruz. çözüm ve müşterinin buna ihtiyacı var çünkü işlem hattının AWS'de çalıştığı süre için ödeme yapıyor.

Matematik

Burada her şeyi kendiniz düşünür ve anlarsınız - temel matematik bilgisi olmadan, el bombası taşıyan maymunlardan başka bir şey değilsiniz (kusura bakmayın Rastgele Orman) - bu yüzden en azından temel şeyleri anlamalısınız. Çok minimal bir liste derleyecek olsaydım şunları içerirdi:

  • Doğrusal cebir - Google'da çok sayıda kaynak kolaydır, size en uygun olanı arayın;
  • Matematiksel analiz - (en azından ilk iki yarıyılda);
  • Olasılık teorisi makine öğreniminin her yerindedir;
  • Kombinatorik – aslında teorinin tamamlayıcısıdır;
  • Grafik teorisi - en azından BASIC;
  • Algoritmalar - en azından ilk iki dönem için (Cormen'in kitabındaki tavsiyelerine bakın);
  • Mathlogic - en azından temel.

Pratik veri analizi ve görselleştirme

En önemli şeylerden biri verilerle ellerinizi kirletmekten korkmamak ve veri kümesinin kapsamlı bir analizini yapabilmek, projelendirebilmek ve hızlı bir veri görselleştirmesi oluşturabilmektir.

Keşif amaçlı veri analizi, diğer tüm veri dönüşümleri ve unix düğümlerinden basit bir ardışık düzen oluşturma (önceki makalelere bakın) veya okunabilir ve anlaşılır bir not defteri yazma yeteneği gibi doğal bir şey haline gelmelidir.

Görselleştirmeden bahsetmek istiyorum: Yüz kez duymaktansa bir kez görmek daha iyidir.

Bir yöneticiye grafik göstermek, bir dizi sayıdan yüz kat daha kolay ve nettir; dolayısıyla matplotlib, seaborn ve ggplot2 sizin arkadaşlarınızdır.

Hassas Yetenek

Fikirlerinizi, sonuçlarınızı ve endişelerinizi (vb.) başkalarına iletebilmeniz de aynı derecede önemlidir; görevi hem teknik hem de ticari açıdan açıkça ifade edebildiğinizden emin olun.

Meslektaşlarınıza, yöneticilerinize, üstlerinize, müşterilerinize ve ihtiyacı olan herkese neler olduğunu, hangi verileri kullandığınızı ve hangi sonuçları elde ettiğinizi açıklayabilirsiniz.

Grafikleriniz ve belgeleriniz siz olmadan okunmalıdır. Yani orada yazılanları anlamak için yanınıza gitmenize gerek yok.

Projeyi/çalışmanızı anlatmak ve/veya belgelemek için net bir sunum yapabilirsiniz.

Durumunuzu mantıklı ve duygusuz bir şekilde aktarabilir, “evet/hayır” diyebilir veya bir kararı sorgulayabilir/destekleyebilirsiniz.

eğitim

Tüm bunları öğrenebileceğiniz birçok farklı yer var. Kısa bir liste vereceğim - her şeyi denedim ve dürüst olmak gerekirse her öğenin artıları ve eksileri var. Deneyin ve size uygun olana karar verin, ancak birkaç seçeneği denemenizi ve bir tanesine takılıp kalmamanızı şiddetle tavsiye ederim.

  • Çevrimiçi kurslar: coursera, udacity, Edx, vb;
  • Yeni okullar: çevrimiçi ve çevrimdışı - SkillFactory, ShAD, MADE;
  • Klasik okullar: üniversite yüksek lisans programları ve ileri eğitim kursları;
  • Projeler - ilginizi çeken görevleri seçip kesip github'a yükleyebilirsiniz;
  • Stajlar - burada herhangi bir şey önermek zor; neyin mevcut olduğunu araştırmalı ve uygun seçenekleri bulmalısınız.

Bu gerekli mi?

Sonuç olarak muhtemelen benim de takip etmeye çalıştığım üç kişisel prensibi ekleyeceğim.

  • İlginç olmalı;
  • İçsel zevk getirin (= en azından acı çekmeyin);
  • "Senin olmak."

Neden onlar? Her gün bir şey yapmayı ve ondan zevk almamayı ya da ilgilenmemeyi hayal etmek zor. Bir doktor olduğunuzu ve insanlarla iletişim kurmaktan nefret ettiğinizi hayal edin - bu elbette bir şekilde işe yarayabilir, ancak size bir şey sormak isteyen hastaların akışından sürekli rahatsız olacaksınız. Bu uzun vadede işe yaramaz.

Neden özellikle içsel zevkten bahsettim? Bana öyle geliyor ki bu daha fazla gelişme ve prensip olarak öğrenme süreci için gerekli. Bazı karmaşık özellikleri tamamlayıp bir model oluşturmayı veya önemli bir parametreyi hesaplamayı başardığımda bundan gerçekten keyif alıyorum. Kodumun estetik açıdan güzel ve iyi yazılmış olmasından keyif alıyorum. Bu nedenle yeni bir şey öğrenmek ilgi çekicidir ve doğrudan önemli bir motivasyon gerektirmez.

"Senin olmak" kabaca yapmak istediğin şeyin bu olduğu hissiyle aynı duygudur. Küçük bir hikayem var. Çocukluğumdan beri rock müziğe (ve metale - SALMON!) ilgim vardı ve pek çok kişi gibi ben de çalmayı öğrenmek istedim, hepsi bu. İşitme yeteneğimin ve sesimin olmadığı ortaya çıktı - bu beni hiç rahatsız etmedi (ve bunun sahnedeki pek çok sanatçıyı rahatsız etmediğini söylemeliyim) ve hala okuldayken bir gitar aldım... ve saatlerce oturup oynamayı pek sevmediğim ortaya çıktı. Zor gidiyordu, bana her zaman bir tür saçmalık çıkıyormuş gibi geldi - bundan hiç zevk almadım ve kendimi berbat, aptal ve tamamen beceriksiz hissettim. Kelimenin tam anlamıyla kendimi derslere oturmaya zorladım ve genel olarak bu at için iyi bir yemek değildi.

Aynı zamanda, bir oyuncak geliştirmek için, bir şeyi flash üzerinde (veya başka bir şey için) canlandırmak için bir senaryo kullanarak, oldukça sakin bir şekilde saatlerce oturabiliyordum ve oyundaki öğeleri bitirmek veya hareket mekaniği ve/veya ile uğraşmak için çılgınca motive oluyordum. üçüncü taraf kütüphaneleri, eklentileri ve diğer her şeyi birbirine bağlamak.

Ve bir noktada gitar çalmanın bana göre olmadığını ve çalmayı değil dinlemeyi gerçekten sevdiğimi fark ettim. Ve oyunlar ve kodlar yazarken (o anda her türlü metali dinlerken) gözlerim parladı ve o zamanlar hoşuma giden şey buydu ve yapmam gereken de buydu.

Başka sorularınız var mı?

Elbette tüm konuları ve soruları inceleyemedik, bu yüzden yorum yazın ve bana özel mesaj gönderin; sorularınız olursa her zaman mutlu olurum.

Notlar Tarih Bilimcisi: nereden başlamalı ve gerekli mi?

Notlar Tarih Bilimcisi: nereden başlamalı ve gerekli mi?

Kaynak: habr.com

Yorum ekle