Co czytać jako naukowiec danych w 2020 roku

Co czytać jako naukowiec danych w 2020 roku
W tym poście dzielimy się z Tobą wybranymi źródłami przydatnych informacji o Data Science od współzałożyciela i CTO DAGsHub, platformy społecznościowej i internetowej do kontroli wersji danych i współpracy między analitykami danych i inżynierami uczenia maszynowego. Wybór obejmuje różnorodne źródła, od kont na Twitterze po pełnoprawne blogi inżynierskie, które są skierowane do tych, którzy dokładnie wiedzą, czego szukają. Szczegóły pod rozcięciem.

Od autora:
Jesteś tym, co jesz, a jako pracownik wiedzy potrzebujesz dobrej diety informacyjnej. Chcę dzielić się źródłami informacji o Data Science, sztucznej inteligencji i powiązanych technologiach, które uważam za najbardziej przydatne lub atrakcyjne. Mam nadzieję, że to też ci pomoże!

Dokumenty dwuminutowe

Kanał YouTube, który doskonale nadaje się do bycia na bieżąco z najnowszymi wydarzeniami. Kanał jest często aktualizowany, a gospodarz zaraża entuzjazmem i pozytywnym nastawieniem do wszystkich poruszanych tematów. Spodziewaj się interesujących prac nie tylko na temat sztucznej inteligencji, ale także grafiki komputerowej i innych atrakcyjnych wizualnie tematów.

Yannick Kilcher

Na swoim kanale YouTube Yannick szczegółowo opisuje ważne badania nad uczeniem głębokim. Zamiast samodzielnie czytać badanie, często szybciej i łatwiej jest obejrzeć jeden z jego filmów, aby lepiej zrozumieć ważne artykuły. Wyjaśnienia przekazują istotę artykułów, nie zaniedbując matematyki ani nie gubiąc się w trzech sosnach. Yannick dzieli się również swoimi poglądami na temat tego, jak badania pasują do siebie, jak poważnie należy traktować wyniki, szersze interpretacje i tak dalej. Początkującym (lub nieakademickim praktykom) trudniej jest samodzielnie dojść do tych odkryć.

destylacja.pub

Własnymi słowami:

Badania nad uczeniem maszynowym muszą być jasne, dynamiczne i żywe. A Distill został stworzony, aby pomagać w badaniach.

Distill to wyjątkowa publikacja badawcza dotycząca uczenia maszynowego. Artykuły są promowane za pomocą oszałamiających wizualizacji, aby dać czytelnikowi bardziej intuicyjne zrozumienie tematów. Myślenie przestrzenne i wyobraźnia zwykle bardzo dobrze pomagają zrozumieć tematy związane z uczeniem maszynowym i nauką o danych. Z drugiej strony, tradycyjne formaty publikacji są zwykle sztywne w swojej strukturze, statyczne i suche, a czasem "matematyczny". Chris Olah, współtwórca Distill, ma również niesamowity osobisty blog pod adresem GitHub. Nie była aktualizowana przez długi czas, ale nadal pozostaje zbiorem najlepszych wyjaśnień głębokiego uczenia się, jakie kiedykolwiek napisano. W szczególności bardzo mi to pomogło описание LSTM!

Co czytać jako naukowiec danych w 2020 roku
źródło

Sebastiana Rudera

Sebastian Ruder pisze bardzo pouczający blog i biuletyn, głównie o przecięciu sieci neuronowych i analizie tekstu w języku naturalnym. Udziela również wielu porad naukowcom i mówcom konferencyjnym, co może być bardzo pomocne, jeśli pracujesz w środowisku akademickim. Artykuły Sebastiana mają charakter recenzji, podsumowujących i wyjaśniających stan badań i metod w danej dziedzinie. Oznacza to, że artykuły są niezwykle przydatne dla praktyków, którzy chcą szybko zorientować się w temacie. Sebastian też pisze Twitter.

Andriej Karpat

Andrieja Karpaty przedstawiać nie trzeba. Oprócz tego, że jest jednym z najbardziej znanych badaczy głębokiego uczenia się na świecie, tworzy szeroko stosowane narzędzia, takie jak archiwizator zachowania zdrowego rozsądku jako projekty poboczne. Niezliczone osoby weszły do ​​tego królestwa dzięki jego kursowi w Stanford. cs231n, i przyda ci się to wiedzieć przepis trening sieci neuronowych. Polecam również obejrzeć mowa o prawdziwych problemach, które Tesla musi pokonać, próbując zastosować uczenie maszynowe na masową skalę w prawdziwym świecie. Mowa jest pouczająca, imponująca i otrzeźwiająca. Oprócz artykułów o samym ML podaje Andriej Karpaty dobra życiowa rada dla ambitni naukowcy. Przeczytaj Andrzeja o Twitter i Github.

Inżynieria Ubera

Blog inżynieryjny Ubera jest naprawdę imponujący pod względem skali i zasięgu, obejmując w szczególności wiele tematów Sztuczna inteligencja. To, co szczególnie podoba mi się w kulturze inżynieryjnej Ubera, to ich tendencja do wydawania bardzo interesujących i wartościowych Projekty open source w zawrotnym tempie. Oto kilka przykładów:

Blog OpenAI

Pomijając kontrowersje, blog OpenAI jest niezaprzeczalnie świetny. Od czasu do czasu blog publikuje treści i spostrzeżenia dotyczące głębokiego uczenia się, które mogą pojawić się tylko w skali OpenAI: hipotetyczne zjawisko głębokie podwójne zejście. Zespół OpenAI rzadko publikuje posty, ale są to ważne treści.

Co czytać jako naukowiec danych w 2020 roku
źródło

Blog Tabooli

Blog Taboola nie jest tak dobrze znany jak niektóre inne źródła w tym poście, ale myślę, że jest wyjątkowy - autorzy piszą o bardzo przyziemnych, prawdziwych problemach podczas próby zastosowania ML w produkcji dla „normalnego” biznesu: mniej o samojezdne samochody i agenci RL zdobywający tytuły mistrzów świata, więcej na temat „skąd mam wiedzieć, czy mój model przewiduje teraz rzeczy z fałszywą pewnością?”. Kwestie te dotyczą prawie wszystkich osób pracujących w terenie i są rzadziej omawiane w prasie niż bardziej powszechne tematy dotyczące sztucznej inteligencji, ale nadal potrzebne są światowej klasy talenty, aby właściwie zająć się tymi problemami. Na szczęście Taboola ma zarówno ten talent, jak i chęć i umiejętność pisania o tym, aby inni ludzie też mogli się uczyć.

Reddit

Wraz z Twitterem nie ma nic lepszego na Reddit niż uzależnienie się od badań, narzędzi lub mądrości tłumu.

Stan AI

Posty publikowane są tylko raz w roku, ale bardzo gęsto wypełnione informacjami. W porównaniu z innymi źródłami z tej listy, to jest bardziej dostępne dla ludzi biznesu niezwiązanych z technologią. W rozmowach podoba mi się to, że starają się przedstawić bardziej całościowy obraz tego, dokąd zmierza przemysł i badania, łącząc postępy w sprzęcie, badaniach, biznesie, a nawet geopolityce z lotu ptaka. Pamiętaj, aby zacząć od końca, aby przeczytać o konflikcie interesów.

Podcasty

Szczerze mówiąc, uważam, że podcasty nie nadają się do nauki zagadnień technicznych. W końcu do wyjaśniania tematów używają tylko dźwięku, a data science to dziedzina bardzo wizualna. Podcasty zwykle dają pretekst do głębszej eksploracji w późniejszym czasie lub do angażowania dyskusji filozoficznych. Oto jednak kilka zaleceń:

Niesamowite listy

Tutaj jest mniej do obserwowania, ale więcej zasobów, które są pomocne, gdy wiesz, czego szukasz:

Twitter

  • Maciej Marianski
    Matty znajduje piękne, kreatywne sposoby wykorzystania sieci neuronowych, a oglądanie jego wyników na Twitterze jest po prostu zabawne. Zajrzyj przynajmniej to pisać.
  • Oriego Cohena
    Ori to tylko napędzająca maszyna blogi. Pisze obszernie o problemach i rozwiązaniach dla naukowców zajmujących się danymi. Zapisz się, aby otrzymać powiadomienie o publikacji artykułu. Jego kolekcjaw szczególności robi wrażenie.
  • Jeremiego Howarda
    Współzałożyciel fast.ai, wszechstronnego źródła kreatywności i produktywności.
  • Hamela Husajna
    Hamel Hussain, inżynier ML w Github, jest zajęty tworzeniem i raportowaniem wielu narzędzi dla programistów w domenie danych.
  • François Cholleta
    Twórca Keras, teraz Próbować zaktualizować naszą wiedzę na temat tego, czym jest inteligencja i jak ją testować.
  • hardmaru
    Naukowiec w Google Brain.

wniosek

Oryginalny post może zostać zaktualizowany, ponieważ autor znajduje świetne źródła treści, których szkoda byłoby nie uwzględnić na liście. Skontaktuj się z nim Twitterjeśli chcesz polecić jakieś nowe źródło! A także DAGsHub wynajmuje Adwokat [ok. tłumacz. Public Practitioner] w Data Science, więc jeśli tworzysz własne treści Data Science, napisz do autora posta.

Co czytać jako naukowiec danych w 2020 roku
Rozwijaj się, czytając zalecane źródła i kod promocyjny Habr., możesz otrzymać dodatkowe 10% rabatu wskazanego na banerze.

Więcej kursów

Polecane artykuły

Źródło: www.habr.com