Ko lasÄ«t kā datu zinātniekam 2020. gadā

Ko lasÄ«t kā datu zinātniekam 2020. gadā
Å ajā ziņā mēs dalāmies ar jums noderÄ«gu informācijas avotu izlasi par datu zinātni no DAGsHub lÄ«dzdibinātāja un CTO ā€” kopienas un tÄ«mekļa platformas datu versiju kontrolei un sadarbÄ«bai starp datu zinātniekiem un maŔīnmācÄ«Å”anās inženieriem. Izlasē ir iekļauti dažādi avoti, sākot no Twitter kontiem un beidzot ar pilnvērtÄ«giem inženieru emuāriem, kas ir paredzēti tiem, kuri precÄ«zi zina, ko viņi meklē. SÄ«kāka informācija zem griezuma.

No autora:
JÅ«s esat tas, ko ēdat, un kā zināŔanu darbiniekam jums ir nepiecieÅ”ams labs informatÄ«vs uzturs. Es vēlos dalÄ«ties ar informācijas avotiem par datu zinātni, mākslÄ«go intelektu un saistÄ«tajām tehnoloÄ£ijām, kas man Ŕķiet visnoderÄ«gākās vai pievilcÄ«gākās. Es ceru, ka tas palÄ«dzēs arÄ« jums!

Divu minūŔu dokumenti

YouTube kanāls, kas ir labi piemērots jaunākajiem notikumiem. Kanāls tiek bieži atjaunināts, un saimniekam ir infekciozs entuziasms un pozitīva attieksme pret visām aplūkotajām tēmām. Gaidiet interesantu darbu atspoguļojumu ne tikai par AI, bet arī par datorgrafiku un citām vizuāli pievilcīgām tēmām.

Janiks Kilčers

Savā YouTube kanālā Yannick detalizēti izskaidro nozÄ«mÄ«gus pētÄ«jumus par dziļu mācÄ«Å”anos. Tā vietā, lai pats izlasÄ«tu pētÄ«jumu, bieži vien ir ātrāk un vienkārŔāk noskatÄ«ties kādu no tā videoklipiem, lai iegÅ«tu dziļāku izpratni par svarÄ«giem rakstiem. Paskaidrojumi izsaka rakstu bÅ«tÄ«bu, neatstājot novārtā matemātiku vai apmaldoties trÄ«s priedēs. Janiks arÄ« dalās savos uzskatos par to, kā pētÄ«jumi sader kopā, cik nopietni jāuztver rezultāti, plaŔākas interpretācijas un daudz ko citu. Iesācējiem (vai praktiÄ·iem, kas nav akadēmiski) ir grÅ«tāk paÅ”iem nonākt pie Å”iem atklājumiem.

destilēt.pub

Pēc viņu paÅ”u vārdiem:

MaŔīnmācÄ«Å”anās pētÄ«jumiem ir jābÅ«t skaidriem, dinamiskiem un dinamiskiem. Un Distill tika izveidots, lai palÄ«dzētu pētniecÄ«bā.

Distill ir unikāla maŔīnmācÄ«bas pētÄ«jumu publikācija. Raksti tiek reklamēti ar satriecoŔām vizualizācijām, lai sniegtu lasÄ«tājam intuitÄ«vāku izpratni par tēmām. Telpiskā domāŔana un iztēle parasti darbojas ļoti labi, palÄ«dzot jums izprast maŔīnmācÄ«bas un datu zinātnes tēmas. No otras puses, tradicionālie publikāciju formāti mēdz bÅ«t stingri pēc savas struktÅ«ras, statiski un sausi, un dažreiz "matemātikas". Kriss Olahs, Distill lÄ«dzveidotājs, arÄ« uztur pārsteidzoÅ”u personÄ«go emuāru vietnē GitHub. Tas nav atjaunināts ilgu laiku, taču joprojām ir visu laiku labāko dziļās mācÄ«Å”anās skaidrojumu kolekcija. Jo Ä«paÅ”i tas man ļoti palÄ«dzēja Š¾ŠæŠøсŠ°Š½ŠøŠµ LSTM!

Ko lasÄ«t kā datu zinātniekam 2020. gadā
avots

Sebastjans RÅ«ders

Sebastians Ruders raksta ļoti informatÄ«vu emuāru un biļetenu, galvenokārt par neironu tÄ«klu un dabiskās valodas teksta analÄ«zi. ViņŔ arÄ« sniedz daudz padomu pētniekiem un konferenču runātājiem, kas var bÅ«t ļoti noderÄ«gi, ja atrodaties akadēmiskajā vidē. Sebastiana raksti mēdz izpausties kā recenzijas, apkopojot un izskaidrojot jaunākās pētniecÄ«bas un metožu stāvokli noteiktā jomā. Tas nozÄ«mē, ka raksti ir ārkārtÄ«gi noderÄ«gi praktizētājiem, kuri vēlas ātri orientēties. Sebastjans arÄ« raksta Twitter.

Andrejs Karpati

Andreju Karpati nav jāiepazÄ«stina. Papildus tam, ka viņŔ ir viens no slavenākajiem dziļās mācÄ«Å”anās pētniekiem uz zemes, viņŔ rada plaÅ”i izmantotus rÄ«kus, piemēram, arhÄ«vs saprāta sargātājs kā blakus projekti. Neskaitāmi cilvēki ir ienākuÅ”i Å”ajā jomā caur viņa Stenfordas kursu cs231n, un jums bÅ«s noderÄ«gi to uzzināt recepte neironu tÄ«klu apmācÄ«ba. Iesaku arÄ« noskatÄ«ties runas par reālajām problēmām, kas Teslai jāpārvar, mēģinot masveidā pielietot maŔīnmācÄ«bu reālajā pasaulē. Runa ir informatÄ«va, iespaidÄ«ga un prātÄ«ga. Bez rakstiem par paÅ”u ML Andrejs Karpatijs sniedz labs dzÄ«ves padoms par ambiciozi zinātnieki. Lasiet EndrjÅ« plkst Twitter un GitHub.

Uber inženierija

Uber inženierzinātņu emuārs ir patieŔām iespaidÄ«gs mēroga un pārklājuma ziņā, aptverot daudzas tēmas, jo Ä«paÅ”i MākslÄ«gais intelekts. Tas, kas man Ä«paÅ”i patÄ«k Uber inženierzinātņu kultÅ«rā, ir viņu tendence radÄ«t ļoti interesantus un vērtÄ«gus Projekti atvērtā koda ārkārtējā tempā. Å eit ir daži piemēri:

OpenAI emuārs

Ja neņem vērā strÄ«dus, OpenAI emuārs nenoliedzami ir brÄ«niŔķīgs. Laiku pa laikam emuārā tiek publicēts saturs un idejas par dziļu mācÄ«Å”anos, kas var bÅ«t tikai OpenAI mērogā: hipotētisks parādÄ«ba dziļa dubultā nolaiÅ”anās. OpenAI komanda mēdz izlikt ziņas reti, taču tas ir svarÄ«gs saturs.

Ko lasÄ«t kā datu zinātniekam 2020. gadā
avots

Tabula emuārs

Taboola emuārs nav tik labi pazÄ«stams kā daži citi avoti Å”ajā ziņojumā, taču, manuprāt, tas ir unikāls ā€” autori raksta par ļoti piezemētām, reālās dzÄ«ves problēmām, mēģinot piemērot ML ražoÅ”anā "parastiem". " Uzņēmumi: mazāk par paÅ”braucoŔām automaŔīnām un RL aÄ£entiem, kas iegÅ«st pasaules čempionus, vairāk par to, "kā es varu zināt, ka mans modelis tagad prognozē lietas ar nepatiesu pārliecÄ«bu?" Å Ä«s problēmas ir aktuālas gandrÄ«z ikvienam Å”ajā jomā strādājoÅ”ajam, un tās saņem mazāk informācijas presē nekā biežāk sastopamās AI tēmas, taču, lai pareizi atrisinātu Ŕīs problēmas, joprojām ir nepiecieÅ”ami pasaules lÄ«meņa talants. Par laimi TabÅ«lai ir gan Å”is talants, gan vēlme un spēja rakstÄ«t par to, lai arÄ« citi cilvēki varētu mācÄ«ties.

Reddit

Kopā ar Twitter vietnē Reddit nav nekā labāka par izpēti, rīkiem vai pūļa gudrībām.

AI stāvoklis

Ieraksti tiek publicēti tikai reizi gadā, bet ļoti blÄ«vi piepildÄ«ti ar informāciju. SalÄ«dzinot ar citiem Ŕī saraksta avotiem, Å”is ir pieejamāks biznesa cilvēkiem, kas nav saistÄ«ti ar tehnoloÄ£ijām. Sarunās man patÄ«k tas, ka tās cenÅ”as sniegt holistiskāku skatÄ«jumu uz to, kur virzās nozare un pētniecÄ«ba, sasaistot sasniegumus aparatÅ«ras, pētniecÄ«bas, biznesa un pat Ä£eopolitikas jomā no putna lidojuma. Noteikti sāciet ar beigām, lai lasÄ«tu informāciju par intereÅ”u konfliktiem.

Podcast apraides

Atklāti sakot, es domāju, ka aplādes nav piemērotas tehnisku tēmu apguvei. Galu galā viņi izmanto tikai skaņu, lai izskaidrotu tēmas, un datu zinātne ir ļoti vizuāls lauks. Podcast aplādes mēdz sniegt jums attaisnojumu, lai vēlāk izpētÄ«tu padziļināti vai iesaistÄ«tu filozofiskas diskusijas. Tomēr Å”eit ir daži ieteikumi:

Lieliski saraksti

Šeit ir mazāk uzmanības, bet vairāk resursu, kas ir noderīgi, tiklīdz zināt, ko meklējat:

Twitter

  • Matijs Marianskis
    Metijs atrod skaistus, radoÅ”us veidus, kā izmantot neironu tÄ«klus, un ir vienkārÅ”i jautri redzēt viņa rezultātus jÅ«su Twitter plÅ«smā. Vismaz paskaties Å”is post.
  • Orijs Koens
    Ori ir tikai braukÅ”anas maŔīna emuāri. ViņŔ plaÅ”i raksta par datu zinātnieku problēmām un risinājumiem. Noteikti abonējiet, lai saņemtu paziņojumu, kad raksts tiek publicēts. Viņa apkopojumsjo Ä«paÅ”i ir patieŔām iespaidÄ«gs.
  • Džeremijs Hovards
    Fast.ai, visaptveroŔa radoŔuma un produktivitātes avota, līdzdibinātājs.
  • Hamels Huseins
    Github personāla ML inženieris Hamels Huseins ir aizņemts darbā, radot un ziņojot par daudziem kodētājiem paredzētiem rīkiem datu domēnā.
  • Fransuā Å olē
    Tagad Keras veidotājs mēģinot atjaunināt savu izpratni par to, kas ir intelekts un kā to pārbaudīt.
  • hardmaru
    Google Brain pētnieks.

Secinājums

Sākotnējā ziņa var tikt atjaunināta, jo autors atrod lieliskus satura avotus, kurus bÅ«tu kauns neiekļaut sarakstā. DroÅ”i sazinieties ar viņu Twitter, ja vēlaties ieteikt jaunu avotu! Un arÄ« DAGsHub darbā Advokāts [apm. tulk. Public Practitioner] datu zinātnē, tādēļ, ja veidojat savu datu zinātnes saturu, droÅ”i rakstiet ziņas autoram.

Ko lasÄ«t kā datu zinātniekam 2020. gadā
Izstrādājiet, izlasot ieteiktos avotus un reklāmas kodu HABR, var saņemt papildus 10% uz banerī norādītās atlaides.

Vairāk kursu

Piedāvātie raksti

Avots: www.habr.com