Nini cha kusoma kama mwanasayansi wa data mnamo 2020

Nini cha kusoma kama mwanasayansi wa data mnamo 2020
Katika chapisho hili, tunashiriki nawe uteuzi wa vyanzo vya maelezo muhimu kuhusu Sayansi ya Data kutoka kwa mwanzilishi mwenza na CTO ya DAGsHub, jumuiya na jukwaa la wavuti la udhibiti wa matoleo ya data na ushirikiano kati ya wanasayansi wa data na wahandisi wa kujifunza mashine. Uteuzi huo unajumuisha vyanzo mbalimbali, kutoka kwa akaunti za Twitter hadi blogu kamili za uhandisi, ambazo zinalenga wale wanaojua hasa wanachotafuta. Maelezo chini ya kukata.

Kutoka kwa mwandishi:
Wewe ndio unachokula, na kama mfanyakazi wa maarifa unahitaji lishe bora ya habari. Ninataka kushiriki vyanzo vya habari kuhusu Sayansi ya Data, Akili Bandia na teknolojia zinazohusiana ambazo ninaona zinafaa zaidi au zinazovutia zaidi. Natumai hii itakusaidia pia!

Karatasi mbili za Dakika

Kituo cha YouTube ambacho kinafaa kufuatilia matukio ya hivi punde. Kituo kinasasishwa mara kwa mara na mwenyeji ana shauku ya kuambukiza na chanya kwa mada zote zinazoshughulikiwa. Tarajia chanjo ya kazi ya kupendeza sio tu kwenye AI, bali pia kwenye picha za kompyuta na mada zingine zinazoonekana.

Yannick Kilcher

Kwenye chaneli yake ya YouTube, Yannick anaelezea utafiti muhimu katika kujifunza kwa kina kwa undani wa kiufundi. Badala ya kusoma somo wewe mwenyewe, mara nyingi ni haraka na rahisi zaidi kutazama mojawapo ya video zake ili kupata ufahamu wa kina wa makala muhimu. Maelezo yanawasilisha kiini cha vifungu bila kupuuza hisabati au kupotea katika misonobari mitatu. Yannick pia anashiriki maoni yake kuhusu jinsi masomo yanavyolingana, jinsi ya kuchukua matokeo, tafsiri pana, na zaidi. Ni vigumu zaidi kwa wanovisi (au watendaji wasio wasomi) kuja kwenye uvumbuzi huu wao wenyewe.

Distill.pub

Kwa maneno yao wenyewe:

Utafiti wa ujifunzaji wa mashine unahitaji kuwa wazi, wenye nguvu na uchangamfu. Na Distill iliundwa kusaidia na utafiti.

Distill ni uchapishaji wa kipekee na utafiti katika uwanja wa kujifunza mashine. Nakala zilizo na taswira nzuri zinakuzwa ili kumpa msomaji ufahamu angavu zaidi wa mada. Fikra za anga na mawazo huwa na kazi nzuri sana katika kusaidia kuelewa mada za Kujifunza kwa Mashine na Sayansi ya Data. Miundo ya machapisho ya kitamaduni, kwa upande mwingine, inaelekea kuwa ngumu katika muundo wao, tuli na kavu, na wakati mwingine. "hisabati". Chris Olah, mmoja wa waundaji wa Distill, pia ana blogu nzuri ya kibinafsi GitHub. Haijasasishwa kwa muda mrefu, lakini bado inasalia kuwa mkusanyiko wa maelezo bora zaidi kuhusu mada ya kujifunza kwa kina kuwahi kuandikwa. Hasa, ilinisaidia sana maelezo LSTM!

Nini cha kusoma kama mwanasayansi wa data mnamo 2020
chanzo

Sebastian Ruder

Sebastian Ruder anaandika blogi na jarida lenye ufahamu sana, hasa kuhusu makutano ya mitandao ya neva na uchimbaji wa maandishi ya lugha asilia. Pia ana ushauri mwingi kwa watafiti na wasemaji wa mkutano, ambao unaweza kukusaidia sana ikiwa uko katika taaluma. Makala ya Sebastian kwa kawaida huchukua mfumo wa hakiki, kufupisha na kuelezea hali ya utafiti na mbinu za sasa katika nyanja fulani. Hii ina maana kwamba makala ni muhimu sana kwa watendaji ambao wanataka kupata matokeo yao haraka. Sebastian pia anaandika Twitter.

Andrey Karpathy

Andrei Karpathy haitaji utangulizi. Mbali na kuwa mmoja wa watafiti maarufu wa kujifunza kwa kina Duniani, anaunda zana zinazotumiwa sana, k.m. arxiv sanity kihifadhi kama miradi ya pembeni. Watu wengi wameingia katika uwanja huu kupitia kozi yake ya Stanford cs231n, na itakuwa muhimu kwako kuijua mapishi mafunzo ya mtandao wa neva. Ninapendekeza pia kuitazama hotuba kuhusu changamoto za ulimwengu halisi ambazo Tesla lazima azishinde anapojaribu kutumia mafunzo ya mashine kwa wingi katika ulimwengu halisi. Hotuba ni ya kuelimisha, ya kuvutia na ya kutafakari. Mbali na vifungu kuhusu ML yenyewe, Andrei Karpathy anatoa ushauri mzuri wa maisha kwa wanasayansi wenye tamaa. Soma Andrey ndani Twitter na Github.

Uhandisi wa Uber

Blogu ya uhandisi ya Uber inavutia kwa kweli katika ukubwa na upana wake wa habari, inashughulikia mada nyingi, haswa. Akili ya bandia. Ninachopenda haswa kuhusu utamaduni wa uhandisi wa Uber ni tabia yao ya kuzalisha kuvutia sana na muhimu miradi chanzo wazi kwa kasi kubwa. Hapa kuna baadhi ya mifano:

OpenAI Blog

Mabishano kando, blogi ya OpenAI ni ya ajabu bila shaka. Mara kwa mara, blogu huchapisha maudhui na mawazo kuhusu kujifunza kwa kina ambayo yanaweza tu kuja katika kiwango cha OpenAI: Dhahania. jambo asili ya kina mara mbili. Timu ya OpenAI huwa haichapishi mara kwa mara, lakini haya ni mambo muhimu.

Nini cha kusoma kama mwanasayansi wa data mnamo 2020
chanzo

Taboola Blog

Blogu ya Taboola haifahamiki kama baadhi ya vyanzo vingine katika chapisho hili, lakini nadhani ni ya kipekee - waandishi wanaandika juu ya shida za maisha halisi wakati wa kujaribu kutumia ML katika utengenezaji kwa "kawaida. " business: kidogo kuhusu magari yanayojiendesha na mawakala wa RL kushinda mabingwa wa dunia, zaidi kuhusu "nitajuaje kuwa mwanamitindo wangu sasa anatabiri mambo kwa ujasiri wa uwongo?" Matatizo haya yanafaa kwa karibu kila mtu anayefanya kazi katika shamba, na wanapata chanjo kidogo ya vyombo vya habari kuliko mada ya kawaida ya AI, lakini bado inachukua vipaji vya kiwango cha dunia kutatua matatizo haya kwa usahihi. Kwa bahati nzuri, Taboola ana talanta hii na utayari na uwezo wa kuandika kuihusu ili watu wengine wajifunze pia.

Reddit

Pamoja na Twitter, hakuna kitu bora kwenye Reddit kuliko kuhusishwa na utafiti, zana, au hekima ya umati.

Hali ya AI

Machapisho yanachapishwa tu kila mwaka, lakini yanajazwa na habari mnene sana. Ikilinganishwa na vyanzo vingine kwenye orodha hii, hii inapatikana zaidi kwa wafanyabiashara wasio wa teknolojia. Ninachopenda kuhusu mazungumzo ni kwamba inajaribu kutoa mtazamo kamili zaidi wa mahali tasnia na utafiti unaelekea, ikiunganisha pamoja maendeleo ya vifaa, utafiti, biashara, na hata siasa za kijiografia kutoka kwa mtazamo wa ndege. Hakikisha kuanza mwishoni kusoma kuhusu migongano ya maslahi.

Podcast

Kusema ukweli, nadhani podikasti hazifai kwa kuchunguza mada za kiufundi. Baada ya yote, hutumia sauti tu kuelezea mada, na sayansi ya data ni uwanja wa kuona sana. Podikasti huelekea kukupa kisingizio cha kufanya utafiti wa kina zaidi baadaye au kuwa na mijadala ya kifalsafa ya kuvutia. Hata hivyo, hapa kuna baadhi ya mapendekezo:

Orodha za Kushangaza

Kuna machache ya kufuatilia hapa, lakini nyenzo zaidi ambazo ni muhimu wakati unajua unachotafuta:

Twitter

  • Matty Marianski
    Matty hupata njia nzuri na za ubunifu za kutumia mitandao ya neva, na inafurahisha kuona matokeo yake kwenye mpasho wako wa Twitter. Angalau angalia hii haraka.
  • Ori Cohen
    Ori ni mashine tu ya kuendesha gari blogu. Anaandika sana juu ya shida na suluhisho kwa wanasayansi wa data. Hakikisha umejiandikisha ili kuarifiwa makala yanapochapishwa. Yake mkusanyiko, hasa, ni ya kuvutia kweli.
  • Jeremy Howard
    Mwanzilishi mwenza wa fast.ai, chanzo cha kina cha ubunifu na tija.
  • Hamel Hussein
    Mhandisi wa ML katika Github, Hamel Hussain ana shughuli nyingi kazini akiunda na kuripoti kuhusu zana nyingi za kunasa data.
  • Francois Chollet
    Muumba wa Keras, sasa kujaribu sasisha uelewa wetu wa akili ni nini na jinsi ya kuijaribu.
  • Hardmaru
    Mwanasayansi wa Utafiti katika Google Brain.

Hitimisho

Chapisho asili linaweza kusasishwa kwani mwandishi hupata vyanzo bora vya maudhui ambayo itakuwa aibu kutojumuisha kwenye orodha. Jisikie huru kuwasiliana naye kwa Twitter, ikiwa ungependa kupendekeza chanzo kipya! Na pia DAGsHub kuajiri Wakili [takriban. tafsiri daktari wa umma] katika Sayansi ya Data, kwa hivyo ikiwa utaunda maudhui yako ya Sayansi ya Data, jisikie huru kumwandikia mwandishi wa chapisho.

Nini cha kusoma kama mwanasayansi wa data mnamo 2020
Jiendeleze kwa kusoma vyanzo vinavyopendekezwa, na kutumia msimbo wa ofa HABR, unaweza kupata 10% ya ziada kwa punguzo lililoonyeshwa kwenye bango.

Kozi zaidi

Makala Zilizoangaziwa

Chanzo: mapenzi.com