Ինչ կարդալ որպես տվյալների գիտնական 2020 թվականին

Ինչ կարդալ որպես տվյալների գիտնական 2020 թվականին
Այս գրառման մեջ մենք ձեզ հետ կիսում ենք Data Science-ի մասին օգտակար տեղեկատվության աղբյուրների ընտրանին DAGsHub-ի համահիմնադիրից և CTO-ից՝ տվյալների տարբերակների վերահսկման և տվյալների գիտնականների և մեքենայական ուսուցման ինժեներների միջև համագործակցության համայնք և վեբ հարթակ: Ընտրությունը ներառում է տարբեր աղբյուրներ՝ Twitter-ից մինչև լիարժեք ինժեներական բլոգեր, որոնք ուղղված են նրանց, ովքեր հստակ գիտեն, թե ինչ են փնտրում: Մանրամասները կտրվածքի տակ։

Հեղինակից.
Դուք այն եք, ինչ ուտում եք, և որպես գիտելիքի աշխատող, ձեզ անհրաժեշտ է լավ տեղեկատվական դիետա: Ես ուզում եմ կիսվել Data Science-ի, արհեստական ​​ինտելեկտի և հարակից տեխնոլոգիաների մասին տեղեկատվության աղբյուրներով, որոնք ես համարում եմ առավել օգտակար կամ գրավիչ: Հուսով եմ, որ սա նույնպես կօգնի ձեզ:

Երկու րոպեանոց թղթեր

YouTube-ի ալիք, որը հարմար է վերջին իրադարձություններին տեղյակ պահելու համար: Ալիքը հաճախակի թարմացվում է, և հաղորդավարը վարակիչ ոգևորություն և դրական է տրամադրված բոլոր լուսաբանվող թեմաներում: Ակնկալեք հետաքրքիր աշխատանքների լուսաբանում ոչ միայն արհեստական ​​ինտելեկտի, այլ նաև համակարգչային գրաֆիկայի և տեսողականորեն գրավիչ այլ թեմաների վերաբերյալ:

Յաննիկ Կիլչեր

Յաննիկը իր YouTube ալիքում բացատրում է խորը ուսուցման զգալի հետազոտությունները տեխնիկական մանրամասնությամբ: Ինքնուրույն ուսումնասիրություն կարդալու փոխարեն, հաճախ ավելի արագ և հեշտ է դիտել դրա տեսանյութերից մեկը՝ կարևոր հոդվածները ավելի խորը հասկանալու համար: Բացատրությունները փոխանցում են հոդվածների էությունը՝ չանտեսելով մաթեմատիկան կամ մոլորվելով երեք սոճիների մեջ։ Յաննիկը նաև կիսում է իր տեսակետները այն մասին, թե ինչպես են ուսումնասիրությունները համապատասխանում միմյանց, որքանով պետք է լուրջ վերաբերվել արդյունքներին, ավելի լայն մեկնաբանություններին և այլն: Սկսնակների (կամ ոչ ակադեմիական պրակտիկանտների) համար ավելի դժվար է ինքնուրույն գալ այս հայտնագործություններին:

թորել.pub

Իրենց խոսքերով.

Մեքենայի ուսուցման հետազոտությունը պետք է լինի պարզ, դինամիկ և կենսունակ: Իսկ Distill-ը ստեղծվել է հետազոտության մեջ օգնելու համար:

Distill-ը մեքենայական ուսուցման եզակի հետազոտական ​​հրատարակություն է: Հոդվածները խթանվում են ցնցող վիզուալիզացիաներով, որպեսզի ընթերցողին ավելի ինտուիտիվ ըմբռնեն թեմաները: Տարածական մտածողությունը և երևակայությունը հակված են շատ լավ աշխատել՝ օգնելով ձեզ հասկանալ Մեքենայի ուսուցման և տվյալների գիտության թեմաները: Ավանդական հրապարակման ձևաչափերը, ընդհակառակը, հակված են լինել կոշտ իրենց կառուցվածքով, ստատիկ և չոր, և երբեմն. «մաթեմատիկական». Քրիս Օլահը, Distill-ի համաստեղծողը, նույնպես հիանալի անձնական բլոգ է վարում GitHub. Այն երկար ժամանակ չի թարմացվել, բայց դեռևս մնում է երբևէ գրված խորը ուսուցման լավագույն բացատրությունների հավաքածու: Մասնավորապես, դա ինձ շատ օգնեց описание LSTM!

Ինչ կարդալ որպես տվյալների գիտնական 2020 թվականին
աղբյուր

Սեբաստիան Ռուդեր

Սեբաստիան Ռուդերը գրում է շատ տեղեկատվական բլոգ և տեղեկագիր՝ հիմնականում նեյրոնային ցանցերի և բնական լեզվով տեքստի վերլուծության խաչմերուկի մասին: Նա նաև բազմաթիվ խորհուրդներ է տալիս հետազոտողներին և գիտաժողովների բանախոսներին, որոնք կարող են շատ օգտակար լինել, եթե դուք ակադեմիական միջավայրում եք: Սեբաստիանի հոդվածները հակված են ակնարկների ձևին, որոնք ամփոփում և բացատրում են տվյալ ոլորտում հետազոտությունների և մեթոդների արդի վիճակը: Սա նշանակում է, որ հոդվածները չափազանց օգտակար են այն պրակտիկանտների համար, ովքեր ցանկանում են արագ հասնել իրենց դիրքորոշմանը: Սեբաստիանը նաև գրում է Twitter.

Անդրեյ Կարպատի

Անդրեյ Կարպատին ներածության կարիք չունի։ Երկրի վրա խորը ուսուցման ամենահայտնի հետազոտողներից մեկը լինելուց բացի, նա ստեղծում է լայնորեն օգտագործվող գործիքներ, ինչպիսիք են արխիվի ողջախոհության պահապան որպես կողմնակի նախագծեր։ Նրա Սթենֆորդի դասընթացի միջոցով անթիվ մարդիկ մտան այս տիրույթ: cs231n, և դա ձեզ համար օգտակար կլինի իմանալ դեղատոմս նեյրոնային ցանցերի ուսուցում. Նաև խորհուրդ եմ տալիս դիտել խոսք իրական խնդիրների մասին, որոնք Tesla-ն պետք է հաղթահարի, երբ փորձում է իրական աշխարհում զանգվածային մասշտաբով կիրառել մեքենայական ուսուցում: Խոսքը տեղեկատվական է, տպավորիչ և սթափեցնող: Բացի հենց ՄԼ-ի մասին հոդվածներից, Անդրեյ Կարպատին տալիս է լավ կյանքի խորհուրդ համար հավակնոտ գիտնականներ. Կարդացեք Էնդրյուին Twitter իսկ Github.

Uber Engineering

Uber ինժեներական բլոգը իսկապես տպավորիչ է լուսաբանման մասշտաբով և լայնությամբ՝ ընդգրկելով բազմաթիվ թեմաներ, մասնավորապես. արհեստական ​​բանականություն. Այն, ինչ ինձ հատկապես դուր է գալիս Uber-ի ինժեներական մշակույթում, շատ հետաքրքիր և արժեքավոր թողարկելու նրանց միտումն է Ծրագրեր բաց կոդով ահավոր արագությամբ: Ահա մի քանի օրինակներ.

OpenAI բլոգ

Հակասությունները մի կողմ, OpenAI բլոգը անհերքելիորեն հիանալի է: Ժամանակ առ ժամանակ բլոգը տեղադրում է խորը ուսուցման մասին բովանդակություն և պատկերացումներ, որոնք կարող են լինել միայն OpenAI-ի մասշտաբով. հիպոթետիկ մի երևույթ խորը կրկնակի ծագում. OpenAI թիմը հակված է հազվադեպ փակցնելու, բայց դրանք կարևոր բովանդակություն են:

Ինչ կարդալ որպես տվյալների գիտնական 2020 թվականին
աղբյուր

Taboola բլոգ

Taboola բլոգը այնքան հայտնի չէ, որքան այս գրառման որոշ այլ աղբյուրներ, բայց կարծում եմ, որ այն եզակի է. հեղինակները գրում են շատ առօրյա, իրական խնդիրների մասին, երբ փորձում են ML-ն կիրառել արտադրության մեջ «նորմալ» բիզնեսի համար. ավելի քիչ՝ ինքնակառավարվող մեքենաներ և RL գործակալներ, որոնք հաղթում են աշխարհի չեմպիոններին, ավելին «Ինչպե՞ս կարող եմ իմանալ, թե արդյոք իմ մոդելն այժմ կեղծ վստահությամբ է կանխատեսում իրերը»: Այս խնդիրները վերաբերում են ոլորտում աշխատող գրեթե բոլորին և ավելի քիչ են լուսաբանվում մամուլում, քան արհեստական ​​ինտելեկտի ավելի տարածված թեմաները, սակայն այդ խնդիրները պատշաճ կերպով լուծելու համար դեռևս պահանջվում է համաշխարհային մակարդակի տաղանդ: Բարեբախտաբար, Taboola-ն ունի և՛ այս տաղանդը, և՛ դրա մասին գրելու պատրաստակամությունն ու կարողությունը, որպեսզի այլ մարդիկ նույնպես կարողանան սովորել:

Փակցնելուց

Twitter-ի հետ մեկտեղ, Reddit-ում ավելի լավ բան չկա, քան ամբոխի հետազոտությունների, գործիքների կամ իմաստության մեջ ներգրավվելը:

AI-ի վիճակը

Գրառումները հրապարակվում են միայն տարեկան, բայց շատ խիտ տեղեկություններով լցված։ Այս ցուցակի այլ աղբյուրների համեմատ՝ այս մեկն ավելի հասանելի է ոչ տեխնոլոգիական գործարար մարդկանց համար: Բանակցություններում ինձ դուր է գալիս այն, որ նրանք փորձում են ավելի ամբողջական պատկերացում տալ այն մասին, թե արդյունաբերությունն ու հետազոտությունը դեպի ուր են գնում՝ իրար կապելով սարքավորումների, հետազոտության, բիզնեսի և նույնիսկ աշխարհաքաղաքականության առաջընթացը թռչնի հայացքից: Անպայման սկսեք վերջից կարդալ շահերի բախման մասին:

Podcasts

Անկեղծ ասած, ես կարծում եմ, որ փոդքասթները հարմար չեն տեխնիկական թեմաների մասին սովորելու համար: Ի վերջո, նրանք օգտագործում են միայն ձայնը թեմաները բացատրելու համար, իսկ տվյալների գիտությունը շատ տեսողական դաշտ է: Փոդքասթները հակված են ձեզ ավելի խորը ուսումնասիրելու կամ փիլիսոփայական քննարկումներ ներգրավելու համար: Այնուամենայնիվ, այստեղ կան որոշ առաջարկություններ.

  • lex friedman podcastերբ նա զրուցում է արհեստական ​​ինտելեկտի ոլորտի ականավոր հետազոտողների հետ։ Francois Chollet-ի հետ դրվագները հատկապես լավն են:
  • Data Engineering podcast. Հաճելի է լսել տվյալների ենթակառուցվածքի նոր գործիքների մասին:

Հրաշալի ցուցակներ

Այստեղ ուշադրություն դարձնելու ավելի քիչ բան կա, բայց ավելի շատ ռեսուրսներ, որոնք օգտակար են, երբ իմանաք, թե ինչ եք փնտրում.

Twitter

  • Մատի Մարիանսկի
    Մեթթին նեյրոնային ցանցերն օգտագործելու գեղեցիկ, կրեատիվ եղանակներ է գտնում, և նրա արդյունքները Twitter-ում տեսնելը պարզապես հաճելի է: Նայեք գոնե այս արագ.
  • Օրի Կոեն
    Օրին ուղղակի շարժիչ մեքենա է բլոգեր. Նա շատ է գրում տվյալների գիտնականների խնդիրների և լուծումների մասին: Համոզվեք, որ բաժանորդագրվեք հոդվածի հրապարակման ժամանակ տեղեկանալու համար: Նրան կազմումմասնավորապես իսկապես տպավորիչ է.
  • Ջերեմի Հովարդ
    ստեղծարարության և արտադրողականության համապարփակ աղբյուր՝ fast.ai-ի համահիմնադիր:
  • Համել Հուսեյն
    Github-ում աշխատող ML ինժեներ Համել Հուսեյնը զբաղված է տվյալների տիրույթում կոդավորողների համար բազմաթիվ գործիքներ ստեղծելով և հաշվետվություններով:
  • Ֆրանսուա Շոլլե
    Կերասի ստեղծող, այժմ փորձում է թարմացնել մեր հասկացողությունը, թե ինչ է բանականությունը և ինչպես ստուգել այն:
  • hardmaru
    Google Brain-ի գիտաշխատող:

Ամփոփում

Բնօրինակ գրառումը կարող է թարմացվել, քանի որ հեղինակը գտնում է բովանդակության հիանալի աղբյուրներ, որոնք ամոթալի կլինի չընդգրկել ցուցակում: Ազատորեն կապվեք նրա հետ Twitterեթե ցանկանում եք խորհուրդ տալ ինչ-որ նոր աղբյուր: Եվ նաև DAGsHub վարձում է Փաստաբան [մոտ. թարգմ. Public Practitioner] Data Science-ում, այնպես որ, եթե դուք ստեղծում եք ձեր սեփական Data Science բովանդակությունը, ազատ զգալ գրեք գրառման հեղինակին:

Ինչ կարդալ որպես տվյալների գիտնական 2020 թվականին
Զարգացեք՝ կարդալով առաջարկվող աղբյուրները և գովազդային ծածկագիրը ՀԱԲՐ, բանների վրա նշված զեղչին կարող եք ստանալ հավելյալ 10%։

Ավելի շատ դասընթացներ

Առաջարկվող հոդվածներ

Source: www.habr.com