Այս գրառման մեջ մենք ձեզ հետ կիսում ենք Data Science-ի մասին օգտակար տեղեկատվության աղբյուրների ընտրանին DAGsHub-ի համահիմնադիրից և CTO-ից՝ տվյալների տարբերակների վերահսկման և տվյալների գիտնականների և մեքենայական ուսուցման ինժեներների միջև համագործակցության համայնք և վեբ հարթակ: Ընտրությունը ներառում է տարբեր աղբյուրներ՝ Twitter-ից մինչև լիարժեք ինժեներական բլոգեր, որոնք ուղղված են նրանց, ովքեր հստակ գիտեն, թե ինչ են փնտրում: Մանրամասները կտրվածքի տակ։
Հեղինակից.
Դուք այն եք, ինչ ուտում եք, և որպես գիտելիքի աշխատող, ձեզ անհրաժեշտ է լավ տեղեկատվական դիետա: Ես ուզում եմ կիսվել Data Science-ի, արհեստական ինտելեկտի և հարակից տեխնոլոգիաների մասին տեղեկատվության աղբյուրներով, որոնք ես համարում եմ առավել օգտակար կամ գրավիչ: Հուսով եմ, որ սա նույնպես կօգնի ձեզ:
YouTube-ի ալիք, որը հարմար է վերջին իրադարձություններին տեղյակ պահելու համար: Ալիքը հաճախակի թարմացվում է, և հաղորդավարը վարակիչ ոգևորություն և դրական է տրամադրված բոլոր լուսաբանվող թեմաներում: Ակնկալեք հետաքրքիր աշխատանքների լուսաբանում ոչ միայն արհեստական ինտելեկտի, այլ նաև համակարգչային գրաֆիկայի և տեսողականորեն գրավիչ այլ թեմաների վերաբերյալ:
Յաննիկը իր YouTube ալիքում բացատրում է խորը ուսուցման զգալի հետազոտությունները տեխնիկական մանրամասնությամբ: Ինքնուրույն ուսումնասիրություն կարդալու փոխարեն, հաճախ ավելի արագ և հեշտ է դիտել դրա տեսանյութերից մեկը՝ կարևոր հոդվածները ավելի խորը հասկանալու համար: Բացատրությունները փոխանցում են հոդվածների էությունը՝ չանտեսելով մաթեմատիկան կամ մոլորվելով երեք սոճիների մեջ։ Յաննիկը նաև կիսում է իր տեսակետները այն մասին, թե ինչպես են ուսումնասիրությունները համապատասխանում միմյանց, որքանով պետք է լուրջ վերաբերվել արդյունքներին, ավելի լայն մեկնաբանություններին և այլն: Սկսնակների (կամ ոչ ակադեմիական պրակտիկանտների) համար ավելի դժվար է ինքնուրույն գալ այս հայտնագործություններին:
Մեքենայի ուսուցման հետազոտությունը պետք է լինի պարզ, դինամիկ և կենսունակ: Իսկ Distill-ը ստեղծվել է հետազոտության մեջ օգնելու համար:
Distill-ը մեքենայական ուսուցման եզակի հետազոտական հրատարակություն է: Հոդվածները խթանվում են ցնցող վիզուալիզացիաներով, որպեսզի ընթերցողին ավելի ինտուիտիվ ըմբռնեն թեմաները: Տարածական մտածողությունը և երևակայությունը հակված են շատ լավ աշխատել՝ օգնելով ձեզ հասկանալ Մեքենայի ուսուցման և տվյալների գիտության թեմաները: Ավանդական հրապարակման ձևաչափերը, ընդհակառակը, հակված են լինել կոշտ իրենց կառուցվածքով, ստատիկ և չոր, և երբեմն. «մաթեմատիկական». Քրիս Օլահը, Distill-ի համաստեղծողը, նույնպես հիանալի անձնական բլոգ է վարում GitHub. Այն երկար ժամանակ չի թարմացվել, բայց դեռևս մնում է երբևէ գրված խորը ուսուցման լավագույն բացատրությունների հավաքածու: Մասնավորապես, դա ինձ շատ օգնեց описание LSTM!
Սեբաստիան Ռուդերը գրում է շատ տեղեկատվական բլոգ և տեղեկագիր՝ հիմնականում նեյրոնային ցանցերի և բնական լեզվով տեքստի վերլուծության խաչմերուկի մասին: Նա նաև բազմաթիվ խորհուրդներ է տալիս հետազոտողներին և գիտաժողովների բանախոսներին, որոնք կարող են շատ օգտակար լինել, եթե դուք ակադեմիական միջավայրում եք: Սեբաստիանի հոդվածները հակված են ակնարկների ձևին, որոնք ամփոփում և բացատրում են տվյալ ոլորտում հետազոտությունների և մեթոդների արդի վիճակը: Սա նշանակում է, որ հոդվածները չափազանց օգտակար են այն պրակտիկանտների համար, ովքեր ցանկանում են արագ հասնել իրենց դիրքորոշմանը: Սեբաստիանը նաև գրում է Twitter.
Անդրեյ Կարպատին ներածության կարիք չունի։ Երկրի վրա խորը ուսուցման ամենահայտնի հետազոտողներից մեկը լինելուց բացի, նա ստեղծում է լայնորեն օգտագործվող գործիքներ, ինչպիսիք են արխիվի ողջախոհության պահապան որպես կողմնակի նախագծեր։ Նրա Սթենֆորդի դասընթացի միջոցով անթիվ մարդիկ մտան այս տիրույթ: cs231n, և դա ձեզ համար օգտակար կլինի իմանալ դեղատոմս նեյրոնային ցանցերի ուսուցում. Նաև խորհուրդ եմ տալիս դիտել խոսք իրական խնդիրների մասին, որոնք Tesla-ն պետք է հաղթահարի, երբ փորձում է իրական աշխարհում զանգվածային մասշտաբով կիրառել մեքենայական ուսուցում: Խոսքը տեղեկատվական է, տպավորիչ և սթափեցնող: Բացի հենց ՄԼ-ի մասին հոդվածներից, Անդրեյ Կարպատին տալիս է լավ կյանքի խորհուրդ համար հավակնոտ գիտնականներ. Կարդացեք Էնդրյուին Twitter իսկ Github.
Uber ինժեներական բլոգը իսկապես տպավորիչ է լուսաբանման մասշտաբով և լայնությամբ՝ ընդգրկելով բազմաթիվ թեմաներ, մասնավորապես. արհեստական բանականություն. Այն, ինչ ինձ հատկապես դուր է գալիս Uber-ի ինժեներական մշակույթում, շատ հետաքրքիր և արժեքավոր թողարկելու նրանց միտումն է Ծրագրեր բաց կոդով ահավոր արագությամբ: Ահա մի քանի օրինակներ.
Հակասությունները մի կողմ, OpenAI բլոգը անհերքելիորեն հիանալի է: Ժամանակ առ ժամանակ բլոգը տեղադրում է խորը ուսուցման մասին բովանդակություն և պատկերացումներ, որոնք կարող են լինել միայն OpenAI-ի մասշտաբով. հիպոթետիկ մի երևույթ խորը կրկնակի ծագում. OpenAI թիմը հակված է հազվադեպ փակցնելու, բայց դրանք կարևոր բովանդակություն են:
Taboola բլոգը այնքան հայտնի չէ, որքան այս գրառման որոշ այլ աղբյուրներ, բայց կարծում եմ, որ այն եզակի է. հեղինակները գրում են շատ առօրյա, իրական խնդիրների մասին, երբ փորձում են ML-ն կիրառել արտադրության մեջ «նորմալ» բիզնեսի համար. ավելի քիչ՝ ինքնակառավարվող մեքենաներ և RL գործակալներ, որոնք հաղթում են աշխարհի չեմպիոններին, ավելին «Ինչպե՞ս կարող եմ իմանալ, թե արդյոք իմ մոդելն այժմ կեղծ վստահությամբ է կանխատեսում իրերը»: Այս խնդիրները վերաբերում են ոլորտում աշխատող գրեթե բոլորին և ավելի քիչ են լուսաբանվում մամուլում, քան արհեստական ինտելեկտի ավելի տարածված թեմաները, սակայն այդ խնդիրները պատշաճ կերպով լուծելու համար դեռևս պահանջվում է համաշխարհային մակարդակի տաղանդ: Բարեբախտաբար, Taboola-ն ունի և՛ այս տաղանդը, և՛ դրա մասին գրելու պատրաստակամությունն ու կարողությունը, որպեսզի այլ մարդիկ նույնպես կարողանան սովորել:
Փակցնելուց
Twitter-ի հետ մեկտեղ, Reddit-ում ավելի լավ բան չկա, քան ամբոխի հետազոտությունների, գործիքների կամ իմաստության մեջ ներգրավվելը:
Գրառումները հրապարակվում են միայն տարեկան, բայց շատ խիտ տեղեկություններով լցված։ Այս ցուցակի այլ աղբյուրների համեմատ՝ այս մեկն ավելի հասանելի է ոչ տեխնոլոգիական գործարար մարդկանց համար: Բանակցություններում ինձ դուր է գալիս այն, որ նրանք փորձում են ավելի ամբողջական պատկերացում տալ այն մասին, թե արդյունաբերությունն ու հետազոտությունը դեպի ուր են գնում՝ իրար կապելով սարքավորումների, հետազոտության, բիզնեսի և նույնիսկ աշխարհաքաղաքականության առաջընթացը թռչնի հայացքից: Անպայման սկսեք վերջից կարդալ շահերի բախման մասին:
Podcasts
Անկեղծ ասած, ես կարծում եմ, որ փոդքասթները հարմար չեն տեխնիկական թեմաների մասին սովորելու համար: Ի վերջո, նրանք օգտագործում են միայն ձայնը թեմաները բացատրելու համար, իսկ տվյալների գիտությունը շատ տեսողական դաշտ է: Փոդքասթները հակված են ձեզ ավելի խորը ուսումնասիրելու կամ փիլիսոփայական քննարկումներ ներգրավելու համար: Այնուամենայնիվ, այստեղ կան որոշ առաջարկություններ.
lex friedman podcastերբ նա զրուցում է արհեստական ինտելեկտի ոլորտի ականավոր հետազոտողների հետ։ Francois Chollet-ի հետ դրվագները հատկապես լավն են:
Մատի Մարիանսկի
Մեթթին նեյրոնային ցանցերն օգտագործելու գեղեցիկ, կրեատիվ եղանակներ է գտնում, և նրա արդյունքները Twitter-ում տեսնելը պարզապես հաճելի է: Նայեք գոնե այս արագ.
Օրի Կոեն
Օրին ուղղակի շարժիչ մեքենա է բլոգեր. Նա շատ է գրում տվյալների գիտնականների խնդիրների և լուծումների մասին: Համոզվեք, որ բաժանորդագրվեք հոդվածի հրապարակման ժամանակ տեղեկանալու համար: Նրան կազմումմասնավորապես իսկապես տպավորիչ է.
Ջերեմի Հովարդ
ստեղծարարության և արտադրողականության համապարփակ աղբյուր՝ fast.ai-ի համահիմնադիր:
Համել Հուսեյն
Github-ում աշխատող ML ինժեներ Համել Հուսեյնը զբաղված է տվյալների տիրույթում կոդավորողների համար բազմաթիվ գործիքներ ստեղծելով և հաշվետվություններով:
Ֆրանսուա Շոլլե
Կերասի ստեղծող, այժմ փորձում է թարմացնել մեր հասկացողությունը, թե ինչ է բանականությունը և ինչպես ստուգել այն:
Բնօրինակ գրառումը կարող է թարմացվել, քանի որ հեղինակը գտնում է բովանդակության հիանալի աղբյուրներ, որոնք ամոթալի կլինի չընդգրկել ցուցակում: Ազատորեն կապվեք նրա հետ Twitterեթե ցանկանում եք խորհուրդ տալ ինչ-որ նոր աղբյուր: Եվ նաև DAGsHub վարձում է Փաստաբան [մոտ. թարգմ. Public Practitioner] Data Science-ում, այնպես որ, եթե դուք ստեղծում եք ձեր սեփական Data Science բովանդակությունը, ազատ զգալ գրեք գրառման հեղինակին:
Զարգացեք՝ կարդալով առաջարկվող աղբյուրները և գովազդային ծածկագիրը ՀԱԲՐ, բանների վրա նշված զեղչին կարող եք ստանալ հավելյալ 10%։