Çfarë duhet të lexoni si një shkencëtar i të dhënave në 2020

Çfarë duhet të lexoni si një shkencëtar i të dhënave në 2020
Në këtë postim, ne ndajmë me ju një përzgjedhje të burimeve të informacionit të dobishëm rreth Data Science nga bashkëthemeluesi dhe CTO i DAGsHub, një platformë komuniteti dhe ueb për kontrollin e versionit të të dhënave dhe bashkëpunimin midis shkencëtarëve të të dhënave dhe inxhinierëve të mësimit të makinerive. Përzgjedhja përfshin një sërë burimesh, nga llogaritë në Twitter deri te bloget inxhinierike të plota, të cilat u drejtohen atyre që dinë saktësisht se çfarë kërkojnë. Detaje nën prerje.

Nga autori:
Ju jeni ajo që hani, dhe si një punonjës i njohurive ju duhet një dietë e mirë informacioni. Dua të ndaj burimet e informacionit në lidhje me Shkencën e të Dhënave, Inteligjencën Artificiale dhe teknologjitë përkatëse që më duken më të dobishme ose tërheqëse. Shpresoj se edhe kjo ju ndihmon!

Dokumente dy minutëshe

Një kanal në YouTube që është i përshtatshëm për të vazhduar me ngjarjet më të fundit. Kanali përditësohet shpesh dhe drejtuesi ka një entuziazëm dhe pozitivitet infektiv për të gjitha temat e mbuluara. Prisni mbulim të punës interesante jo vetëm në AI, por edhe në grafikë kompjuterike dhe tema të tjera tërheqëse vizualisht.

Yannick Kilcher

Në kanalin e tij në YouTube, Yannick shpjegon kërkime të rëndësishme në të mësuarit e thellë në detaje teknike. Në vend që ta lexoni vetë studimin, shpesh është më e shpejtë dhe më e lehtë të shikoni një nga videot e tij për të kuptuar më thellë artikujt e rëndësishëm. Shpjegimet përcjellin thelbin e artikujve pa lënë pas dore matematikën apo duke u humbur në tre pisha. Yannick ndan gjithashtu pikëpamjet e tij se si studimet përshtaten së bashku, sa seriozisht duhet të merren rezultatet, interpretime më të gjera dhe më shumë. Është më e vështirë për fillestarët (ose praktikuesit joakademikë) që të arrijnë vetë tek këto zbulime.

Distill.pub

Me fjalët e tyre:

Hulumtimi i mësimit të makinerive duhet të jetë i qartë, dinamik dhe i gjallë. Dhe Distill u krijua për të ndihmuar me kërkimin.

Distill është një botim unik me kërkime në fushën e mësimit të makinerive. Artikujt me vizualizime mahnitëse promovohen për t'i dhënë lexuesit një kuptim më intuitiv të temave. Mendimi hapësinor dhe imagjinata kanë tendencë të funksionojnë shumë mirë për të ndihmuar në kuptimin e temave të Mësimit të Makinerisë dhe Shkencës së të Dhënave. Formatet tradicionale të botimit, nga ana tjetër, priren të jenë të ngurtë në strukturën e tyre, statike dhe të thata, dhe ndonjëherë "matematikore". Chris Olah, një nga krijuesit e Distill, ka gjithashtu një blog personal të mahnitshëm në GitHub. Nuk është përditësuar për një kohë, por ende mbetet një koleksion i shpjegimeve më të mira mbi temën e të mësuarit të thellë të shkruar ndonjëherë. Në veçanti, më ndihmoi shumë описание LSTM!

Çfarë duhet të lexoni si një shkencëtar i të dhënave në 2020
burim

Sebastian Ruder

Sebastian Ruder shkruan një blog dhe buletin shumë depërtues, kryesisht për kryqëzimin e rrjeteve nervore dhe nxjerrjen e tekstit të gjuhës natyrore. Ai gjithashtu ka shumë këshilla për studiuesit dhe folësit e konferencave, të cilat mund të jenë shumë të dobishme nëse jeni në akademi. Artikujt e Sebastian zakonisht marrin formën e rishikimeve, duke përmbledhur dhe shpjeguar gjendjen e kërkimit dhe metodave aktuale në një fushë të caktuar. Kjo do të thotë se artikujt janë jashtëzakonisht të dobishëm për praktikuesit që duan të marrin shpejt kushineta e tyre. Sebastian gjithashtu shkruan në Twitter.

Andrey Karpathy

Andrei Karpathy nuk ka nevojë për prezantim. Përveçse është një nga studiuesit më të famshëm të të mësuarit të thellë në Tokë, ai krijon mjete të përdorura gjerësisht, p.sh. arxiv ruajtës i shëndetit si projekte anësore. Njerëz të panumërt kanë hyrë në këtë fushë përmes kursit të tij në Stanford cs231n, dhe do të jetë e dobishme për ju ta dini atë рецепт trajnimi i rrjeteve nervore. Unë gjithashtu rekomandoj ta shikoni fjalim rreth sfidave të botës reale që Tesla duhet të kapërcejë kur përpiqet të zbatojë mësimin e makinerive në një shkallë masive në botën reale. Fjalimi është informues, mbresëlënës dhe i matur. Përveç artikujve për vetë ML, Andrei Karpathy jep këshilla të mira për jetën për shkencëtarë ambicioz. Lexoni Andrey në Twitter dhe Github.

Inxhinieri Uber

Blogu i inxhinierisë Uber është vërtet mbresëlënës në shkallën dhe gjerësinë e mbulimit, duke mbuluar shumë tema, në veçanti Inteligjence artificiale. Ajo që më pëlqen veçanërisht në kulturën inxhinierike të Uber është tendenca e tyre për të prodhuar shumë interesante dhe të vlefshme projekte burim i hapur me një ritëm marramendës. Ketu jane disa shembuj:

Blog i hapur AI

Duke lënë mënjanë polemikat, blogu i OpenAI është padyshim i mrekullueshëm. Herë pas here, blogu poston përmbajtje dhe ide rreth të mësuarit të thellë që mund të vijnë vetëm në shkallën e OpenAI: Hipotetike dukuri zbritje e dyfishtë e thellë. Ekipi i OpenAI tenton të postojë rrallë, por kjo është diçka e rëndësishme.

Çfarë duhet të lexoni si një shkencëtar i të dhënave në 2020
burim

Blog Taboola

Blogu Taboola nuk është aq i njohur sa disa nga burimet e tjera në këtë postim, por unë mendoj se është unik - autorët shkruajnë për probleme shumë të zakonshme, të jetës reale kur përpiqen të aplikojnë ML në prodhim për "normale " bizneset: më pak për makinat që drejtojnë vetë dhe agjentët e RL që fitojnë kampionë botërorë, më shumë për "si e di që modeli im tani po i parashikon gjërat me besim të rremë?" Këto probleme janë të rëndësishme për pothuajse të gjithë ata që punojnë në këtë fushë dhe ato marrin më pak mbulim shtypi sesa temat më të zakonshme të AI, por gjithsesi duhen talente të klasit botëror për t'i zgjidhur këto probleme në mënyrë korrekte. Për fat të mirë, Taboola e ka edhe këtë talent, edhe gatishmërinë dhe aftësinë për të shkruar për të, në mënyrë që edhe njerëzit e tjerë të mund të mësojnë.

Reddit

Së bashku me Twitter-in, nuk ka asgjë më të mirë në Reddit sesa të fiksohesh pas kërkimeve, mjeteve ose mençurisë së turmës.

Gjendja e AI

Postimet publikohen vetëm çdo vit, por janë të mbushura me informacione shumë të dendura. Krahasuar me burimet e tjera në këtë listë, kjo është më e aksesueshme për njerëzit e biznesit jo-teknologjik. Ajo që më pëlqen rreth bisedimeve është se ai përpiqet të ofrojë një pamje më holistike se ku po shkon industria dhe kërkimi, duke lidhur së bashku përparimet në harduer, kërkime, biznes dhe madje edhe gjeopolitikë nga këndvështrimi i syve të shpendëve. Sigurohuni që të filloni në fund për të lexuar për konfliktet e interesit.

Podkastet

Sinqerisht, unë mendoj se podkastet nuk janë të përshtatshme për të eksploruar tema teknike. Në fund të fundit, ata përdorin vetëm audio për të shpjeguar tema, dhe shkenca e të dhënave është një fushë shumë vizuale. Podkastet kanë tendencë t'ju japin një justifikim për të bërë kërkime më të thelluara më vonë ose për të pasur disa diskutime filozofike magjepsëse. Megjithatë, këtu janë disa rekomandime:

Lista e mrekullueshme

Ka më pak për të mbajtur gjurmët këtu, por më shumë burime që janë të dobishme kur e dini se çfarë po kërkoni:

Twitter

  • Matty Marianski
    Matty gjen mënyra të bukura dhe kreative për të përdorur rrjetet nervore dhe është thjesht argëtuese të shohësh rezultatet e tij në burimin tënd në Twitter. Të paktën hidhini një sy этот postimi
  • Ori Cohen
    Ori është vetëm një makinë lëvizëse blogjet. Ai shkruan gjerësisht për problemet dhe zgjidhjet për shkencëtarët e të dhënave. Sigurohuni që të abonoheni për t'u njoftuar kur publikohet një artikull. E tij përpilimi, në veçanti, është vërtet mbresëlënëse.
  • Jeremy Howard
    Bashkëthemelues i fast.ai, një burim gjithëpërfshirës i kreativitetit dhe produktivitetit.
  • Hamel Husein
    Një inxhinier i stafit ML në Github, Hamel Hussain është i zënë në punë duke krijuar dhe raportuar mbi shumë mjete për koduesit e të dhënave.
  • Francois Chollet
    Krijuesi i Keras, tani duke u përpjekur të përditësojmë të kuptuarit tonë se çfarë është inteligjenca dhe si ta testojmë atë.
  • Hardmaru
    Shkencëtar hulumtues në Google Brain.

Përfundim

Postimi origjinal mund të përditësohet pasi autori gjen burime të shkëlqyera të përmbajtjes që do të ishte turp të mos i përfshinte në listë. Mos ngurroni të kontaktoni me të në Twitter, nëse doni të rekomandoni një burim të ri! Dhe gjithashtu DAGsHub punëson Avokati [rreth. përkthimi praktikues publik] në Shkencën e të Dhënave, kështu që nëse krijoni përmbajtjen tuaj të Shkencës së të Dhënave, mos ngurroni t'i shkruani autorit të postimit.

Çfarë duhet të lexoni si një shkencëtar i të dhënave në 2020
Zhvilloni veten duke lexuar burimet e rekomanduara dhe duke përdorur kodin promocional HABR, mund të përfitoni 10% shtesë në zbritjen e treguar në baner.

Më shumë kurse

Artikuj të veçuar

Burimi: www.habr.com