2020 онд өгөгдөл судлаачийн хувьд юу унших вэ

2020 онд өгөгдөл судлаачийн хувьд юу унших вэ
Энэ нийтлэлд бид өгөгдлийн хувилбарыг хянах нийгэмлэг, вэб платформ болох DAGsHub-ийн үүсгэн байгуулагч, CTO-ийн Дата Шинжлэх Ухааны талаар хэрэгтэй мэдээллийн эх сурвалжуудын түүврийг хуваалцаж байна. Сонгон шалгаруулалтад Twitter хаягаас эхлээд яг юу хайж байгаагаа мэддэг хүмүүст зориулагдсан инженерийн блог хүртэл төрөл бүрийн эх сурвалжууд багтсан болно. Зүсэлтийн доор дэлгэрэнгүй мэдээлэл.

Зохиогчоос:
Та юу иддэг вэ, мэдлэгийн ажилтны хувьд танд мэдээллийн сайн хоолны дэглэм хэрэгтэй. Би хамгийн хэрэгтэй эсвэл сэтгэл татам гэж үздэг өгөгдлийн шинжлэх ухаан, хиймэл оюун ухаан болон холбогдох технологийн талаархи мэдээллийн эх сурвалжийг хуваалцахыг хүсч байна. Энэ нь танд ч бас тусална гэж найдаж байна!

Хоёр минутын баримт бичиг

Хамгийн сүүлийн үеийн үйл явдлуудыг цаг тухайд нь авч үзэхэд тохиромжтой YouTube суваг. Суваг байнга шинэчлэгдэж байдаг бөгөөд хөтлөгч нь бүх сэдвүүдэд халдварт урам зориг, эерэг хандлагатай байдаг. Зөвхөн хиймэл оюун ухаан төдийгүй компьютерийн график болон бусад үзэгдэхүйц сонирхолтой сэдвүүдийн талаар сонирхолтой бүтээлүүдийг багтаахыг хүлээж байна.

Янник Килчер

Янник өөрийн YouTube суваг дээр гүнзгий суралцах чухал судалгааг техникийн дэлгэрэнгүй тайлбарлав. Судалгааг бие даан уншихын оронд чухал нийтлэлүүдийн талаар илүү гүнзгий ойлголттой болохын тулд түүний нэг видеог үзэх нь илүү хурдан бөгөөд хялбар байдаг. Тайлбарууд нь математикийг үл тоомсорлож, гурван нарсанд төөрөлгүй өгүүллийн мөн чанарыг илэрхийлдэг. Янник мөн судалгаанууд хоорондоо хэрхэн уялдаж, үр дүнд нь хэр нухацтай хандах, илүү өргөн хүрээтэй тайлбар хийх гэх мэт санал бодлоо хуваалцдаг. Эхлэгчдэд (эсвэл эрдэм шинжилгээний бус дадлагажигчдад) бие даан эдгээр нээлтүүдэд хүрэх нь илүү хэцүү байдаг.

distill.pub

Өөрсдийн үгээр:

Машин сургалтын судалгаа нь тодорхой, эрч хүчтэй, эрч хүчтэй байх ёстой. Distill-ийг судалгаанд туслах зорилгоор бүтээсэн.

Distill бол машин сургалтын судалгааны өвөрмөц хэвлэл юм. Уншигчдад сэдвүүдийн талаар илүү ойлгомжтой ойлголт өгөхийн тулд нийтлэлүүдийг гайхалтай дүрслэлээр сурталчилдаг. Орон зайн сэтгэлгээ, төсөөлөл нь машин сургалт, мэдээллийн шинжлэх ухааны сэдвүүдийг ойлгоход тань туслахад маш сайн ажилладаг. Уламжлалт хэвлэлийн хэлбэрүүд нь эсрэгээрээ бүтцийн хувьд хатуу, хөдөлгөөнгүй, хуурай, заримдаа "математик". Distill-ийн хамтран бүтээгч Крис Ола мөн өөрийн гайхалтай хувийн блог хөтөлдөг GitHub. Энэ нь шинэчлэгдээгүй удсан ч урьд өмнө нь бичигдсэн хамгийн сайн гүнзгий суралцах тайлбаруудын цуглуулга хэвээр байна. Тэр дундаа надад их тус болсон тодорхойлолт LSTM!

2020 онд өгөгдөл судлаачийн хувьд юу унших вэ
эх сурвалж

Себастьян Рудер

Себастьян Рудер нь мэдрэлийн сүлжээний огтлолцол, байгалийн хэл дээрх текстийн шинжилгээний талаар маш их мэдээлэлтэй блог, мэдээллийн товхимол бичдэг. Тэрээр мөн судлаачид болон хурлын илтгэгч нарт маш их зөвлөгөө өгдөг бөгөөд энэ нь хэрэв та академид байгаа бол маш их тустай байх болно. Себастьяны нийтлэлүүд нь тухайн салбарын судалгаа, аргачлалын орчин үеийн байдлыг нэгтгэн дүгнэж, тайлбарласан тойм маягтай байдаг. Энэ нь нийтлэлүүд нь үр дүнгээ хурдан авахыг хүсдэг дадлагажигчдад маш хэрэгтэй гэсэн үг юм. Себастьян бас бичдэг Twitter.

Андрей Карпати

Андрей Карпатийг танилцуулах шаардлагагүй. Тэрээр дэлхий дээрх хамгийн алдартай гүн гүнзгий судлаачдын нэг байхаас гадна өргөн хэрэглэгддэг багаж хэрэгслийг бүтээдэг архивын эрүүл мэндийг хамгаалах хэрэгсэл хажуугийн төслүүд гэж. Түүний Стэнфордын курсээр дамжуулан тоо томшгүй олон хүн энэ ертөнцөд орж ирсэн. cs231n, мөн үүнийг мэдэх нь танд ашигтай байх болно жор мэдрэлийн сүлжээний сургалт. Би бас үзэхийг зөвлөж байна хэл яриа Тесла машин сургалтыг бодит ертөнцөд өргөн цар хүрээтэй хэрэгжүүлэхийг оролдох үед даван туулах ёстой бодит асуудлын талаар. Яриа нь мэдээлэл сайтай, сэтгэл хөдөлгөм, ухаантай байдаг. ML-ийн тухай нийтлэлээс гадна Андрей Карпати өгдөг сайхан амьдралын зөвөлгөө нь амбицтай эрдэмтэд. Эндрю-г уншина уу Twitter мөн дээр Github.

Uber инженерчлэл

Uber инженерийн блог нь маш олон сэдвийг хамарсан цар хүрээ, хамрах хүрээний хувьд үнэхээр гайхалтай юм. хиймэл оюун ухаан. Uber-ийн инженерчлэлийн соёлын талаар надад онцгой таалагддаг зүйл бол тэдний маш сонирхолтой бөгөөд үнэ цэнэтэй зүйлийг гаргах хандлага юм төслүүд асар хурдацтай нээлттэй эх сурвалж. Энд зарим жишээ байна:

OpenAI блог

Маргааныг эс тооцвол OpenAI блог бол маргаангүй гайхалтай. Үе үе блог нь зөвхөн OpenAI-ийн хэмжээнд хүрч болох гүнзгий суралцах тухай агуулга, ойлголтыг нийтэлдэг: таамаглал үзэгдэл гүн давхар бууралт. OpenAI баг ховор нийтлэх хандлагатай байдаг ч эдгээр нь чухал агуулга юм.

2020 онд өгөгдөл судлаачийн хувьд юу унших вэ
эх сурвалж

Табула блог

Табула блог нь энэ нийтлэл дэх бусад эх сурвалж шиг тийм ч сайн мэддэггүй, гэхдээ би үүнийг өвөрмөц гэж бодож байна - зохиогчид "хэвийн" бизнест ML-ийг үйлдвэрлэлд ашиглахыг оролдох үед маш энгийн, бодит асуудлуудын талаар бичдэг. өөрийгөө жолооддог машинууд болон дэлхийн аварга болсон RL агентууд, "Миний загвар одоо ямар нэг зүйлийг худал итгэлтэйгээр таамаглаж байгаа эсэхийг би яаж мэдэх вэ?". Эдгээр асуудлууд нь энэ салбарт ажиллаж буй бараг бүх хүмүүст хамаатай бөгөөд AI-ийн нийтлэг сэдвүүдээс илүү бага хэвлэлд мэдээлэгддэг ч эдгээр асуудлыг зөв шийдвэрлэхийн тулд дэлхийн түвшний авъяас хэрэгтэй хэвээр байна. Аз болоход, Табула энэ авьяастай төдийгүй бусад хүмүүс ч сурч мэдэхийн тулд энэ тухай бичих хүсэл, чадвартай байдаг.

Reddit

Твиттертэй зэрэгцэн олон хүмүүсийн судалгаа, арга хэрэгсэл, мэргэн ухаанд автахаас илүү Reddit дээр юу ч байхгүй.

AI-ийн байдал

Нийтлэлүүд нь зөвхөн жил бүр нийтлэгддэг боловч маш нягт мэдээллээр дүүрэн байдаг. Энэ жагсаалтад байгаа бусад эх сурвалжтай харьцуулахад энэ нь технологийн бус бизнес эрхлэгчдэд илүү хүртээмжтэй байдаг. Хэлэлцүүлгийн миний дуртай зүйл бол тэд үйлдвэрлэл, судалгаа хаашаа явж байгааг илүү цогцоор нь харуулахыг хичээж, техник хангамж, судалгаа, бизнес, тэр байтугай геополитикийн дэвшлийг шувууны нүдээр нэгтгэхийг хичээдэг. Ашиг сонирхлын зөрчлийн талаар уншихын тулд төгсгөлд нь эхлэхээ мартуузай.

Подкаст

Үнэнийг хэлэхэд, подкастууд нь техникийн сэдвээр суралцахад тохиромжгүй гэж би бодож байна. Эцсийн эцэст тэд сэдвийг тайлбарлахдаа зөвхөн дуу авиа ашигладаг бөгөөд мэдээллийн шинжлэх ухаан бол маш харааны талбар юм. Подкаст нь танд дараа нь илүү гүнзгий судлах эсвэл гүн ухааны хэлэлцүүлэг өрнүүлэх шалтаг өгдөг. Гэсэн хэдий ч энд зарим зөвлөмжүүд байна:

  • Lex Friedman подкастхиймэл оюун ухааны салбарын нэр хүндтэй судлаачидтай ярилцаж байхдаа. Франсуа Чоллеттай хийсэн ангиуд ялангуяа сайн байна!
  • Өгөгдлийн инженерийн подкаст. Мэдээллийн дэд бүтцийн шинэ хэрэгслүүдийн талаар сонсоход таатай байна.

Гайхалтай жагсаалтууд

Энд анхаарах зүйл бага байгаа ч юу хайж байгаагаа мэдсэний дараа танд туслах олон эх сурвалжууд:

Twitter

  • Матти Мариански
    Мэтти мэдрэлийн сүлжээг ашиглах сайхан, бүтээлч аргуудыг олдог бөгөөд түүний үр дүнг твиттер хуудаснаас харах нь зүгээр л хөгжилтэй байдаг. Ядаж нэг үзээрэй энэ нь хурдан.
  • Ори Коэн
    Ори бол зүгээр л жолооны машин юм блогууд. Тэрээр өгөгдөл судлаачдад зориулсан асуудал, шийдлүүдийн талаар өргөн хүрээтэй бичдэг. Нийтлэл хэвлэгдсэн үед мэдэгдэхийн тулд бүртгүүлэхээ мартуузай. Түүний эмхэтгэлялангуяа үнэхээр гайхалтай.
  • Жереми Ховард
    Бүтээлч байдал, бүтээмжийн цогц эх сурвалж болох fast.ai-г үүсгэн байгуулагчдын нэг.
  • Хамел Хуссейн
    Github-ийн ML инженер Хамел Хуссейн өгөгдлийн домэйн дэх кодлогчдод зориулсан олон хэрэгслийг бий болгож, тайлагнах ажилдаа завгүй байна.
  • Франсуа Чоллет
    Керасын бүтээгч, одоо оролдож байна оюун ухаан гэж юу болох, түүнийг хэрхэн шалгах талаарх бидний ойлголтыг шинэчлэх.
  • хардмару
    Google Brain-ийн судлаач эрдэмтэн.

дүгнэлт

Зохиогч нь жагсаалтад оруулахгүй байх нь ичгүүртэй агуулгын агуу эх сурвалжийг олж мэдсэн тул анхны нийтлэлийг шинэчилж болно. Түүнтэй чөлөөтэй холбогдоорой TwitterХэрэв та шинэ эх сурвалж санал болгохыг хүсвэл! Мөн DAGsHub хөлсөлдөг Өмгөөлөгч [ойролцоогоор. орчуулга. Олон нийтийн эмч] Мэдээллийн шинжлэх ухааны чиглэлээр ажилладаг тул хэрэв та өөрийн мэдээллийн шинжлэх ухааны агуулгыг бий болговол нийтлэлийн зохиогч руу чөлөөтэй бичээрэй.

2020 онд өгөгдөл судлаачийн хувьд юу унших вэ
Санал болгож буй эх сурвалжуудыг уншиж, сурталчилгааны кодыг ашиглан хөгжүүлээрэй ХАБР, та баннер дээр заасан хөнгөлөлтийн 10% -ийг нэмж авах боломжтой.

Илүү олон курс

Онцлох нийтлэлүүд

Эх сурвалж: www.habr.com