2020 දී දත්ත විද්‍යාඥයෙකු ලෙස කියවිය යුතු දේ

2020 දී දත්ත විද්‍යාඥයෙකු ලෙස කියවිය යුතු දේ
මෙම සටහනෙන්, දත්ත විද්‍යාඥයින් සහ යන්ත්‍ර ඉගෙනුම් ඉංජිනේරුවන් අතර දත්ත අනුවාද පාලනය සහ සහයෝගීතාවය සඳහා ප්‍රජා සහ වෙබ් වේදිකාවක් වන DAGsHub හි සම-නිර්මාතෘ සහ CTO වෙතින් දත්ත විද්‍යාව පිළිබඳ ප්‍රයෝජනවත් තොරතුරු මූලාශ්‍ර තෝරා ගැනීමක් අපි ඔබ සමඟ බෙදා ගන්නෙමු. තේරීමට ට්විටර් ගිණුම්වල සිට සම්පූර්ණ ඉංජිනේරු බ්ලොග් දක්වා විවිධ මූලාශ්‍ර ඇතුළත් වේ, ඒවා ඔවුන් සොයන දේ හරියටම දන්නා අය ඉලක්ක කර ඇත. කප්පාදුව යටතේ විස්තර.

කතුවරයාගෙන්:
ඔබ කන දේ ඔබයි, දැනුම සේවකයෙකු ලෙස ඔබට හොඳ තොරතුරු ආහාර වේලක් අවශ්‍ය වේ. මට වඩාත්ම ප්‍රයෝජනවත් හෝ ආකර්ශනීය යැයි පෙනෙන දත්ත විද්‍යාව, කෘතිම බුද්ධිය සහ අදාළ තාක්ෂණයන් පිළිබඳ තොරතුරු මූලාශ්‍ර බෙදා ගැනීමට මට අවශ්‍යය. මෙය ඔබටත් උපකාරී වනු ඇතැයි මම බලාපොරොත්තු වෙමි!

මිනිත්තු පත්‍රිකා දෙකක්

නවතම සිදුවීම් සමඟින් තබා ගැනීමට හොඳින් ගැලපෙන YouTube නාලිකාවකි. නාලිකාව නිතර යාවත්කාලීන වන අතර ආවරණය වන සියලුම මාතෘකා සඳහා සත්කාරකයාට බෝවන උද්යෝගයක් සහ ධනාත්මක බවක් ඇත. AI මත පමණක් නොව, පරිගණක ග්‍රැෆික්ස් සහ අනෙකුත් දෘශ්‍යමය මාතෘකා පිළිබඳ රසවත් වැඩ ආවරණයක් බලාපොරොත්තු වන්න.

යානික් කිල්චර්

ඔහුගේ යූ ටියුබ් නාලිකාවේ, යානික් ගැඹුරු ඉගෙනීම පිළිබඳ සැලකිය යුතු පර්යේෂණ තාක්ෂණික විස්තරාත්මකව පැහැදිලි කරයි. පාඩම ඔබම කියවීම වෙනුවට, වැදගත් ලිපි පිළිබඳ ගැඹුරු අවබෝධයක් ලබා ගැනීම සඳහා එහි වීඩියෝ එකක් නැරඹීම බොහෝ විට ඉක්මන් සහ පහසු වේ. පැහැදිලි කිරීම් ගණිතය නොසලකා හරිමින් හෝ පයින් තුනක අතරමං නොවී ලිපිවල හරය ප්‍රකාශ කරයි. අධ්‍යයනයන් එකට ගැළපෙන ආකාරය, ප්‍රතිඵල කෙතරම් බැරෑරුම් ලෙස ගත යුතුද, පුළුල් අර්ථකථන සහ තවත් බොහෝ දේ පිළිබඳව Yannick ඔහුගේ අදහස් බෙදා ගනී. නවකයින්ට (හෝ අනධ්‍යයන වෘත්තිකයන්ට) මෙම සොයාගැනීම් වලට තනිවම පැමිණීම වඩා දුෂ්කර ය.

ඩිස්ටිල්.පබ්

ඔවුන්ගේම වචන වලින්:

යන්ත්‍ර ඉගෙනීමේ පර්යේෂණ පැහැදිලි, ගතික සහ විචිත්‍රවත් විය යුතුය. ඩිස්ටිල් නිර්මාණය කර ඇත්තේ පර්යේෂණ සඳහා උපකාර කිරීම සඳහා ය.

Distil යනු යන්ත්‍ර ඉගෙනුම් ක්ෂේත්‍රයේ පර්යේෂණ සහිත අද්විතීය ප්‍රකාශනයකි. පාඨකයාට මාතෘකා පිළිබඳ වඩාත් අවබෝධාත්මක අවබෝධයක් ලබා දීම සඳහා සිත් ඇදගන්නාසුළු දෘශ්‍යකරණයන් සහිත ලිපි ප්‍රවර්ධනය කෙරේ. යන්ත්‍ර ඉගෙනීම සහ දත්ත විද්‍යා මාතෘකා තේරුම් ගැනීමට උපකාර කිරීම සඳහා අවකාශීය චින්තනය සහ පරිකල්පනය ඉතා හොඳින් ක්‍රියා කරයි. අනෙක් අතට, සාම්ප්‍රදායික ප්‍රකාශන ආකෘති, ඒවායේ ව්‍යුහයේ දෘඩ, ස්ථිතික සහ වියලි, සහ සමහර විට "ගණිතමය". ඩිස්ටිල් හි නිර්මාපකයෙකු වන ක්‍රිස් ඕලාට පුදුමාකාර පුද්ගලික බ්ලොග් අඩවියක් ද ඇත GitHub. එය කාලයකින් යාවත්කාලීන කර නැත, නමුත් එය තවමත් ගැඹුරු ඉගෙනුම් මාතෘකාව පිළිබඳ මෙතෙක් ලියා ඇති හොඳම පැහැදිලි කිරීම් එකතුවක් ලෙස පවතී. විශේෂයෙන්ම, එය මට ගොඩක් උදව් කළා විස්තරය LSTM!

2020 දී දත්ත විද්‍යාඥයෙකු ලෙස කියවිය යුතු දේ
ප්රභවය

සෙබස්තියන් රූඩර්

සෙබස්තියන් රූඩර් ඉතා තීක්ෂ්ණ බුද්ධිය සහිත බ්ලොග් සහ පුවත් පත්‍රිකාවක් ලියයි, මූලික වශයෙන් ස්නායුක ජාලවල ඡේදනය සහ ස්වභාවික භාෂා පෙළ පතල් කැණීම ගැන. ඔහු පර්යේෂකයන් සහ සම්මන්ත්‍රණ කථිකයන් සඳහා බොහෝ උපදෙස් ද ඇත, ඔබ ශාස්ත්‍රීය ක්ෂේත්‍රයේ සිටී නම් එය ඉතා ප්‍රයෝජනවත් විය හැකිය. සෙබස්තියන්ගේ ලිපි සාමාන්‍යයෙන් සමාලෝචන ස්වරූපයක් ගනී, යම් ක්ෂේත්‍රයක වර්තමාන පර්යේෂණ සහ ක්‍රමවල තත්ත්වය සාරාංශ කිරීම සහ පැහැදිලි කිරීම. මෙයින් අදහස් කරන්නේ ඉක්මනින් ඔවුන්ගේ බෙයාරිං ලබා ගැනීමට කැමති වෘත්තිකයන් සඳහා ලිපි අතිශයින්ම ප්‍රයෝජනවත් බවයි. සෙබස්තියන් ද ලියයි ට්විටර්.

Andrey Karpathy

Andrei Karpathi ගැන හැඳින්වීමක් අවශ්‍ය නොවේ. පෘථිවියේ වඩාත් ප්‍රසිද්ධ ගැඹුරු ඉගෙනුම් පර්යේෂකයෙකු වීමට අමතරව, ඔහු බහුලව භාවිතා වන මෙවලම් නිර්මාණය කරයි, උදා. arxiv සනීපාරක්ෂාව අතුරු ව්යාපෘති ලෙස. ඔහුගේ ස්ටැන්ෆෝර්ඩ් පාඨමාලාව හරහා මේ ක්ෂේත්‍රයට ඇතුළු වූ පිරිස අනන්තයි cs231n, සහ එය දැන ගැනීම ඔබට ප්රයෝජනවත් වනු ඇත වට්ටෝරුව ස්නායු ජාල පුහුණුව. එය නැරඹීමට ද මම නිර්දේශ කරමි කථාව යන්ත්‍ර ඉගෙනීම සැබෑ ලෝකයේ මහා පරිමාණයෙන් යෙදීමට උත්සාහ කිරීමේදී ටෙස්ලා විසින් ජයගත යුතු සැබෑ ලෝකයේ අභියෝග ගැන. කථාව තොරතුරු, ආකර්ෂණීය සහ සන්සුන් ය. ML ගැනම ලිපි වලට අමතරව, Andrei Karpathy ලබා දෙයි හොඳ ජීවිත උපදෙස් සඳහා අභිලාෂකාමී විද්යාඥයන්. ඇන්ඩ්‍රි කියවන්න ට්විටර් සහ මත Github.

Uber ඉංජිනේරු

Uber ඉංජිනේරු බ්ලොගය එහි පරිමාණයෙන් සහ ආවරණයේ පළලින් සැබවින්ම ආකර්ෂණීය වන අතර, විශේෂයෙන් මාතෘකා රාශියක් ආවරණය කරයි. කෘතිම බුද්ධිය. Uber හි ඉංජිනේරු සංස්කෘතිය ගැන මා විශේෂයෙන් කැමති වන්නේ ඔවුන් ඉතා රසවත් හා වටිනා නිෂ්පාදනය කිරීමට ඇති නැඹුරුවයි ව්යාපෘති විවෘත මූලාශ්‍රය වේගවත් වේගයකින්. මෙන්න උදාහරණ කිහිපයක්:

OpenAI බ්ලොගය

මතභේද පසෙක තබා, OpenAI හි බ්ලොගය ප්‍රතික්ෂේප කළ නොහැකි තරම් අපූරු ය. වරින් වර, බ්ලොගය OpenAI පරිමාණයෙන් පමණක් පැමිණිය හැකි ගැඹුරු ඉගෙනීම පිළිබඳ අන්තර්ගතය සහ අදහස් පළ කරයි: උපකල්පිත සංසිද්ධිය ගැඹුරු ද්විත්ව බැසීමක්. OpenAI කණ්ඩායම කලාතුරකින් පළ කිරීමට නැඹුරු වේ, නමුත් මෙය වැදගත් දේවල් වේ.

2020 දී දත්ත විද්‍යාඥයෙකු ලෙස කියවිය යුතු දේ
ප්රභවය

ටැබූලා බ්ලොග්

Taboola බ්ලොගය මෙම සටහනේ ඇති අනෙකුත් සමහර මූලාශ්‍ර තරම් ප්‍රසිද්ධ නැත, නමුත් එය අද්විතීය යැයි මම සිතමි - කතුවරුන් "සාමාන්‍ය" සඳහා නිෂ්පාදනයේදී ML යෙදීමට උත්සාහ කිරීමේදී ඉතා පහත්, සැබෑ ජීවිතයේ ගැටලු ගැන ලියයි. " ව්‍යාපාර: ස්වයං-රිය පැදවීමේ කාර් සහ RL නියෝජිතයන් ලෝක ශූරයන් දිනා ගැනීම ගැන අඩුවෙන්, "මගේ ආකෘතිය දැන් බොරු විශ්වාසයෙන් දේවල් අනාවැකි පළ කරන බව මම දන්නේ කෙසේද?" මෙම ගැටළු ක්ෂේත්‍රයේ වැඩ කරන සෑම කෙනෙකුටම පාහේ අදාළ වන අතර, ඔවුන් වඩාත් පොදු AI මාතෘකා වලට වඩා අඩු මාධ්‍ය ආවරණයක් ලබා ගනී, නමුත් මෙම ගැටළු නිවැරදිව විසඳීමට තවමත් ලෝක මට්ටමේ දක්ෂතා අවශ්‍ය වේ. වාසනාවකට මෙන්, ටැබූලාට මෙම දක්ෂතාවය සහ ඒ ගැන ලිවීමට ඇති කැමැත්ත සහ හැකියාව යන දෙකම අනෙක් අයටද ඉගෙන ගත හැකිය.

Reddit

ට්විටර් සමඟින්, පර්යේෂණ, මෙවලම් හෝ සමූහයේ ප්‍රඥාවට සම්බන්ධ වීමට වඩා හොඳ දෙයක් Reddit හි නොමැත.

AI තත්ත්වය

පළ කිරීම් වාර්ෂිකව පමණක් ප්‍රකාශයට පත් කරනු ලැබේ, නමුත් ඉතා ඝන තොරතුරු වලින් පිරී ඇත. මෙම ලැයිස්තුවේ ඇති අනෙකුත් මූලාශ්‍ර හා සසඳන විට, මෙය තාක්ෂණික නොවන ව්‍යාපාරිකයින්ට වඩාත් ප්‍රවේශ විය හැකිය. මම කතාවලට කැමති දෙය නම්, එය කර්මාන්තය සහ පර්යේෂණ ගමන් කරන්නේ කොතැනටද යන්න පිළිබඳ වඩාත් පරිපූර්ණ දැක්මක් සැපයීමට උත්සාහ කරන අතර, දෘඪාංග, පර්යේෂණ, ව්‍යාපාර සහ භූ දේශපාලනයේ පවා කුරුල්ලන්ගේ ඇසින් පෙනෙන දියුණුව එකට සම්බන්ධ කරයි. උනන්දුව පිළිබඳ ගැටුම් ගැන කියවීමට අවසානයේ ආරම්භ කිරීමට වග බලා ගන්න.

පොඩ්කාස්ට්

අවංකවම, තාක්ෂණික මාතෘකා ගවේෂණය සඳහා පොඩ්කාස්ට් දුර්වල ලෙස සුදුසු යැයි මම සිතමි. සියල්ලට පසු, ඔවුන් මාතෘකා පැහැදිලි කිරීමට ශ්‍රව්‍ය පමණක් භාවිතා කරන අතර දත්ත විද්‍යාව ඉතා දෘශ්‍ය ක්ෂේත්‍රයකි. පොඩ්කාස්ට් ඔබට පසුව වඩාත් ගැඹුරු පර්යේෂණ කිරීමට හෝ සිත් ඇදගන්නාසුළු දාර්ශනික සාකච්ඡා කිරීමට නිදහසට කරුණක් ලබා දෙයි. කෙසේ වෙතත්, මෙන්න නිර්දේශ කිහිපයක්:

පුදුම ලැයිස්තු

මෙහි සටහන් තබා ගැනීමට අඩු ප්‍රමාණයක් ඇත, නමුත් ඔබ සොයන දේ ඔබ දන්නා විට ප්‍රයෝජනවත් වන තවත් සම්පත්:

ට්විටර්

  • මැටි මේරියන්ස්කි
    Matty ස්නායුක ජාල භාවිතා කිරීමට අලංකාර, නිර්මාණාත්මක ක්‍රම සොයා ගන්නා අතර, ඔහුගේ ප්‍රතිඵල ඔබේ Twitter සංග්‍රහයේ බැලීම විනෝදජනකයි. අඩුම තරමේ පොඩ්ඩක් බලන්න මේ ඉක්මනින්.
  • ඔරි කොහෙන්
    ඔරි යනු රියදුරු යන්ත්‍රයක් පමණි බ්ලොග්. ඔහු දත්ත විද්‍යාඥයින් සඳහා ඇති ගැටලු සහ විසඳුම් පිළිබඳව පුළුල් ලෙස ලියයි. ලිපියක් ප්‍රකාශයට පත් කරන විට දැනුම් දීම සඳහා දායක වීමට වග බලා ගන්න. ඔහුගේ එකතු, විශේෂයෙන්ම, ඇත්තෙන්ම ආකර්ෂණීයයි.
  • ජෙරමි හොවාර්ඩ්
    Fast.ai හි සම-නිර්මාතෘ, නිර්මාණශීලීත්වයේ සහ ඵලදායිතාවයේ විස්තීර්ණ මූලාශ්‍රයක්.
  • හැමල් හුසේන්
    Github හි මාණ්ඩලික ML ඉංජිනේරුවෙකු වන Hamel Hussain දත්ත කේත කරන්නන් සඳහා බොහෝ මෙවලම් නිර්මාණය කිරීම සහ වාර්තා කිරීමෙහි කාර්ය බහුල වේ.
  • Francois Chollet
    Keras හි නිර්මාතෘ, දැන් උත්සහ කරන්නේ බුද්ධිය යනු කුමක්ද සහ එය පරීක්ෂා කරන්නේ කෙසේද යන්න පිළිබඳ අපගේ අවබෝධය යාවත්කාලීන කරන්න.
  • Hardmaru
    Google Brain හි පර්යේෂණ විද්‍යාඥයෙක්.

නිගමනය

ලැයිස්තුවට ඇතුළත් නොකිරීම ලැජ්ජාවට කරුණක් වන විශාල අන්තර්ගත මූලාශ්‍ර කතුවරයා සොයා ගන්නා බැවින් මුල් පළ කිරීම යාවත්කාලීන කළ හැක. ඔහුව සම්බන්ධ කර ගැනීමට නිදහස් වන්න ට්විටර්, ඔබට නව මූලාශ්‍රයක් නිර්දේශ කිරීමට අවශ්‍ය නම්! ඒ වගේම DAGsHub කුලියට ගනී නීතිඥ [ආසන්න වශයෙන්. පරිවර්තනය මහජන වෘත්තිකයා] දත්ත විද්‍යාවේ, එබැවින් ඔබ ඔබේම දත්ත විද්‍යා අන්තර්ගතයක් නිර්මාණය කරන්නේ නම්, පළ කිරීමේ කතුවරයාට ලිවීමට නිදහස් වන්න.

2020 දී දත්ත විද්‍යාඥයෙකු ලෙස කියවිය යුතු දේ
නිර්දේශිත මූලාශ්‍ර කියවීමෙන් සහ ප්‍රවර්ධන කේතය භාවිතා කිරීමෙන් ඔබම දියුණු වන්න HABR, ඔබට බැනරයේ දක්වා ඇති වට්ටම් වලට අමතර 10%ක් ලබා ගත හැක.

තවත් පාඨමාලා

විශේෂාංග ලිපි

මූලාශ්රය: www.habr.com