🥇NeurIPS 2019: ඉදිරි දශකය සඳහා අප සමඟ පවතින ML ප්‍රවණතා

NeuroIPS (ස්නායු තොරතුරු සැකසුම් පද්ධති) යනු යන්ත්‍ර ඉගෙනීම සහ කෘතිම බුද්ධිය පිළිබඳ ලොව විශාලතම සමුළුව වන අතර ගැඹුරු ඉගෙනීමේ ලෝකයේ ප්‍රධාන සිදුවීම වේ.

ඩීඑස් ඉංජිනේරුවන් වන අපි නව දශකයේදී ජීව විද්‍යාව, වාග් විද්‍යාව සහ මනෝ විද්‍යාව ද ප්‍රගුණ කරමුද? අපගේ සමාලෝචනයේදී අපි ඔබට කියන්නෙමු.

මෙවර සමුළුවට කැනඩාවේ වැන්කුවර් හි රටවල් 13500කින් 80කට අධික පිරිසක් එක් වූහ. සමුළුවේදී Sberbank රුසියාව නියෝජනය කළ පළමු වසර මෙය නොවේ - DS කණ්ඩායම බැංකු ක්‍රියාවලීන්හි ML ක්‍රියාත්මක කිරීම, ML තරඟය ගැන සහ Sberbank DS වේදිකාවේ හැකියාවන් ගැන කතා කළේය. ML ප්‍රජාව තුළ 2019 ප්‍රධාන ප්‍රවණතා මොනවාද? සමුළුවට සහභාගිවන්නන් පවසන්නේ: Andrey Chertok и ටැටියානා ෂව්රිනා.

මෙම වසරේ, NeurIPS පත්‍රිකා 1400කට වඩා - ඇල්ගොරිතම, නව මාදිලි සහ නව දත්ත සඳහා නව යෙදුම් පිළිගත්තේය. සියලුම ද්රව්ය වෙත සබැඳිය

Содержание:

ප්රවණතා
- ආදර්ශ අර්ථ නිරූපණය
- බහුවිධතාවය
- තර්කනය
- RL
- GAN
මූලික ආරාධිත කතා
- "සමාජ බුද්ධිය", Blaise Aguera y Arcas (ගූගල්)
- “වෙරිඩිකල් දත්ත විද්‍යාව”, බින් යූ (බර්ක්ලි)
- “යන්ත්‍ර ඉගෙනීම සමඟ මානව හැසිරීම් ආකෘති නිර්මාණය: අවස්ථා සහ අභියෝග”, නූරියා එම් ඔලිවර්, ඇල්බට් අලි සලා
- "පද්ධතිය 1 සිට පද්ධති 2 දක්වා ගැඹුරු ඉගෙනීම", යොෂුවා බෙන්ගියෝ

ප්‍රවණතා වසරේ 2019

1. ආදර්ශ අර්ථකථනය සහ නව ML ක්‍රමවේදය

සම්මන්ත්‍රණයේ ප්‍රධාන මාතෘකාව වන්නේ අපට නිශ්චිත ප්‍රතිඵල ලැබෙන්නේ ඇයිද යන්න පිළිබඳ අර්ථ නිරූපණය සහ සාක්ෂිය. "කළු පෙට්ටිය" පරිවර්ථනයේ දාර්ශනික වැදගත්කම ගැන දීර්ඝ කාලයක් තිස්සේ කතා කළ හැකි නමුත්, මෙම ප්රදේශයේ වඩාත් සැබෑ ක්රම සහ තාක්ෂණික වර්ධනයන් විය.

ආකෘති අනුකරණය කිරීම සහ ඒවායින් දැනුම උකහා ගැනීමේ ක්‍රමවේදය විද්‍යාව සඳහා නව මෙවලම් කට්ටලයකි. නව දැනුම ලබා ගැනීම සහ එය පරීක්ෂා කිරීම සඳහා ආදර්ශයන් මෙවලමක් ලෙස සේවය කළ හැකි අතර, ආකෘතියේ පූර්ව සැකසුම්, පුහුණුව සහ යෙදුමේ එක් එක් අදියර නැවත නැවතත් කළ යුතුය.
ප්‍රකාශනවලින් සැලකිය යුතු ප්‍රතිශතයක් වෙන් කර ඇත්තේ ආකෘති සහ මෙවලම් තැනීම සඳහා නොව, ප්‍රතිඵලවල ආරක්ෂාව, විනිවිදභාවය සහ සත්‍යාපනය සහතික කිරීමේ ගැටළු සඳහා ය. විශේෂයෙන්, ආකෘතියට (විරුද්ධ ප්‍රහාර) ප්‍රහාර ගැන වෙනම ප්‍රවාහයක් දර්ශනය වී ඇති අතර, පුහුණුවට පහර දීම සහ යෙදුමට පහර දීම යන දෙකටම විකල්ප සලකා බලනු ලැබේ.

ලිපි:

සත්‍ය දත්ත විද්‍යාව - ආකෘති සත්‍යාපනය කිරීමේ ක්‍රමවේදය පිළිබඳ ක්‍රමලේඛන ලිපියක්. ආකෘති පරිවර්ථනය කිරීම සඳහා නවීන මෙවලම් පිළිබඳ දළ විශ්ලේෂණයක් ඇතුළත් වේ, විශේෂයෙන් අවධානය යොමු කිරීම සහ රේඛීය ආකෘති සමඟ ස්නායුක ජාලය "ආසවනය කිරීම" මගින් විශේෂාංග වැදගත්කම ලබා ගැනීම.
මෙය පෙනෙන්නේ එලෙසයි: අර්ථකථනය කළ හැකි රූප හඳුනාගැනීම සඳහා ගැඹුරු ඉගෙනීම Chaofan Chen, Oscar Li, Daniel Tao, Alina Barnett, Cynthia Rudin, Jonathan K. Su
ගැඹුරු ස්නායුක ජාල වල අර්ථ නිරූපන ක්‍රම සඳහා මිණුම් ලකුණක් Sara Hooker, Dumitru Erhan, Pieter-Jan Kindermans, Been Kim
අවධානය වැඩි කරන ලද නියෝජිතයන් භාවිතා කරමින් අර්ථකථනය කළ හැකි ශක්තිමත් කිරීමේ ඉගෙනීම කරා Alexander Mott, Daniel Zoran, Mike Chrzanowski, Daan Wierstra, Danilo Jimenez Rezende
අහඹු වනාන්තර සඳහා Debiased MDI විශේෂාංග වැදගත්කම මිනුම Xiao Li, Yu Wang, Sumanta Basu, Karl Kumbier, Bin Yu
නිරීක්ෂණය කළ හැකි දත්ත නොමැතිව දැනුම උපුටා ගැනීම ජෙමින් යූ, මින්යොන්ග් චෝ, ටේබම් කිම්, යූ කන්ග්
ස්වාධීනව ප්‍රතිනිෂ්පාදනය කළ හැකි යන්ත්‍ර ඉගෙනුම් පර්යේෂණ ප්‍රමාණනය කිරීමේ පියවරක් එඩ්වඩ් රෆ්

ExBert.net පෙළ සැකසුම් කාර්යයන් සඳහා ආදර්ශ අර්ථ නිරූපණය පෙන්වයි

2. බහුවිධතාවය

විශ්වාසදායක සත්‍යාපනය සහතික කිරීම සහ දැනුම තහවුරු කිරීම සහ පුළුල් කිරීම සඳහා යාන්ත්‍රණ සංවර්ධනය කිරීම සඳහා, අපට ML සහ විෂය ක්ෂේත්‍රයේ (වෛද්‍ය, වාග් විද්‍යාව, ස්නායු ජීව විද්‍යාව, අධ්‍යාපනය, ආදිය) සමගාමීව නිපුණතා ඇති අදාළ ක්ෂේත්‍රවල විශේෂඥයින් අවශ්‍ය වේ. ස්නායු විද්‍යාව සහ සංජානන විද්‍යාවන්හි කෘති සහ කථන වඩාත් වැදගත් ලෙස පැවතීම විශේෂයෙන් සඳහන් කිරීම වටී - විශේෂ ists යින්ගේ සහයෝගීතාවයක් සහ අදහස් ණයට ගැනීමක් ඇත.

මෙම සහයෝගීතාවයට අමතරව, විවිධ මූලාශ්‍රවලින් තොරතුරු ඒකාබද්ධව සැකසීමේදී බහුවිධතාවය මතුවෙමින් තිබේ: පෙළ සහ ඡායාරූප, පෙළ සහ ක්‍රීඩා, ප්‍රස්ථාර දත්ත සමුදායන් + පෙළ සහ ඡායාරූප.

ලිපි:

ආකෘති දෙකක් - උපායමාර්ගික සහ විධායක - RL සහ NLP මත පදනම් වූ මාර්ගගත උපාය මාර්ග

3. තර්කනය

කෘතිම බුද්ධිය ශක්තිමත් කිරීම යනු ස්වයං-ඉගෙනුම් පද්ධති, "සවිඥානික", තර්කනය සහ තර්කනය වෙත ව්යාපාරයකි. විශේෂයෙන්ම හේතුඵල නිගමනය සහ සාමාන්‍ය තර්කය වර්ධනය වෙමින් පවතී. සමහර වාර්තා මෙටා-ඉගෙනීම (ඉගෙන ගන්නා ආකාරය ගැන) සහ 1 වන සහ 2 වන අනුපිළිවෙල තර්කනය සමඟ DL තාක්ෂණයන් ඒකාබද්ධ කිරීම සඳහා කැප කර ඇත - කෘතිම සාමාන්‍ය බුද්ධිය (AGI) යන යෙදුම කථිකයන්ගේ කථා වල පොදු යෙදුමක් බවට පත්වෙමින් තිබේ.

ලිපි:

දෘශ්‍ය පොදු තර්කනය සඳහා විෂමජාතීය ප්‍රස්තාර ඉගෙනීම Weijiang Yu, Jingwen Zhou, Weihao Yu, Xiaodan Liang, Nong Xiao
පැහැරගැනීම් ඉගෙනීම මගින් යන්ත්‍ර ඉගෙනීම සහ තාර්කික තර්ක කිරීම Wang-Zhou Dai, Qiuling Xu, Yang Yu, Zhi-Hua Zhou
පළමු පෙළ තර්කනය තුළ තර්ක කිරීමට ව්‍යංගයෙන් ඉගෙනීම Vaishak Belle, Brendan Juba
PHYRE: භෞතික තර්කනය සඳහා නව මිණුම් ලකුණක් Anton Bakhtin, Laurens van der Maaten, Justin Johnson, Laura Gustafson, Ross Girshick
තාර්කිකත්වය සඳහා දැනුම ක්වොන්ටම් කාවැද්දීම Dinesh Garg, Shajith Ikbal, Santosh K. Srivastava, Harit Vishwakarma, Hima Karanam, L Venkata Subramaniam

4.Reinforcement Learning

බොහෝ කාර්යයන් RL - DOTA2, Starcraft හි සම්ප්‍රදායික ප්‍රදේශ සංවර්ධනය කිරීම, පරිගණක දැක්ම, NLP, ප්‍රස්ථාර දත්ත සමුදායන් සමඟ ගෘහ නිර්මාණ ශිල්පය ඒකාබද්ධ කිරීම දිගටම කරගෙන යයි.

සම්මන්ත්‍රණයේ වෙනම දිනයක් RL වැඩමුළුවක් සඳහා වෙන් කරන ලදී, එහිදී Optimistic Actor Critic Model architecture ඉදිරිපත් කරන ලදී, පෙර පැවති ඒවාට වඩා, විශේෂයෙන්ම Soft Actor Critic.

ලිපි:

ශුභවාදී නළු විචාරකයා සමඟ වඩා හොඳ ගවේෂණය; Kamil Ciosek, Quan Vuong, Robert Loftin, Katja Hofmann
ChainerRL: ගැඹුරු ශක්තිමත් කිරීමේ ඉගෙනුම් පුස්තකාලයක්; Yasuhiro Fujita (වඩාත් කැමති ජාල, Inc.)*; Toshiki Kataoka (වඩාත් කැමති ජාල, Inc.); ප්‍රභාත් නාගරාජන් (කැමති ජාල); තකහිරෝ ඉෂිකාවා (ටෝකියෝ විශ්ව විද්‍යාලය) [බාහිර pdf සබැඳිය].
පාලනය කිරීමට සිහින: ගුප්ත පරිකල්පනයෙන් හැසිරීම් ඉගෙනීම; Danijar Hafner (Google)*; තිමෝති ලිලික්රැප් (DeepMind); ජිමී බා (ටොරොන්ටෝ විශ්ව විද්‍යාලය); මොහොමඩ් නොරූසි (ගූගල් මොලය)
වැඩමුළු ද්රව්ය

StarCraft ක්‍රීඩකයින් Alphastar ආකෘතිය (DeepMind) සමඟ සටන් කරයි

5.GAN

උත්පාදක ජාලයන් තවමත් අවධානයට ලක්ව ඇත: බොහෝ කෘතීන් ගණිතමය සාක්ෂි සඳහා වැනිලා GAN භාවිතා කරයි, එමෙන්ම ඒවා නව, අසාමාන්‍ය ක්‍රමවලින් ද යෙදේ (ප්‍රස්ථාර උත්පාදක ආකෘති, ශ්‍රේණි සමඟ වැඩ කිරීම, දත්තවල ඇති-සහ-බලපෑම් සම්බන්ධතා සඳහා යෙදුම, ආදිය).

ලිපි:

කොන්දේසි සහිත GAN සඳහා රන් සාම්පල කැණීම Sangwoo Mo, Chiheon Kim, Sungwoong Kim, Minsu Cho, Jinwoo Shin
GAN වල ප්‍රගතිශීලී වර්ධනය ඩෑන් ෂැං, ඇනා කොරෙවා
කොන්දේසිගත GAN භාවිතයෙන් වගු දත්ත ආකෘතිකරණය කිරීම Lei Xu, Maria Skoularidou, Alfredo Cuesta-Infante, Kalyan Veeramachaneni
papers.nips.cc/paper/9377-a-domain-agnostic-measure-for-Monitoring-and-evaluating-gans

වැඩිපුර වැඩ බාරගත් නිසා 1400 පහත අපි වඩාත් වැදගත් කථා ගැන කතා කරමු.

ආරාධිත කතා

"සමාජ බුද්ධිය", Blaise Aguera y Arcas (ගූගල්)

ලින්ක්
විනිවිදක සහ වීඩියෝ
කතාව අවධානය යොමු කරන්නේ යන්ත්‍ර ඉගෙනීමේ සාමාන්‍ය ක්‍රමවේදය සහ මේ වන විට කර්මාන්තය වෙනස් කිරීමේ අපේක්ෂාවන් - අප මුහුණ දෙන සන්ධිස්ථානය කුමක්ද? මොළය සහ පරිණාමය ක්‍රියා කරන්නේ කෙසේද සහ ස්වාභාවික පද්ධතිවල වර්ධනය පිළිබඳව අප දැනටමත් දන්නා දේවලින් අප එතරම් ප්‍රයෝජනයක් නොගන්නේ මන්ද?

ML හි කාර්මික සංවර්ධනය බොහෝ දුරට Google හි සංවර්ධනයේ සන්ධිස්ථාන සමඟ සමපාත වේ, එය වසරින් වසර NeurIPS පිළිබඳ සිය පර්යේෂණ ප්‍රකාශයට පත් කරයි:

1997 - සෙවුම් පහසුකම් දියත් කිරීම, පළමු සේවාදායක, කුඩා පරිගණක බලය
2010 - ජෙෆ් ඩීන් ආරම්භයේදීම ස්නායුක ජාලවල උත්පාතය වන ගූගල් බ්‍රේන් ව්‍යාපෘතිය දියත් කළේය.
2015 – ස්නායුක ජාල කාර්මිකව ක්‍රියාත්මක කිරීම, දේශීය උපාංගයක් මත සෘජුවම වේගවත් මුහුණු හඳුනාගැනීම, ටෙන්සර් පරිගණකකරණය සඳහා සකස් කරන ලද පහත් මට්ටමේ ප්‍රොසෙසර - TPU. ගූගල් විසින් Coral ai දියත් කරයි - රාස්ප්බෙරි පයි හි ප්‍රතිසමයක්, ස්නායුක ජාල පර්යේෂණාත්මක ස්ථාපනයන් සඳහා හඳුන්වා දීම සඳහා කුඩා පරිගණකයක්
2017 - ගූගල් විමධ්‍යගත පුහුණුව සංවර්ධනය කිරීම සහ විවිධ උපාංගවලින් ස්නායුක ජාල පුහුණුවේ ප්‍රතිඵල එක් ආකෘතියකට ඒකාබද්ධ කිරීම ආරම්භ කරයි - Android මත

අද, සමස්ත කර්මාන්තයක්ම දේශීය උපාංග මත දත්ත සුරක්ෂිතභාවය, එකතු කිරීම සහ ඉගෙනුම් ප්‍රතිඵල අනුකරණය කිරීම සඳහා කැපවී ඇත.

ෆෙඩරල් ඉගෙනීම - ML හි දිශානතියක් වන තනි තනි ආකෘති එකිනෙකින් ස්වාධීනව ඉගෙන ගන්නා අතර පසුව තනි ආකෘතියකට ඒකාබද්ධ කරනු ලැබේ (මූලාශ්‍ර දත්ත මධ්‍යගත කිරීමකින් තොරව), දුර්ලභ සිදුවීම්, විෂමතා, පුද්ගලීකරණය යනාදිය සඳහා සකස් කර ඇත. සියලුම Android උපාංග Google සඳහා අත්‍යවශ්‍යයෙන්ම තනි පරිගණක සුපිරි පරිගණකයකි.

ෆෙඩරේටඩ් ඉගෙනීම මත පදනම් වූ උත්පාදක ආකෘතීන් ගූගල්ට අනුව අනාගත දිශානතියකි, එය "ඝාතීය වර්ධනයේ මුල් අවධියේ" වේ. GANs, කථිකාචාර්යවරයාට අනුව, ජීවීන්ගේ ජනගහනයේ ස්කන්ධ හැසිරීම් සහ චින්තන ඇල්ගොරිතම ප්රතිනිෂ්පාදනය කිරීමට ඉගෙන ගැනීමට හැකියාව ඇත.

සරල GAN ගෘහනිර්මාණ දෙකක උදාහරණය භාවිතා කරමින්, ඒවා තුළ ප්‍රශස්තිකරණ මාර්ගයක් සෙවීම රවුමක සැරිසරන බව පෙන්වයි, එයින් අදහස් කරන්නේ ප්‍රශස්තිකරණය සිදු නොවන බවයි. ඒ අතරම, මෙම ආකෘති ජීව විද්‍යාඥයින් බැක්ටීරියා ගහනය මත සිදු කරන පරීක්ෂණ අනුකරණය කිරීමේදී ඉතා සාර්ථක වන අතර, ආහාර සෙවීමේදී නව හැසිරීම් උපාය මාර්ග ඉගෙන ගැනීමට ඔවුන්ට බල කරයි. ප්‍රශස්තිකරණ ශ්‍රිතයට වඩා ජීවිතය වෙනස් ලෙස ක්‍රියා කරන බව අපට නිගමනය කළ හැක.

ඇවිදීම GAN ප්‍රශස්තකරණය

යන්ත්‍ර ඉගෙනීමේ රාමුව තුළ අප දැන් කරන සියල්ල පටු සහ අතිශයින්ම විධිමත් කාර්යයන් වන අතර, මෙම විධිමත් කිරීම් හොඳින් සාමාන්‍යකරණය නොවන අතර ස්නායු භෞතික විද්‍යාව සහ ජීව විද්‍යාව වැනි ක්ෂේත්‍රවල අපගේ විෂය දැනුමට අනුරූප නොවේ.

නුදුරු අනාගතයේ දී ස්නායු භෞතික විද්‍යාව ක්ෂේත්‍රයෙන් ණයට ගැනීම ඇත්තෙන්ම වටින්නේ නව නියුරෝන ගෘහ නිර්මාණ ශිල්පය සහ දෝෂ පසුපස ප්‍රචාරණය කිරීමේ යාන්ත්‍රණයන් සුළු වශයෙන් සංශෝධනය කිරීමයි.

මිනිස් මොළය ස්නායු ජාලයක් මෙන් ඉගෙන නොගනී:

ඔහුට ඉන්ද්‍රියයන් හරහා සහ ළමා කාලයේ දී ඇති ඒවා ඇතුළුව අහඹු ප්‍රාථමික යෙදවුම් නොමැත
ඔහුට සහජ සංවර්ධනයේ ආවේනික දිශාවන් ඇත (ළදරුවෙකුගෙන් භාෂාව ඉගෙන ගැනීමට ඇති ආශාව, කෙළින් ඇවිදීම)

තනි පුද්ගල මොළයක් පුහුණු කිරීම පහත් මට්ටමේ කාර්යයකි; සමහර විට අපි කණ්ඩායම් පරිණාමයේ යාන්ත්‍රණ ප්‍රතිනිෂ්පාදනය කිරීම සඳහා එකිනෙකාට දැනුම ලබා දෙන වේගයෙන් වෙනස් වන පුද්ගලයන්ගේ “විජිත” සලකා බැලිය යුතුය.

අපට දැන් ML ඇල්ගොරිතම වලට අනුගත විය හැකි දේ:

ජනගහනයේ ඉගෙනීම සහතික කරන සෛල පෙළපත් ආකෘති යොදන්න, නමුත් පුද්ගලයාගේ කෙටි ආයු කාලය ("තනි පුද්ගල මොළය")
උදාහරණ කුඩා සංඛ්‍යාවක් භාවිතා කරමින් සුළු-වෙඩි ඉගෙනීම
වඩාත් සංකීර්ණ නියුරෝන ව්යුහයන්, තරමක් වෙනස් සක්රිය කිරීමේ කාර්යයන්
"ජෙනෝමය" ඊළඟ පරම්පරාවට මාරු කිරීම - backpropagation ඇල්ගොරිතම
අපි ස්නායු භෞතික විද්‍යාව සහ ස්නායු ජාල සම්බන්ධ කළ පසු, අපි බොහෝ සංරචක වලින් බහුකාර්ය මොළයක් ගොඩනැගීමට ඉගෙන ගනිමු.

මෙම දෘෂ්ටි කෝණයෙන්, SOTA විසඳුම් භාවිතය හානිකර වන අතර පොදු කාර්යයන් (මිණුම් සලකුණු) සංවර්ධනය කිරීම සඳහා සංශෝධනය කළ යුතුය.

“වෙරිඩිකල් දත්ත විද්‍යාව”, බින් යූ (බර්ක්ලි)

වීඩියෝ සහ විනිවිදක
යන්ත්‍ර ඉගෙනුම් ආකෘති අර්ථකථනය කිරීමේ ගැටලුව සහ ඒවායේ සෘජු පරීක්‍ෂණය සහ සත්‍යාපනය සඳහා වූ ක්‍රමවේදය පිළිබඳ වාර්තාව කැප කර ඇත. ඕනෑම පුහුණු ML ආකෘතියක් එයින් උකහා ගත යුතු දැනුම ප්‍රභවයක් ලෙස හඳුනාගත හැකිය.

බොහෝ ක්ෂේත්‍රවල, විශේෂයෙන් වෛද්‍ය විද්‍යාවේ, මෙම සැඟවුණු දැනුම උකහා ගැනීමෙන් සහ ආකෘතියේ ප්‍රතිඵල අර්ථ නිරූපණය නොකර ආකෘතියක් භාවිතා කිරීම කළ නොහැක්කකි - එසේ නොමැතිනම් ප්‍රති result ලය ස්ථාවර, අහඹු නොවන, විශ්වාසදායක වන අතර ඒවා විනාශ නොකරන බවට අපට විශ්වාස නැත. රෝගියා. ගැඹුරු ඉගෙනුම් ආදර්ශය තුළ වැඩ ක්‍රමවේදයේ සම්පූර්ණ දිශාවක් වර්ධනය වෙමින් පවතින අතර එහි සීමාවන් ඉක්මවා යයි - සත්‍ය දත්ත විද්‍යාව. එය කුමක්ද?

අපට අවශ්‍ය වන්නේ විද්‍යාත්මක ප්‍රකාශනවල එවැනි ගුණාත්මක භාවයක් සහ ආකෘතිවල ප්‍රතිනිෂ්පාදනය වන ඒවා නම්:

අනාවැකි කියහැකි
ගණනය කළ හැකි
ස්ථාවර

මෙම මූලධර්ම තුන නව ක්‍රමවේදයේ පදනම වේ. මෙම නිර්ණායකවලට එරෙහිව ML මාදිලි පරීක්ෂා කරන්නේ කෙසේද? පහසුම ක්රමය වන්නේ වහාම අර්ථකථනය කළ හැකි ආකෘති (ප්රතිගාමීත්වය, තීරණ ගස්) තැනීමයි. කෙසේ වෙතත්, ගැඹුරු ඉගෙනීමේ ක්ෂණික ප්‍රතිලාභ ලබා ගැනීමට ද අපට අවශ්‍යය.

ගැටලුව සමඟ වැඩ කිරීමට පවතින ක්රම කිහිපයක්:

ආකෘතිය අර්ථ නිරූපණය කරන්න;
අවධානය මත පදනම් වූ ක්රම භාවිතා කරන්න;
පුහුණු කිරීමේදී ඇල්ගොරිතම සමූහයක් භාවිතා කරන්න, සහ රේඛීය අර්ථකථන ආකෘති ස්නායුක ජාලයට සමාන පිළිතුරු පුරෝකථනය කිරීමට ඉගෙන ගන්නා බවට වග බලා ගන්න, රේඛීය ආකෘතියෙන් විශේෂාංග අර්ථකථනය කරන්න;
පුහුණු දත්ත වෙනස් කිරීම සහ වැඩි කිරීම. මෙයට ශබ්දය එකතු කිරීම, බාධා කිරීම් සහ දත්ත වැඩි කිරීම ඇතුළත් වේ;
ආකෘතියේ ප්රතිඵල අහඹු නොවන අතර සුළු අනවශ්ය මැදිහත්වීම් මත රඳා නොපවතින බව සහතික කිරීමට උපකාර වන ඕනෑම ක්රමයක් (විරුද්ධ ප්රහාර);
ඇත්ත වශයෙන්ම, පුහුණුවෙන් පසු ආකෘතිය අර්ථ නිරූපණය කරන්න;
අධ්යයනය විශේෂාංග බර විවිධ ආකාරවලින්;
සියලුම උපකල්පනවල සම්භාවිතාව, පන්ති ව්‍යාප්තිය අධ්‍යයනය කරන්න.

විරුද්ධවාදී ප්රහාරය ඌරෙක් සඳහා

ආකෘති නිර්මාණ දෝෂ සෑම කෙනෙකුටම මිල අධික වේ: ප්‍රධාන උදාහරණයක් වන්නේ රයින්හාර්ට් සහ රොගොව්ගේ වැඩ ය.ණය කාලයක වර්ධනය"බොහෝ යුරෝපීය රටවල ආර්ථික ප්‍රතිපත්තිවලට බලපෑම් කළ අතර කප්පාදු ප්‍රතිපත්ති අනුගමනය කිරීමට ඔවුන්ට බල කෙරුනි, නමුත් වසර ගණනාවකට පසු දත්ත සහ ඒවා සැකසීමේ ප්‍රවේශමෙන් නැවත පරීක්ෂා කිරීම ප්‍රතිවිරුද්ධ ප්‍රතිඵලය පෙන්නුම් කළේය!

ඕනෑම ML තාක්ෂණයක් ක්‍රියාත්මක කිරීමේ සිට ක්‍රියාත්මක කිරීම දක්වා ස්වකීය ජීවන චක්‍රයක් ඇත. නව ක්‍රමවේදයේ පරමාර්ථය වන්නේ ආකෘතියේ ජීවිතයේ සෑම අදියරකදීම මූලික මූලධර්ම තුනක් පරීක්ෂා කිරීමයි.

සාරාංශය:

ML ආකෘතිය වඩාත් විශ්වාසදායක වීමට උපකාර වන ව්යාපෘති කිහිපයක් සංවර්ධනය වෙමින් පවතී. මෙය, උදාහරණයක් ලෙස, deeptune (සබැඳිය: github.com/ChrisCummins/paper-end2end-dl);
ක්රමවේදය තවදුරටත් වර්ධනය කිරීම සඳහා, ML ක්ෂේත්රයේ ප්රකාශනවල ගුණාත්මකභාවය සැලකිය යුතු ලෙස වැඩිදියුණු කිරීම අවශ්ය වේ;
යන්ත්‍ර ඉගෙනීමට තාක්ෂණික සහ මානව ශාස්ත්‍ර යන ක්ෂේත්‍ර දෙකෙහිම බහුවිධ පුහුණුව සහ ප්‍රවීණත්වය ඇති නායකයින් අවශ්‍ය වේ.

“යන්ත්‍ර ඉගෙනීම සමඟ මානව හැසිරීම් ආකෘති නිර්මාණය: අවස්ථා සහ අභියෝග” නූරියා එම් ඔලිවර්, ඇල්බට් අලි සලා

මානව හැසිරීම්, එහි තාක්ෂණික පදනම් සහ යෙදුම් අපේක්ෂාවන් ආදර්ශනය කිරීමට කැප වූ දේශනය.

මානව හැසිරීම් ආකෘතිකරණය පහත පරිදි බෙදිය හැකිය:

තනි හැසිරීම
කුඩා පිරිසකගේ හැසිරීම
මහජන හැසිරීම

මෙම සෑම වර්ගයකම ML භාවිතයෙන් ආකෘතිගත කළ හැකි නමුත් සම්පූර්ණයෙන්ම වෙනස් ආදාන තොරතුරු සහ විශේෂාංග සමඟ. සෑම වර්ගයකටම එක් එක් ව්‍යාපෘතිය හරහා යන තමන්ගේම සදාචාරාත්මක ගැටළු ද ඇත:

තනි හැසිරීම් - අනන්යතා සොරකම්, ගැඹුරු;
පුද්ගලයින්ගේ කණ්ඩායම් හැසිරීම - නිර්නාමිකකරණය, චලනයන් පිළිබඳ තොරතුරු ලබා ගැනීම, දුරකථන ඇමතුම් ආදිය;

තනි හැසිරීම

බොහෝ දුරට පරිගණක දැක්ම යන මාතෘකාවට සම්බන්ධ වේ - මානව හැඟීම් සහ ප්‍රතික්‍රියා හඳුනා ගැනීම. සමහර විට සන්දර්භය තුළ, කාලය තුළ හෝ ඔහුගේම හැඟීම්වල විචල්‍යතාවයේ සාපේක්ෂ පරිමාණය සමඟ පමණි. ස්ලයිඩය මධ්‍යධරණී කාන්තාවන්ගේ චිත්තවේගීය වර්ණාවලියෙන් සන්දර්භය භාවිතා කරමින් මොනාලිසාගේ චිත්තවේගයන් හඳුනා ගැනීම පෙන්වයි. ප්රතිඵලය: ප්රීතියෙන් සිනහවක්, නමුත් පිළිකුලෙන් හා පිළිකුලෙන්. හේතුව බොහෝ විට "උදාසීන" චිත්තවේගයක් නිර්වචනය කිරීමේ තාක්ෂණික ක්රමයකි.

කුඩා පිරිසකගේ හැසිරීම

මෙතෙක් නරකම ආකෘතිය ප්රමාණවත් තොරතුරු නිසාය. උදාහරණයක් ලෙස, 2018 - 2019 දක්වා කෘති පෙන්වා ඇත. පුද්ගලයන් දුසිම් ගනනක් මත X වීඩියෝ දුසිම් ගනනක් (cf. 100k++ රූප දත්ත කට්ටල). මෙම කාර්යය වඩාත් හොඳින් ආදර්ශනය කිරීම සඳහා, බහුමාධ්‍ය තොරතුරු අවශ්‍ය වේ, වඩාත් සුදුසු වන්නේ ශරීර-උච්චමානයක සංවේදක, උෂ්ණත්වමානය, මයික්‍රෆෝන පටිගත කිරීම යනාදියයි.

සමූහ හැසිරීම

පාරිභෝගිකයා එක්සත් ජාතීන්ගේ සංවිධානය සහ බොහෝ ප්‍රාන්ත බැවින් වඩාත්ම සංවර්ධිත ප්‍රදේශය. එළිමහන් නිරීක්ෂණ කැමරා, දුරකථන කුළුණු වලින් දත්ත - බිල්පත්, කෙටි පණිවුඩ, ඇමතුම්, රාජ්ය දේශසීමා අතර චලනය පිළිබඳ දත්ත - මේ සියල්ල මිනිසුන්ගේ චලනය සහ සමාජ අස්ථාවරත්වය පිළිබඳ ඉතා විශ්වසනීය චිත්රයක් ලබා දෙයි. තාක්ෂණයේ විභව යෙදුම්: ගලවා ගැනීමේ මෙහෙයුම් ප්‍රශස්ත කිරීම, හදිසි අවස්ථා වලදී සහය සහ කාලානුරූපී ජනගහනය ඉවත් කිරීම. භාවිතා කරන ලද ආකෘති ප්‍රධාන වශයෙන් තවමත් දුර්වල ලෙස අර්ථකථනය කර ඇත - මේවා විවිධ LSTMs සහ convolutional ජාල වේ. ඕනෑම පර්යේෂණයක් සඳහා අවශ්‍ය නිර්නාමික දත්ත බෙදා ගැනීමට යුරෝපීය ව්‍යාපාරවලට බැඳී සිටින නව නීතියක් සඳහා එක්සත් ජාතීන් බලපෑම් කරන බවට කෙටි ප්‍රකාශයක් තිබුණි.

"පද්ධතිය 1 සිට පද්ධති 2 දක්වා ගැඹුරු ඉගෙනීම", යොෂුවා බෙන්ගියෝ

විනිවිදක
ජෝෂුවා බෙන්ගියෝගේ දේශනයේදී, ගැඹුරු ඉගෙනීම ඉලක්ක සැකසීමේ මට්ටමින් ස්නායු විද්‍යාව හමුවෙයි.
නොබෙල් ත්‍යාගලාභී Daniel Kahneman ගේ ක්‍රමවේදයට අනුව බෙන්ගියෝ ප්‍රධාන ගැටළු වර්ග දෙකක් හඳුනා ගනී (පොත "සෙමින් සිතන්න, ඉක්මනින් තීරණය කරන්න")
වර්ගය 1 - පද්ධති 1, අපි "ස්වයංක්‍රීයව" (පුරාණ මොළය) කරන සිහිසුන් ක්‍රියා: හුරුපුරුදු ස්ථානවල මෝටර් රථයක් පැදවීම, ඇවිදීම, මුහුණු හඳුනා ගැනීම.
වර්ගය 2 - පද්ධතිය 2, සවිඥානක ක්රියා (මස්තිෂ්ක බාහිකය), ඉලක්ක සැකසීම, විශ්ලේෂණය, චින්තනය, සංයුක්ත කාර්යයන්.

AI මෙතෙක් ප්‍රමාණවත් උසකට ළඟා වී ඇත්තේ පළමු වර්ගයේ කාර්යයන්හිදී පමණක් වන අතර අපගේ කාර්යය වන්නේ එය දෙවැන්නට ගෙන ඒම, බහුවිධ මෙහෙයුම් සිදු කිරීමට සහ තර්ක ශාස්ත්‍රය සහ ඉහළ මට්ටමේ සංජානන කුසලතා සමඟ ක්‍රියා කිරීමට ඉගැන්වීමයි.

මෙම ඉලක්කය සපුරා ගැනීම සඳහා එය යෝජනා කරනු ලැබේ:

NLP කර්තව්‍යයන්හිදී, ආදර්ශ චින්තනය සඳහා ප්‍රධාන යාන්ත්‍රණයක් ලෙස අවධානය භාවිතා කරන්න
විඥානයට සහ ඒවායේ ප්‍රාදේශීයකරණයට බලපෑම් කරන වඩා හොඳ ආදර්ශ විශේෂාංග සඳහා මෙටා-ඉගෙනීම සහ නියෝජන ඉගෙනීම භාවිතා කරන්න - සහ ඒවායේ පදනම මත ඉහළ මට්ටමේ සංකල්ප සමඟ ක්‍රියා කිරීමට ඉදිරියට යන්න.

නිගමනයක් වෙනුවට, මෙන්න ආරාධිත කථාවක්: බෙන්ගියෝ යනු ප්‍රශස්තිකරණ ගැටළු, SOTA සහ නව ගෘහ නිර්මාණ ශිල්පයෙන් ඔබ්බට ML ක්ෂේත්‍රය පුළුල් කිරීමට උත්සාහ කරන බොහෝ විද්‍යාඥයන්ගෙන් කෙනෙකි.
විඥානයේ ගැටළු, චින්තනයේ භාෂාවේ බලපෑම, ස්නායු ජීව විද්‍යාව සහ ඇල්ගොරිතමවල සංයෝජනය අනාගතයේදී අප බලා සිටින්නේ කුමක් ද යන්න සහ මිනිසුන් මෙන් “හිතන” යන්ත්‍ර වෙත යාමට අපට ඉඩ සලසන ප්‍රශ්නය විවෘතව පවතී.

ස්තුතියි!

මූලාශ්රය: www.habr.com

NeurIPS 2019: ඉදිරි දශකය සඳහා අප සමඟ පවතින ML ප්‍රවණතා

Содержание:

ප්‍රවණතා වසරේ 2019

ආරාධිත කතා

"සමාජ බුද්ධිය", Blaise Aguera y Arcas (ගූගල්)

“වෙරිඩිකල් දත්ත විද්‍යාව”, බින් යූ (බර්ක්ලි)

“යන්ත්‍ර ඉගෙනීම සමඟ මානව හැසිරීම් ආකෘති නිර්මාණය: අවස්ථා සහ අභියෝග” නූරියා එම් ඔලිවර්, ඇල්බට් අලි සලා

"පද්ධතිය 1 සිට පද්ධති 2 දක්වා ගැඹුරු ඉගෙනීම", යොෂුවා බෙන්ගියෝ

අදහස් එක් කරන්න ඊ-මේල් මගින් පිලිතුරු දෙන්න අවලංගු

අදහස් එක් කරන්න