NeurIPS 2019: ඉදිරි දශකය සඳහා අප සමඟ පවතින ML ප්‍රවණතා

NeuroIPS (ස්නායු තොරතුරු සැකසුම් පද්ධති) යනු යන්ත්‍ර ඉගෙනීම සහ කෘතිම බුද්ධිය පිළිබඳ ලොව විශාලතම සමුළුව වන අතර ගැඹුරු ඉගෙනීමේ ලෝකයේ ප්‍රධාන සිදුවීම වේ.

ඩීඑස් ඉංජිනේරුවන් වන අපි නව දශකයේදී ජීව විද්‍යාව, වාග් විද්‍යාව සහ මනෝ විද්‍යාව ද ප්‍රගුණ කරමුද? අපගේ සමාලෝචනයේදී අපි ඔබට කියන්නෙමු.

NeurIPS 2019: ඉදිරි දශකය සඳහා අප සමඟ පවතින ML ප්‍රවණතා

මෙවර සමුළුවට කැනඩාවේ වැන්කුවර් හි රටවල් 13500කින් 80කට අධික පිරිසක් එක් වූහ. සමුළුවේදී Sberbank රුසියාව නියෝජනය කළ පළමු වසර මෙය නොවේ - DS කණ්ඩායම බැංකු ක්‍රියාවලීන්හි ML ක්‍රියාත්මක කිරීම, ML තරඟය ගැන සහ Sberbank DS වේදිකාවේ හැකියාවන් ගැන කතා කළේය. ML ප්‍රජාව තුළ 2019 ප්‍රධාන ප්‍රවණතා මොනවාද? සමුළුවට සහභාගිවන්නන් පවසන්නේ: Andrey Chertok и ටැටියානා ෂව්රිනා.

මෙම වසරේ, NeurIPS පත්‍රිකා 1400කට වඩා - ඇල්ගොරිතම, නව මාදිලි සහ නව දත්ත සඳහා නව යෙදුම් පිළිගත්තේය. සියලුම ද්රව්ය වෙත සබැඳිය

Содержание:

  • ප්රවණතා
    • ආදර්ශ අර්ථ නිරූපණය
    • බහුවිධතාවය
    • තර්කනය
    • RL
    • GAN
  • මූලික ආරාධිත කතා
    • "සමාජ බුද්ධිය", Blaise Aguera y Arcas (ගූගල්)
    • “වෙරිඩිකල් දත්ත විද්‍යාව”, බින් යූ (බර්ක්ලි)
    • “යන්ත්‍ර ඉගෙනීම සමඟ මානව හැසිරීම් ආකෘති නිර්මාණය: අවස්ථා සහ අභියෝග”, නූරියා එම් ඔලිවර්, ඇල්බට් අලි සලා
    • "පද්ධතිය 1 සිට පද්ධති 2 දක්වා ගැඹුරු ඉගෙනීම", යොෂුවා බෙන්ගියෝ

ප්‍රවණතා වසරේ 2019

1. ආදර්ශ අර්ථකථනය සහ නව ML ක්‍රමවේදය

සම්මන්ත්‍රණයේ ප්‍රධාන මාතෘකාව වන්නේ අපට නිශ්චිත ප්‍රතිඵල ලැබෙන්නේ ඇයිද යන්න පිළිබඳ අර්ථ නිරූපණය සහ සාක්ෂිය. "කළු පෙට්ටිය" පරිවර්ථනයේ දාර්ශනික වැදගත්කම ගැන දීර්ඝ කාලයක් තිස්සේ කතා කළ හැකි නමුත්, මෙම ප්රදේශයේ වඩාත් සැබෑ ක්රම සහ තාක්ෂණික වර්ධනයන් විය.

ආකෘති අනුකරණය කිරීම සහ ඒවායින් දැනුම උකහා ගැනීමේ ක්‍රමවේදය විද්‍යාව සඳහා නව මෙවලම් කට්ටලයකි. නව දැනුම ලබා ගැනීම සහ එය පරීක්ෂා කිරීම සඳහා ආදර්ශයන් මෙවලමක් ලෙස සේවය කළ හැකි අතර, ආකෘතියේ පූර්ව සැකසුම්, පුහුණුව සහ යෙදුමේ එක් එක් අදියර නැවත නැවතත් කළ යුතුය.
ප්‍රකාශනවලින් සැලකිය යුතු ප්‍රතිශතයක් වෙන් කර ඇත්තේ ආකෘති සහ මෙවලම් තැනීම සඳහා නොව, ප්‍රතිඵලවල ආරක්ෂාව, විනිවිදභාවය සහ සත්‍යාපනය සහතික කිරීමේ ගැටළු සඳහා ය. විශේෂයෙන්, ආකෘතියට (විරුද්ධ ප්‍රහාර) ප්‍රහාර ගැන වෙනම ප්‍රවාහයක් දර්ශනය වී ඇති අතර, පුහුණුවට පහර දීම සහ යෙදුමට පහර දීම යන දෙකටම විකල්ප සලකා බලනු ලැබේ.

ලිපි:

NeurIPS 2019: ඉදිරි දශකය සඳහා අප සමඟ පවතින ML ප්‍රවණතා
ExBert.net පෙළ සැකසුම් කාර්යයන් සඳහා ආදර්ශ අර්ථ නිරූපණය පෙන්වයි

2. බහුවිධතාවය

විශ්වාසදායක සත්‍යාපනය සහතික කිරීම සහ දැනුම තහවුරු කිරීම සහ පුළුල් කිරීම සඳහා යාන්ත්‍රණ සංවර්ධනය කිරීම සඳහා, අපට ML සහ විෂය ක්ෂේත්‍රයේ (වෛද්‍ය, වාග් විද්‍යාව, ස්නායු ජීව විද්‍යාව, අධ්‍යාපනය, ආදිය) සමගාමීව නිපුණතා ඇති අදාළ ක්ෂේත්‍රවල විශේෂඥයින් අවශ්‍ය වේ. ස්නායු විද්‍යාව සහ සංජානන විද්‍යාවන්හි කෘති සහ කථන වඩාත් වැදගත් ලෙස පැවතීම විශේෂයෙන් සඳහන් කිරීම වටී - විශේෂ ists යින්ගේ සහයෝගීතාවයක් සහ අදහස් ණයට ගැනීමක් ඇත.

මෙම සහයෝගීතාවයට අමතරව, විවිධ මූලාශ්‍රවලින් තොරතුරු ඒකාබද්ධව සැකසීමේදී බහුවිධතාවය මතුවෙමින් තිබේ: පෙළ සහ ඡායාරූප, පෙළ සහ ක්‍රීඩා, ප්‍රස්ථාර දත්ත සමුදායන් + පෙළ සහ ඡායාරූප.

ලිපි:

NeurIPS 2019: ඉදිරි දශකය සඳහා අප සමඟ පවතින ML ප්‍රවණතා
ආකෘති දෙකක් - උපායමාර්ගික සහ විධායක - RL සහ NLP මත පදනම් වූ මාර්ගගත උපාය මාර්ග

3. තර්කනය

කෘතිම බුද්ධිය ශක්තිමත් කිරීම යනු ස්වයං-ඉගෙනුම් පද්ධති, "සවිඥානික", තර්කනය සහ තර්කනය වෙත ව්යාපාරයකි. විශේෂයෙන්ම හේතුඵල නිගමනය සහ සාමාන්‍ය තර්කය වර්ධනය වෙමින් පවතී. සමහර වාර්තා මෙටා-ඉගෙනීම (ඉගෙන ගන්නා ආකාරය ගැන) සහ 1 වන සහ 2 වන අනුපිළිවෙල තර්කනය සමඟ DL තාක්ෂණයන් ඒකාබද්ධ කිරීම සඳහා කැප කර ඇත - කෘතිම සාමාන්‍ය බුද්ධිය (AGI) යන යෙදුම කථිකයන්ගේ කථා වල පොදු යෙදුමක් බවට පත්වෙමින් තිබේ.

ලිපි:

4.Reinforcement Learning

බොහෝ කාර්යයන් RL - DOTA2, Starcraft හි සම්ප්‍රදායික ප්‍රදේශ සංවර්ධනය කිරීම, පරිගණක දැක්ම, NLP, ප්‍රස්ථාර දත්ත සමුදායන් සමඟ ගෘහ නිර්මාණ ශිල්පය ඒකාබද්ධ කිරීම දිගටම කරගෙන යයි.

සම්මන්ත්‍රණයේ වෙනම දිනයක් RL වැඩමුළුවක් සඳහා වෙන් කරන ලදී, එහිදී Optimistic Actor Critic Model architecture ඉදිරිපත් කරන ලදී, පෙර පැවති ඒවාට වඩා, විශේෂයෙන්ම Soft Actor Critic.

ලිපි:

NeurIPS 2019: ඉදිරි දශකය සඳහා අප සමඟ පවතින ML ප්‍රවණතා
StarCraft ක්‍රීඩකයින් Alphastar ආකෘතිය (DeepMind) සමඟ සටන් කරයි

5.GAN

උත්පාදක ජාලයන් තවමත් අවධානයට ලක්ව ඇත: බොහෝ කෘතීන් ගණිතමය සාක්ෂි සඳහා වැනිලා GAN භාවිතා කරයි, එමෙන්ම ඒවා නව, අසාමාන්‍ය ක්‍රමවලින් ද යෙදේ (ප්‍රස්ථාර උත්පාදක ආකෘති, ශ්‍රේණි සමඟ වැඩ කිරීම, දත්තවල ඇති-සහ-බලපෑම් සම්බන්ධතා සඳහා යෙදුම, ආදිය).

ලිපි:

වැඩිපුර වැඩ බාරගත් නිසා 1400 පහත අපි වඩාත් වැදගත් කථා ගැන කතා කරමු.

ආරාධිත කතා

"සමාජ බුද්ධිය", Blaise Aguera y Arcas (ගූගල්)

ලින්ක්
විනිවිදක සහ වීඩියෝ
කතාව අවධානය යොමු කරන්නේ යන්ත්‍ර ඉගෙනීමේ සාමාන්‍ය ක්‍රමවේදය සහ මේ වන විට කර්මාන්තය වෙනස් කිරීමේ අපේක්ෂාවන් - අප මුහුණ දෙන සන්ධිස්ථානය කුමක්ද? මොළය සහ පරිණාමය ක්‍රියා කරන්නේ කෙසේද සහ ස්වාභාවික පද්ධතිවල වර්ධනය පිළිබඳව අප දැනටමත් දන්නා දේවලින් අප එතරම් ප්‍රයෝජනයක් නොගන්නේ මන්ද?

ML හි කාර්මික සංවර්ධනය බොහෝ දුරට Google හි සංවර්ධනයේ සන්ධිස්ථාන සමඟ සමපාත වේ, එය වසරින් වසර NeurIPS පිළිබඳ සිය පර්යේෂණ ප්‍රකාශයට පත් කරයි:

  • 1997 - සෙවුම් පහසුකම් දියත් කිරීම, පළමු සේවාදායක, කුඩා පරිගණක බලය
  • 2010 - ජෙෆ් ඩීන් ආරම්භයේදීම ස්නායුක ජාලවල උත්පාතය වන ගූගල් බ්‍රේන් ව්‍යාපෘතිය දියත් කළේය.
  • 2015 – ස්නායුක ජාල කාර්මිකව ක්‍රියාත්මක කිරීම, දේශීය උපාංගයක් මත සෘජුවම වේගවත් මුහුණු හඳුනාගැනීම, ටෙන්සර් පරිගණකකරණය සඳහා සකස් කරන ලද පහත් මට්ටමේ ප්‍රොසෙසර - TPU. ගූගල් විසින් Coral ai දියත් කරයි - රාස්ප්බෙරි පයි හි ප්‍රතිසමයක්, ස්නායුක ජාල පර්යේෂණාත්මක ස්ථාපනයන් සඳහා හඳුන්වා දීම සඳහා කුඩා පරිගණකයක්
  • 2017 - ගූගල් විමධ්‍යගත පුහුණුව සංවර්ධනය කිරීම සහ විවිධ උපාංගවලින් ස්නායුක ජාල පුහුණුවේ ප්‍රතිඵල එක් ආකෘතියකට ඒකාබද්ධ කිරීම ආරම්භ කරයි - Android මත

අද, සමස්ත කර්මාන්තයක්ම දේශීය උපාංග මත දත්ත සුරක්ෂිතභාවය, එකතු කිරීම සහ ඉගෙනුම් ප්‍රතිඵල අනුකරණය කිරීම සඳහා කැපවී ඇත.

ෆෙඩරල් ඉගෙනීම - ML හි දිශානතියක් වන තනි තනි ආකෘති එකිනෙකින් ස්වාධීනව ඉගෙන ගන්නා අතර පසුව තනි ආකෘතියකට ඒකාබද්ධ කරනු ලැබේ (මූලාශ්‍ර දත්ත මධ්‍යගත කිරීමකින් තොරව), දුර්ලභ සිදුවීම්, විෂමතා, පුද්ගලීකරණය යනාදිය සඳහා සකස් කර ඇත. සියලුම Android උපාංග Google සඳහා අත්‍යවශ්‍යයෙන්ම තනි පරිගණක සුපිරි පරිගණකයකි.

ෆෙඩරේටඩ් ඉගෙනීම මත පදනම් වූ උත්පාදක ආකෘතීන් ගූගල්ට අනුව අනාගත දිශානතියකි, එය "ඝාතීය වර්ධනයේ මුල් අවධියේ" වේ. GANs, කථිකාචාර්යවරයාට අනුව, ජීවීන්ගේ ජනගහනයේ ස්කන්ධ හැසිරීම් සහ චින්තන ඇල්ගොරිතම ප්රතිනිෂ්පාදනය කිරීමට ඉගෙන ගැනීමට හැකියාව ඇත.

සරල GAN ගෘහනිර්මාණ දෙකක උදාහරණය භාවිතා කරමින්, ඒවා තුළ ප්‍රශස්තිකරණ මාර්ගයක් සෙවීම රවුමක සැරිසරන බව පෙන්වයි, එයින් අදහස් කරන්නේ ප්‍රශස්තිකරණය සිදු නොවන බවයි. ඒ අතරම, මෙම ආකෘති ජීව විද්‍යාඥයින් බැක්ටීරියා ගහනය මත සිදු කරන පරීක්ෂණ අනුකරණය කිරීමේදී ඉතා සාර්ථක වන අතර, ආහාර සෙවීමේදී නව හැසිරීම් උපාය මාර්ග ඉගෙන ගැනීමට ඔවුන්ට බල කරයි. ප්‍රශස්තිකරණ ශ්‍රිතයට වඩා ජීවිතය වෙනස් ලෙස ක්‍රියා කරන බව අපට නිගමනය කළ හැක.

NeurIPS 2019: ඉදිරි දශකය සඳහා අප සමඟ පවතින ML ප්‍රවණතා
ඇවිදීම GAN ප්‍රශස්තකරණය

යන්ත්‍ර ඉගෙනීමේ රාමුව තුළ අප දැන් කරන සියල්ල පටු සහ අතිශයින්ම විධිමත් කාර්යයන් වන අතර, මෙම විධිමත් කිරීම් හොඳින් සාමාන්‍යකරණය නොවන අතර ස්නායු භෞතික විද්‍යාව සහ ජීව විද්‍යාව වැනි ක්ෂේත්‍රවල අපගේ විෂය දැනුමට අනුරූප නොවේ.

නුදුරු අනාගතයේ දී ස්නායු භෞතික විද්‍යාව ක්ෂේත්‍රයෙන් ණයට ගැනීම ඇත්තෙන්ම වටින්නේ නව නියුරෝන ගෘහ නිර්මාණ ශිල්පය සහ දෝෂ පසුපස ප්‍රචාරණය කිරීමේ යාන්ත්‍රණයන් සුළු වශයෙන් සංශෝධනය කිරීමයි.

මිනිස් මොළය ස්නායු ජාලයක් මෙන් ඉගෙන නොගනී:

  • ඔහුට ඉන්ද්‍රියයන් හරහා සහ ළමා කාලයේ දී ඇති ඒවා ඇතුළුව අහඹු ප්‍රාථමික යෙදවුම් නොමැත
  • ඔහුට සහජ සංවර්ධනයේ ආවේනික දිශාවන් ඇත (ළදරුවෙකුගෙන් භාෂාව ඉගෙන ගැනීමට ඇති ආශාව, කෙළින් ඇවිදීම)

තනි පුද්ගල මොළයක් පුහුණු කිරීම පහත් මට්ටමේ කාර්යයකි; සමහර විට අපි කණ්ඩායම් පරිණාමයේ යාන්ත්‍රණ ප්‍රතිනිෂ්පාදනය කිරීම සඳහා එකිනෙකාට දැනුම ලබා දෙන වේගයෙන් වෙනස් වන පුද්ගලයන්ගේ “විජිත” සලකා බැලිය යුතුය.

අපට දැන් ML ඇල්ගොරිතම වලට අනුගත විය හැකි දේ:

  • ජනගහනයේ ඉගෙනීම සහතික කරන සෛල පෙළපත් ආකෘති යොදන්න, නමුත් පුද්ගලයාගේ කෙටි ආයු කාලය ("තනි පුද්ගල මොළය")
  • උදාහරණ කුඩා සංඛ්‍යාවක් භාවිතා කරමින් සුළු-වෙඩි ඉගෙනීම
  • වඩාත් සංකීර්ණ නියුරෝන ව්යුහයන්, තරමක් වෙනස් සක්රිය කිරීමේ කාර්යයන්
  • "ජෙනෝමය" ඊළඟ පරම්පරාවට මාරු කිරීම - backpropagation ඇල්ගොරිතම
  • අපි ස්නායු භෞතික විද්‍යාව සහ ස්නායු ජාල සම්බන්ධ කළ පසු, අපි බොහෝ සංරචක වලින් බහුකාර්ය මොළයක් ගොඩනැගීමට ඉගෙන ගනිමු.

මෙම දෘෂ්ටි කෝණයෙන්, SOTA විසඳුම් භාවිතය හානිකර වන අතර පොදු කාර්යයන් (මිණුම් සලකුණු) සංවර්ධනය කිරීම සඳහා සංශෝධනය කළ යුතුය.

“වෙරිඩිකල් දත්ත විද්‍යාව”, බින් යූ (බර්ක්ලි)

වීඩියෝ සහ විනිවිදක
යන්ත්‍ර ඉගෙනුම් ආකෘති අර්ථකථනය කිරීමේ ගැටලුව සහ ඒවායේ සෘජු පරීක්‍ෂණය සහ සත්‍යාපනය සඳහා වූ ක්‍රමවේදය පිළිබඳ වාර්තාව කැප කර ඇත. ඕනෑම පුහුණු ML ආකෘතියක් එයින් උකහා ගත යුතු දැනුම ප්‍රභවයක් ලෙස හඳුනාගත හැකිය.

බොහෝ ක්ෂේත්‍රවල, විශේෂයෙන් වෛද්‍ය විද්‍යාවේ, මෙම සැඟවුණු දැනුම උකහා ගැනීමෙන් සහ ආකෘතියේ ප්‍රතිඵල අර්ථ නිරූපණය නොකර ආකෘතියක් භාවිතා කිරීම කළ නොහැක්කකි - එසේ නොමැතිනම් ප්‍රති result ලය ස්ථාවර, අහඹු නොවන, විශ්වාසදායක වන අතර ඒවා විනාශ නොකරන බවට අපට විශ්වාස නැත. රෝගියා. ගැඹුරු ඉගෙනුම් ආදර්ශය තුළ වැඩ ක්‍රමවේදයේ සම්පූර්ණ දිශාවක් වර්ධනය වෙමින් පවතින අතර එහි සීමාවන් ඉක්මවා යයි - සත්‍ය දත්ත විද්‍යාව. එය කුමක්ද?

අපට අවශ්‍ය වන්නේ විද්‍යාත්මක ප්‍රකාශනවල එවැනි ගුණාත්මක භාවයක් සහ ආකෘතිවල ප්‍රතිනිෂ්පාදනය වන ඒවා නම්:

  1. අනාවැකි කියහැකි
  2. ගණනය කළ හැකි
  3. ස්ථාවර

මෙම මූලධර්ම තුන නව ක්‍රමවේදයේ පදනම වේ. මෙම නිර්ණායකවලට එරෙහිව ML මාදිලි පරීක්ෂා කරන්නේ කෙසේද? පහසුම ක්රමය වන්නේ වහාම අර්ථකථනය කළ හැකි ආකෘති (ප්රතිගාමීත්වය, තීරණ ගස්) තැනීමයි. කෙසේ වෙතත්, ගැඹුරු ඉගෙනීමේ ක්ෂණික ප්‍රතිලාභ ලබා ගැනීමට ද අපට අවශ්‍යය.

ගැටලුව සමඟ වැඩ කිරීමට පවතින ක්රම කිහිපයක්:

  1. ආකෘතිය අර්ථ නිරූපණය කරන්න;
  2. අවධානය මත පදනම් වූ ක්රම භාවිතා කරන්න;
  3. පුහුණු කිරීමේදී ඇල්ගොරිතම සමූහයක් භාවිතා කරන්න, සහ රේඛීය අර්ථකථන ආකෘති ස්නායුක ජාලයට සමාන පිළිතුරු පුරෝකථනය කිරීමට ඉගෙන ගන්නා බවට වග බලා ගන්න, රේඛීය ආකෘතියෙන් විශේෂාංග අර්ථකථනය කරන්න;
  4. පුහුණු දත්ත වෙනස් කිරීම සහ වැඩි කිරීම. මෙයට ශබ්දය එකතු කිරීම, බාධා කිරීම් සහ දත්ත වැඩි කිරීම ඇතුළත් වේ;
  5. ආකෘතියේ ප්රතිඵල අහඹු නොවන අතර සුළු අනවශ්ය මැදිහත්වීම් මත රඳා නොපවතින බව සහතික කිරීමට උපකාර වන ඕනෑම ක්රමයක් (විරුද්ධ ප්රහාර);
  6. ඇත්ත වශයෙන්ම, පුහුණුවෙන් පසු ආකෘතිය අර්ථ නිරූපණය කරන්න;
  7. අධ්යයනය විශේෂාංග බර විවිධ ආකාරවලින්;
  8. සියලුම උපකල්පනවල සම්භාවිතාව, පන්ති ව්‍යාප්තිය අධ්‍යයනය කරන්න.

NeurIPS 2019: ඉදිරි දශකය සඳහා අප සමඟ පවතින ML ප්‍රවණතා
විරුද්ධවාදී ප්රහාරය ඌරෙක් සඳහා

ආකෘති නිර්මාණ දෝෂ සෑම කෙනෙකුටම මිල අධික වේ: ප්‍රධාන උදාහරණයක් වන්නේ රයින්හාර්ට් සහ රොගොව්ගේ වැඩ ය.ණය කාලයක වර්ධනය"බොහෝ යුරෝපීය රටවල ආර්ථික ප්‍රතිපත්තිවලට බලපෑම් කළ අතර කප්පාදු ප්‍රතිපත්ති අනුගමනය කිරීමට ඔවුන්ට බල කෙරුනි, නමුත් වසර ගණනාවකට පසු දත්ත සහ ඒවා සැකසීමේ ප්‍රවේශමෙන් නැවත පරීක්ෂා කිරීම ප්‍රතිවිරුද්ධ ප්‍රතිඵලය පෙන්නුම් කළේය!

ඕනෑම ML තාක්ෂණයක් ක්‍රියාත්මක කිරීමේ සිට ක්‍රියාත්මක කිරීම දක්වා ස්වකීය ජීවන චක්‍රයක් ඇත. නව ක්‍රමවේදයේ පරමාර්ථය වන්නේ ආකෘතියේ ජීවිතයේ සෑම අදියරකදීම මූලික මූලධර්ම තුනක් පරීක්ෂා කිරීමයි.

සාරාංශය:

  • ML ආකෘතිය වඩාත් විශ්වාසදායක වීමට උපකාර වන ව්යාපෘති කිහිපයක් සංවර්ධනය වෙමින් පවතී. මෙය, උදාහරණයක් ලෙස, deeptune (සබැඳිය: github.com/ChrisCummins/paper-end2end-dl);
  • ක්රමවේදය තවදුරටත් වර්ධනය කිරීම සඳහා, ML ක්ෂේත්රයේ ප්රකාශනවල ගුණාත්මකභාවය සැලකිය යුතු ලෙස වැඩිදියුණු කිරීම අවශ්ය වේ;
  • යන්ත්‍ර ඉගෙනීමට තාක්ෂණික සහ මානව ශාස්ත්‍ර යන ක්ෂේත්‍ර දෙකෙහිම බහුවිධ පුහුණුව සහ ප්‍රවීණත්වය ඇති නායකයින් අවශ්‍ය වේ.

“යන්ත්‍ර ඉගෙනීම සමඟ මානව හැසිරීම් ආකෘති නිර්මාණය: අවස්ථා සහ අභියෝග” නූරියා එම් ඔලිවර්, ඇල්බට් අලි සලා

මානව හැසිරීම්, එහි තාක්ෂණික පදනම් සහ යෙදුම් අපේක්ෂාවන් ආදර්ශනය කිරීමට කැප වූ දේශනය.

මානව හැසිරීම් ආකෘතිකරණය පහත පරිදි බෙදිය හැකිය:

  • තනි හැසිරීම
  • කුඩා පිරිසකගේ හැසිරීම
  • මහජන හැසිරීම

මෙම සෑම වර්ගයකම ML භාවිතයෙන් ආකෘතිගත කළ හැකි නමුත් සම්පූර්ණයෙන්ම වෙනස් ආදාන තොරතුරු සහ විශේෂාංග සමඟ. සෑම වර්ගයකටම එක් එක් ව්‍යාපෘතිය හරහා යන තමන්ගේම සදාචාරාත්මක ගැටළු ද ඇත:

  • තනි හැසිරීම් - අනන්යතා සොරකම්, ගැඹුරු;
  • පුද්ගලයින්ගේ කණ්ඩායම් හැසිරීම - නිර්නාමිකකරණය, චලනයන් පිළිබඳ තොරතුරු ලබා ගැනීම, දුරකථන ඇමතුම් ආදිය;

තනි හැසිරීම

බොහෝ දුරට පරිගණක දැක්ම යන මාතෘකාවට සම්බන්ධ වේ - මානව හැඟීම් සහ ප්‍රතික්‍රියා හඳුනා ගැනීම. සමහර විට සන්දර්භය තුළ, කාලය තුළ හෝ ඔහුගේම හැඟීම්වල විචල්‍යතාවයේ සාපේක්ෂ පරිමාණය සමඟ පමණි. ස්ලයිඩය මධ්‍යධරණී කාන්තාවන්ගේ චිත්තවේගීය වර්ණාවලියෙන් සන්දර්භය භාවිතා කරමින් මොනාලිසාගේ චිත්තවේගයන් හඳුනා ගැනීම පෙන්වයි. ප්රතිඵලය: ප්රීතියෙන් සිනහවක්, නමුත් පිළිකුලෙන් හා පිළිකුලෙන්. හේතුව බොහෝ විට "උදාසීන" චිත්තවේගයක් නිර්වචනය කිරීමේ තාක්ෂණික ක්රමයකි.

කුඩා පිරිසකගේ හැසිරීම

මෙතෙක් නරකම ආකෘතිය ප්රමාණවත් තොරතුරු නිසාය. උදාහරණයක් ලෙස, 2018 - 2019 දක්වා කෘති පෙන්වා ඇත. පුද්ගලයන් දුසිම් ගනනක් මත X වීඩියෝ දුසිම් ගනනක් (cf. 100k++ රූප දත්ත කට්ටල). මෙම කාර්යය වඩාත් හොඳින් ආදර්ශනය කිරීම සඳහා, බහුමාධ්‍ය තොරතුරු අවශ්‍ය වේ, වඩාත් සුදුසු වන්නේ ශරීර-උච්චමානයක සංවේදක, උෂ්ණත්වමානය, මයික්‍රෆෝන පටිගත කිරීම යනාදියයි.

සමූහ හැසිරීම

පාරිභෝගිකයා එක්සත් ජාතීන්ගේ සංවිධානය සහ බොහෝ ප්‍රාන්ත බැවින් වඩාත්ම සංවර්ධිත ප්‍රදේශය. එළිමහන් නිරීක්ෂණ කැමරා, දුරකථන කුළුණු වලින් දත්ත - බිල්පත්, කෙටි පණිවුඩ, ඇමතුම්, රාජ්ය දේශසීමා අතර චලනය පිළිබඳ දත්ත - මේ සියල්ල මිනිසුන්ගේ චලනය සහ සමාජ අස්ථාවරත්වය පිළිබඳ ඉතා විශ්වසනීය චිත්රයක් ලබා දෙයි. තාක්ෂණයේ විභව යෙදුම්: ගලවා ගැනීමේ මෙහෙයුම් ප්‍රශස්ත කිරීම, හදිසි අවස්ථා වලදී සහය සහ කාලානුරූපී ජනගහනය ඉවත් කිරීම. භාවිතා කරන ලද ආකෘති ප්‍රධාන වශයෙන් තවමත් දුර්වල ලෙස අර්ථකථනය කර ඇත - මේවා විවිධ LSTMs සහ convolutional ජාල වේ. ඕනෑම පර්යේෂණයක් සඳහා අවශ්‍ය නිර්නාමික දත්ත බෙදා ගැනීමට යුරෝපීය ව්‍යාපාරවලට බැඳී සිටින නව නීතියක් සඳහා එක්සත් ජාතීන් බලපෑම් කරන බවට කෙටි ප්‍රකාශයක් තිබුණි.

"පද්ධතිය 1 සිට පද්ධති 2 දක්වා ගැඹුරු ඉගෙනීම", යොෂුවා බෙන්ගියෝ

විනිවිදක
ජෝෂුවා බෙන්ගියෝගේ දේශනයේදී, ගැඹුරු ඉගෙනීම ඉලක්ක සැකසීමේ මට්ටමින් ස්නායු විද්‍යාව හමුවෙයි.
නොබෙල් ත්‍යාගලාභී Daniel Kahneman ගේ ක්‍රමවේදයට අනුව බෙන්ගියෝ ප්‍රධාන ගැටළු වර්ග දෙකක් හඳුනා ගනී (පොත "සෙමින් සිතන්න, ඉක්මනින් තීරණය කරන්න")
වර්ගය 1 - පද්ධති 1, අපි "ස්වයංක්‍රීයව" (පුරාණ මොළය) කරන සිහිසුන් ක්‍රියා: හුරුපුරුදු ස්ථානවල මෝටර් රථයක් පැදවීම, ඇවිදීම, මුහුණු හඳුනා ගැනීම.
වර්ගය 2 - පද්ධතිය 2, සවිඥානක ක්රියා (මස්තිෂ්ක බාහිකය), ඉලක්ක සැකසීම, විශ්ලේෂණය, චින්තනය, සංයුක්ත කාර්යයන්.

AI මෙතෙක් ප්‍රමාණවත් උසකට ළඟා වී ඇත්තේ පළමු වර්ගයේ කාර්යයන්හිදී පමණක් වන අතර අපගේ කාර්යය වන්නේ එය දෙවැන්නට ගෙන ඒම, බහුවිධ මෙහෙයුම් සිදු කිරීමට සහ තර්ක ශාස්ත්‍රය සහ ඉහළ මට්ටමේ සංජානන කුසලතා සමඟ ක්‍රියා කිරීමට ඉගැන්වීමයි.

මෙම ඉලක්කය සපුරා ගැනීම සඳහා එය යෝජනා කරනු ලැබේ:

  1. NLP කර්තව්‍යයන්හිදී, ආදර්ශ චින්තනය සඳහා ප්‍රධාන යාන්ත්‍රණයක් ලෙස අවධානය භාවිතා කරන්න
  2. විඥානයට සහ ඒවායේ ප්‍රාදේශීයකරණයට බලපෑම් කරන වඩා හොඳ ආදර්ශ විශේෂාංග සඳහා මෙටා-ඉගෙනීම සහ නියෝජන ඉගෙනීම භාවිතා කරන්න - සහ ඒවායේ පදනම මත ඉහළ මට්ටමේ සංකල්ප සමඟ ක්‍රියා කිරීමට ඉදිරියට යන්න.

නිගමනයක් වෙනුවට, මෙන්න ආරාධිත කථාවක්: බෙන්ගියෝ යනු ප්‍රශස්තිකරණ ගැටළු, SOTA සහ නව ගෘහ නිර්මාණ ශිල්පයෙන් ඔබ්බට ML ක්ෂේත්‍රය පුළුල් කිරීමට උත්සාහ කරන බොහෝ විද්‍යාඥයන්ගෙන් කෙනෙකි.
විඥානයේ ගැටළු, චින්තනයේ භාෂාවේ බලපෑම, ස්නායු ජීව විද්‍යාව සහ ඇල්ගොරිතමවල සංයෝජනය අනාගතයේදී අප බලා සිටින්නේ කුමක් ද යන්න සහ මිනිසුන් මෙන් “හිතන” යන්ත්‍ර වෙත යාමට අපට ඉඩ සලසන ප්‍රශ්නය විවෘතව පවතී.

ස්තුතියි!



මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න