කෘතිම බුද්ධියේ නැඹුරුව ගැන

කෘතිම බුද්ධියේ නැඹුරුව ගැන

tl; dr:

  • යන්ත්‍ර ඉගෙනීම දත්තවල රටා සොයයි. නමුත් කෘතිම බුද්ධිය "පක්ෂග්‍රාහී" විය හැකිය - එනම් වැරදි රටා සොයා ගැනීමයි. උදාහරණයක් ලෙස, ඡායාරූප මත පදනම් වූ සමේ පිළිකා හඳුනාගැනීමේ පද්ධතියක් වෛද්‍යවරයෙකුගේ කාර්යාලයේ ගන්නා ලද පින්තූර කෙරෙහි විශේෂ අවධානයක් යොමු කළ හැකිය. මැෂින් ඉගෙන ගන්න බෑ තේරුම් ගන්න: එහි ඇල්ගොරිතම පමණක් ඉලක්කම් රටා හඳුනා ගන්නා අතර, දත්ත නියෝජනය නොවේ නම්, එය සැකසීමේ ප්රතිඵලය වනු ඇත. යන්ත්‍ර ඉගෙනීමේ යාන්ත්‍ර විද්‍යාව නිසා එවැනි දෝෂ අල්ලා ගැනීම දුෂ්කර විය හැකිය.
  • වඩාත්ම පැහැදිලි හා භයානක ගැටළු කලාපය මානව විවිධත්වයයි. මිනිසුන් පිළිබඳ දත්ත රැස් කිරීමේ අදියරේදී පවා වාස්තවිකත්වය නැති වීමට හේතු බොහෝමයක් ඇත. නමුත් මෙම ගැටලුව මිනිසුන්ට පමණක් බලපාන බව සිතන්න එපා: ගබඩාවක ගංවතුරක් හෝ අසාර්ථක ගෑස් ටර්බයිනයක් හඳුනා ගැනීමට උත්සාහ කරන විට හරියටම එම දුෂ්කරතා පැන නගී. සමහර පද්ධති සමේ වර්ණයට පක්ෂග්‍රාහී විය හැකි අතර අනෙක් ඒවා Siemens සංවේදක වෙත නැඹුරු වේ.
  • එවැනි ගැටළු යන්ත්‍ර ඉගෙනීමට අලුත් දෙයක් නොවන අතර ඒවා එයට අනන්‍ය නොවේ. ඕනෑම සංකීර්ණ ව්‍යුහයක් තුළ වැරදි උපකල්පන සිදු කරනු ලබන අතර, විශේෂිත තීරණයක් ගනු ලැබුවේ මන්දැයි තේරුම් ගැනීම සැමවිටම අපහසු වේ. අපි මෙය සවිස්තරාත්මක ආකාරයකින් සටන් කිරීමට අවශ්‍යයි: සත්‍යාපනය සඳහා මෙවලම් සහ ක්‍රියාවලි සාදන්න - සහ AI නිර්දේශයන් අන්ධ ලෙස අනුගමනය නොකරන ලෙස පරිශීලකයින් දැනුවත් කරන්න. යන්ත්‍ර ඉගෙනීම සමහර දේවල් අපට කළ හැකි දේට වඩා හොඳින් සිදු කරයි - නමුත් නිදසුනක් වශයෙන්, සුනඛයන් මත්ද්‍රව්‍ය හඳුනාගැනීමේදී මිනිසුන්ට වඩා බෙහෙවින් ඵලදායී වේ, එය ඔවුන් සාක්ෂිකරුවන් ලෙස භාවිතා කිරීමට සහ ඔවුන්ගේ සාක්ෂි මත පදනම්ව විනිශ්චය කිරීමට හේතුවක් නොවේ. ඒ වගේම බල්ලන්, ඕනෑම යන්ත්‍ර ඉගෙනුම් පද්ධතියකට වඩා දක්ෂයි.

යන්ත්‍ර ඉගෙනීම අද වන විට ඉතා වැදගත් මූලික තාක්ෂණික ප්‍රවණතාවලින් එකකි. ඉදිරි දශකය තුළ තාක්‍ෂණය අප අවට ලෝකය වෙනස් කරන ප්‍රධාන ක්‍රමවලින් එකකි. මෙම වෙනස්කම්වල සමහර පැති කනස්සල්ලට හේතු වේ. උදාහරණයක් ලෙස, යන්ත්‍ර ඉගෙනීමේ ශ්‍රම වෙළඳපොලේ ඇති විය හැකි බලපෑම, හෝ සදාචාර විරෝධී අරමුණු සඳහා එය භාවිතා කිරීම (උදාහරණයක් ලෙස, ඒකාධිපති පාලන තන්ත්‍රයන් විසින්). මෙම පෝස්ටුව ආමන්ත්‍රණය කරන තවත් ගැටලුවක් තිබේ: කෘතිම බුද්ධි පක්ෂග්රාහීත්වය.

මේක ලේසි පහසු කතාවක් නෙවෙයි.

කෘතිම බුද්ධියේ නැඹුරුව ගැන
Google හි AI බළලුන් සොයා ගත හැක. 2012 වසරේ මේ පුවත එදා විශේෂ දෙයක් විය.

"AI Bias" යනු කුමක්ද?

"අමු දත්ත" යනු ඔක්සිමොරොන් සහ නරක අදහසකි; දත්ත හොඳින් හා ප්රවේශමෙන් සකස් කළ යුතුය. -ජෙෆ්රි බෝකර්

2013 ට පෙර කොහේ හරි, ඡායාරූපවල බළලුන් හඳුනා ගන්නා පද්ධතියක් සෑදීම සඳහා, ඔබට තාර්කික පියවර විස්තර කිරීමට සිදු විය. රූපයක කොන් සොයා ගන්නේ කෙසේද, ඇස් හඳුනා ගන්නේ කෙසේද, ලොම් සඳහා වයනය විශ්ලේෂණය කිරීම, පාද ගණන් කිරීම සහ යනාදිය. ඉන්පසු සියලුම සංරචක එකට එකතු කර එය සැබවින්ම ක්‍රියා නොකරන බව සොයා ගන්න. යාන්ත්‍රික අශ්වයෙකු මෙන් - න්‍යායාත්මකව එය සෑදිය හැකි නමුත් ප්‍රායෝගිකව එය විස්තර කිරීමට තරම් සංකීර්ණ නොවේ. අවසාන ප්‍රතිඵලය වන්නේ අතින් ලියන ලද නීති සිය ගණනක් (හෝ දහස් ගණනක්) ය. සහ එක වැඩ කරන ආකෘතියක් නොවේ.

යන්ත්‍ර ඉගෙනීමේ පැමිණීමත් සමඟ, අපි යම් වස්තුවක් හඳුනා ගැනීම සඳහා “අත්පොත” නීති භාවිතා කිරීම නැවැත්තුවා. ඒ වෙනුවට, අපි "මෙය", X සාම්පල දහසක්, "වෙනත්", Y සාම්පල දහසක් ගෙන, ඒවායේ සංඛ්යානමය විශ්ලේෂණය මත පදනම්ව පරිගණකය විසින් ආකෘතියක් ගොඩනඟමු. අපි පසුව මෙම ආකෘතියට යම් නියැදි දත්ත ලබා දෙන අතර එය කට්ටලවලින් එකකට ගැලපෙනවාද යන්න නිශ්චිතවම තීරණය කරයි. යන්ත්‍ර ඉගෙනීම මිනිසා විසින් ලිවීමට වඩා දත්ත වලින් ආකෘතියක් ජනනය කරයි. විශේෂයෙන්ම රූප සහ රටා හඳුනාගැනීමේ ක්ෂේත්‍රයේ ප්‍රතිඵල සිත් ඇදගන්නා සුළු වන අතර, සමස්ත තාක්‍ෂණ කර්මාන්තය දැන් යන්ත්‍ර ඉගෙනීම (ML) වෙත ගමන් කරන්නේ එබැවිනි.

නමුත් එය එතරම් සරල නැත. සැබෑ ලෝකයේ, ඔබේ X හෝ Y උදාහරණ දහස් ගණනක A, B, J, L, O, R, සහ L පවා අඩංගු වේ. මේවා ඒකාකාරව බෙදී නොතිබිය හැකි අතර සමහර ඒවා නිතර සිදු විය හැකි අතර පද්ධතිය වැඩිපුර ගෙවනු ඇත. ඔබ උනන්දුවක් දක්වන වස්තූන්ට වඩා ඔවුන් වෙත අවධානය යොමු කරන්න.

මෙය ප්රායෝගිකව අදහස් කරන්නේ කුමක්ද? මගේ ප්‍රියතම උදාහරණය නම් රූප හඳුනාගැනීමේ පද්ධති වේ තණකොළ සහිත කන්දක් දෙස බලා "බැටළුවන්" යැයි කියන්න. එයට හේතුව පැහැදිලිය: "බැටළුවන්ගේ" බොහෝ උදාහරණ ඡායාරූප ඔවුන් ජීවත් වන තණබිම් වල ලබාගෙන ඇති අතර, මෙම පින්තූරවල තණකොළ කුඩා සුදු පිහාටු වලට වඩා වැඩි ඉඩක් ගන්නා අතර පද්ධතිය වඩාත් වැදගත් ලෙස සලකන්නේ තණකොළ වේ. .

ඊට වඩා බරපතල උදාහරණ තිබේ. මෑත කාලීන එකක් ව්‍යාපෘතිය ඡායාරූපවල සමේ පිළිකා හඳුනා ගැනීම සඳහා. චර්ම රෝග විශේෂඥයින් බොහෝ විට සමේ පිළිකා වල ප්‍රකාශනයන් සමඟ පාලකයා ඡායාරූප ගත කරන්නේ සංයුතිවල ප්‍රමාණය සටහන් කරන බවයි. නිරෝගී සමේ උදාහරණ ඡායාරූපවල පාලකයන් නොමැත. AI පද්ධතියක් සඳහා, එවැනි පාලකයන් (වඩාත් නිවැරදිව, අපි "පාලකයෙකු" ලෙස අර්ථ දක්වන පික්සෙල්) උදාහරණ කට්ටල අතර වෙනස්කම් වලින් එකක් බවට පත් වී ඇති අතර සමහර විට සමේ කුඩා කුෂ්ඨයකට වඩා වැදගත් වේ. එබැවින් සමේ පිළිකා හඳුනා ගැනීම සඳහා නිර්මාණය කරන ලද පද්ධතියක් සමහර විට ඒ වෙනුවට පිළිගත් පාලකයන් විය.

මෙහි ඇති ප්‍රධාන කරුණ නම් පද්ධතියට තමන් දෙස බලන දේ පිළිබඳ අර්ථකථන අවබෝධයක් නොමැති වීමයි. අපි පික්සෙල් කට්ටලයක් දෙස බලන අතර ඔවුන් තුළ බැටළුවෙකු, සමක් හෝ පාලකයෙකු දකිමු, නමුත් පද්ධතිය සංඛ්යා රේඛාවක් පමණි. ඇය ත්‍රිමාන අවකාශය නොදකියි, වස්තූන්, වයනය හෝ බැටළුවන් නොදකියි. ඇය හුදෙක් දත්තවල රටා දකියි.

එවැනි ගැටළු හඳුනාගැනීමේ දුෂ්කරතාවය වන්නේ ස්නායුක ජාලය (ඔබේ යන්ත්‍ර ඉගෙනුම් පද්ධතිය මගින් ජනනය කරන ලද ආකෘතිය) නෝඩ් සිය දහස් ගණනකින් සමන්විත වීමයි. ආකෘතියක් සොයා බලා එය තීරණයක් ගන්නේ කෙසේදැයි බැලීමට පහසු ක්රමයක් නොමැත. එවැනි ක්‍රමයක් තිබීමෙන් අදහස් වන්නේ යන්ත්‍ර ඉගෙනීම භාවිතා නොකර සියලුම නීති හස්තීයව විස්තර කිරීමට තරම් ක්‍රියාවලිය සරල බවයි. යන්ත්‍ර ඉගෙනීම කළු පෙට්ටියක් බවට පත්ව ඇති බවට මිනිසුන් කනස්සල්ලට පත්ව සිටිති. (මෙම සංසන්දනය තවමත් වැඩි වන්නේ මන්දැයි මම ටිකක් පසුව පැහැදිලි කරමි.)

මෙය සාමාන්‍යයෙන්, කෘත්‍රිම බුද්ධියේ හෝ යන්ත්‍ර ඉගෙනීමේ පක්ෂග්‍රාහී ප්‍රශ්නයකි: දත්තවල රටා සෙවීමේ පද්ධතියක් වැරදි රටා සොයා ගත හැකි අතර, ඔබ එය නොදකිනු ඇත. මෙය තාක්‍ෂණයේ මූලික ලක්‍ෂණයක් වන අතර එය ශාස්ත්‍රීය හා විශාල තාක්‍ෂණ සමාගම්වල එය සමඟ වැඩ කරන සෑම කෙනෙකුටම පැහැදිලිය. නමුත් එහි ප්‍රතිවිපාක සංකීර්ණ වන අතර එම ප්‍රතිවිපාක සඳහා අපට කළ හැකි විසඳුම් ද එසේමය.

ප්‍රතිවිපාක ගැන මුලින්ම කතා කරමු.

කෘතිම බුද්ධියේ නැඹුරුව ගැන
නොපෙනෙන සංඥා විශාල සංඛ්‍යාවක් මත පදනම්ව, AI මගින්, අපට ව්‍යංගයෙන්, ඇතැම් වර්ගවල පුද්ගලයින්ට පක්ෂව තේරීමක් කළ හැකිය.

AI පක්ෂග්‍රාහී අවස්ථා

වඩාත්ම පැහැදිලිව හා බියජනක ලෙස, මෙම ගැටලුව මානව විවිධත්වය සම්බන්ධයෙන් ප්රකාශයට පත් විය හැකිය. මෑතකදී කටකතාවක් තිබුණාඇමේසන් රැකියා අපේක්ෂකයින් මූලික පරීක්ෂාව සඳහා යන්ත්‍ර ඉගෙනුම් පද්ධතියක් ගොඩනැගීමට උත්සාහ කළ බව. Amazon කම්කරුවන් අතර වැඩි පිරිමින් සිටින බැවින්, "සාර්ථක කුලියට ගැනීම" පිළිබඳ උදාහරණ ද බොහෝ විට පිරිමින් වන අතර, පද්ධතිය විසින් යෝජනා කරන ලද ජීව දත්ත පත්‍ර තෝරාගැනීමේදී වැඩි පිරිමින් සිටියහ. ඇමේසන් මෙය දුටු අතර පද්ධතිය නිෂ්පාදනයට මුදා හැරියේ නැත.

මෙම උදාහරණයේ ඇති වැදගත්ම දෙය නම්, නැවත ආරම්භයේ ස්ත්‍රී පුරුෂ භාවය නිශ්චිතව දක්වා නොතිබුණද, ක්‍රමය පිරිමි අයදුම්කරුවන්ට අනුග්‍රහය දක්වන බවට කටකතා පැතිරීමයි. මෙම පද්ධතිය "හොඳ කුලියට ගැනීම්" සඳහා උදාහරණ ලෙස වෙනත් රටා දුටුවේය: නිදසුනක් වශයෙන්, කාන්තාවන්ට ජයග්‍රහණ විස්තර කිරීමට විශේෂ වචන භාවිතා කළ හැකිය, නැතහොත් විශේෂ විනෝදාංශ තිබිය හැකිය. ඇත්ත වශයෙන්ම, පද්ධතිය "හොකී" යනු කුමක්ද, "මිනිසුන්" යනු කවුරුන්ද, "සාර්ථකත්වය" යනු කුමක්දැයි දැන සිටියේ නැත - එය හුදෙක් පාඨයේ සංඛ්යානමය විශ්ලේෂණයක් සිදු කළේය. නමුත් ඇය දුටු රටා බොහෝ විට මිනිසුන්ගේ අවධානයට ලක් නොවනු ඇත, සමහර ඒවා (උදාහරණයක් ලෙස, විවිධ ලිංගයේ අය සාර්ථකත්වය වෙනස් ලෙස විස්තර කරන බව) අප ඒවා දෙස බැලුවද අපට දැකීමට අපහසු වනු ඇත.

තවදුරටත් - වඩාත් නරක. සුදුමැලි සම මත පිළිකා සොයා ගැනීමට ඉතා හොඳ යන්ත්‍ර ඉගෙනුම් පද්ධතියක් අඳුරු සම මත හොඳින් ක්‍රියා නොකරනු ඇත, නැතහොත් අනෙක් අතට. පක්ෂග්රාහී නිසා අවශ්ය නොවේ, නමුත් ඔබ බොහෝ විට විවිධ ලක්ෂණ තෝරා, වෙනස් සමේ වර්ණය සඳහා වෙනම ආකෘතියක් ගොඩනැගීමට අවශ්ය නිසා. රූප හඳුනාගැනීම වැනි පටු ප්‍රදේශයක වුවද යන්ත්‍ර ඉගෙනුම් පද්ධති එකිනෙකට හුවමාරු කළ නොහැක. ඔබට අවශ්‍ය නිරවද්‍යතාවය ලබා ගන්නා තෙක් ඔබ උනන්දුවක් දක්වන දත්තවල විශේෂාංග පිළිබඳව හොඳ හසුරුවීමක් ලබා ගැනීම සඳහා ඔබට සමහර විට අත්හදා බැලීම් සහ දෝෂයන් හරහා පද්ධතිය වෙනස් කිරීමට අවශ්‍ය වේ. නමුත් ඔබ නොදකින දෙයක් නම්, පද්ධතිය එක් කණ්ඩායමක් සමඟ 98% ක් නිවැරදි වන අතර අනෙක් කණ්ඩායම සමඟ 91% (මිනිස් විශ්ලේෂණයට වඩා නිවැරදි) පමණි.

මම මෙතෙක් ප්‍රධාන වශයෙන් භාවිත කළේ පුද්ගලයන් සහ ඔවුන්ගේ ගතිලක්ෂණ සම්බන්ධ උදාහරණ. මෙම ගැටලුව පිළිබඳ සාකච්ඡාව ප්රධාන වශයෙන් මෙම මාතෘකාව කෙරෙහි අවධානය යොමු කරයි. නමුත් මිනිසුන් කෙරෙහි පක්ෂග්‍රාහී වීම ගැටලුවේ කොටසක් පමණක් බව වටහා ගැනීම වැදගත්ය. අපි බොහෝ දේ සඳහා යන්ත්‍ර ඉගෙනීම භාවිතා කරනු ඇත, නියැදි දෝෂය ඒ සියල්ලටම අදාළ වේ. අනෙක් අතට, ඔබ මිනිසුන් සමඟ වැඩ කරන්නේ නම්, දත්තවල ඇති නැඹුරුව ඔවුන්ට සම්බන්ධ නොවිය හැකිය.

මෙය තේරුම් ගැනීම සඳහා, අපි සමේ පිළිකා උදාහරණය වෙත ආපසු යමු සහ පද්ධතියේ අසාර්ථකත්වය සඳහා උපකල්පිත හැකියාවන් තුනක් සලකා බලමු.

  1. මිනිසුන්ගේ විෂමජාතීය ව්‍යාප්තිය: විවිධ සමේ වර්ණවල අසමතුලිත ඡායාරූප සංඛ්‍යාවක්, වර්ණක හේතුවෙන් ව්‍යාජ ධනාත්මක හෝ ව්‍යාජ සෘණාත්මක වීමට තුඩු දෙයි.
  2. පද්ධතිය පුහුණු කරන ලද දත්තවල නිතර සිදුවන සහ විෂම ලෙස බෙදා හරින ලද අංගයක් අඩංගු වන අතර එය මිනිසුන් සමඟ සම්බන්ධ නොවන අතර රෝග විනිශ්චය අගයක් නොමැත: බැටළුවන්ගේ ඡායාරූපවල සමේ පිළිකා හෝ තණකොළවල ඡායාරූපවල පාලකයෙකි. මෙම අවස්ථාවෙහිදී, මිනිස් ඇස "පාලකයෙකු" ලෙස හඳුනා ගන්නා දෙයක රූපයේ පික්සෙල් පද්ධතිය සොයා ගන්නේ නම්, ප්රතිඵලය වෙනස් වනු ඇත.
  3. පුද්ගලයෙකුට එය සෙවුවද නොපෙනෙන තෙවන පාර්ශවීය ලක්ෂණයක් දත්තවල අඩංගු වේ.

එයින් අදහස් කරන්නේ කුමක් ද? දත්ත විවිධ පුද්ගල කණ්ඩායම් වෙනස් ලෙස නියෝජනය කළ හැකි බව අපි දන්නා අතර අවම වශයෙන් අපට එවැනි ව්‍යතිරේක සෙවීමට සැලසුම් කළ හැක. වෙනත් වචන වලින් කිවහොත්, පුද්ගල කණ්ඩායම් පිළිබඳ දත්ත දැනටමත් යම් පක්ෂග්‍රාහීත්වයක් ඇති බව උපකල්පනය කිරීමට සමාජ හේතු ඕනෑ තරම් තිබේ. අපි පාලකයා සමඟ ඡායාරූපය දෙස බැලුවහොත්, අපට මෙම පාලකයා පෙනෙනු ඇත - අපි එය කලින් නොසලකා හැරියෙමු, එය කමක් නැති බව දැනගෙන, පද්ධතිය කිසිවක් නොදන්නා බව අමතක කළෙමු.

නමුත් ඔබේ සෞඛ්‍ය සම්පන්න නොවන සමේ ඡායාරූප සියල්ලම තාපදීප්ත ආලෝකය යටතේ කාර්යාලයක ගත් අතර ඔබේ නිරෝගී සම ප්‍රතිදීප්ත ආලෝකය යටතේ ගනු ලැබුවේ නම් කුමක් කළ යුතුද? ඔබ නිරෝගී සමට වෙඩි තැබීම අවසන් කළ පසු, සෞඛ්‍ය සම්පන්න නොවන සමට වෙඩි තැබීමට පෙර, ඔබ ඔබේ දුරකථනයේ මෙහෙයුම් පද්ධතිය යාවත්කාලීන කළහොත් සහ ඇපල් හෝ ගූගල් ශබ්දය අඩු කිරීමේ ඇල්ගොරිතම තරමක් වෙනස් කළහොත් කුමක් කළ යුතුද? එවැනි අංගයන් කොපමණ සොයා බැලුවත් පුද්ගලයෙකුට මෙය දැකිය නොහැක. නමුත් යන්ත්‍ර භාවිත පද්ධතිය මෙය වහාම දැක භාවිතා කරනු ඇත. ඇය කිසිවක් දන්නේ නැත.

මෙතෙක් අපි කතා කළේ ව්‍යාජ සහසම්බන්ධතා ගැන ය, නමුත් එය දත්ත නිවැරදි වීම සහ ප්‍රතිඵල නිවැරදි වීම ද විය හැකි නමුත් සදාචාරාත්මක, නෛතික හෝ කළමනාකරණ හේතූන් මත ඔබට ඒවා භාවිතා කිරීමට අවශ්‍ය නැත. නිදසුනක් වශයෙන්, සමහර අධිකරණ බලයන්, කාන්තාවන්ට ආරක්ෂිත රියදුරන් විය හැකි වුවද, ඔවුන්ගේ රක්ෂණයෙන් වට්ටමක් ලබා ගැනීමට කාන්තාවන්ට ඉඩ නොදේ. ඓතිහාසික දත්ත විශ්ලේෂණය කිරීමේදී කාන්තා නම් සඳහා අඩු අවදානම් සාධකයක් ලබා දෙන පද්ධතියක් අපට පහසුවෙන් සිතාගත හැකිය. හරි, අපි තේරීමෙන් නම් ඉවත් කරමු. නමුත් ඇමේසන් උදාහරණය මතක තබා ගන්න: පද්ධතියට වෙනත් සාධක මත පදනම්ව ස්ත්‍රී පුරුෂ භාවය තීරණය කළ හැකිය (ස්ත්‍රී පුරුෂ භාවය යනු කුමක්ද යන්න හෝ මෝටර් රථයක් යනු කුමක්දැයි එය නොදැන සිටියද), සහ නියාමකයා ඔබේ ගාස්තු ප්‍රතික්‍රියාශීලීව විශ්ලේෂණය කරන තෙක් ඔබ මෙය නොදකිනු ඇත. පිරිනැමීම සහ ගාස්තු ඔබට දඩ නියම කරනු ලැබේ.

අවසාන වශයෙන්, මිනිසුන් සහ සමාජ අන්තර්ක්‍රියා සම්බන්ධ ව්‍යාපෘති සඳහා පමණක් අප එවැනි පද්ධති භාවිතා කරනු ඇතැයි බොහෝ විට උපකල්පනය කෙරේ. මේක වැරදියි. ඔබ ගෑස් ටර්බයින සාදන්නේ නම්, ඔබේ නිෂ්පාදනයේ (ශ්‍රව්‍ය, දෘශ්‍ය, උෂ්ණත්වය සහ වෙනත් ඕනෑම සංවේදක යන්ත්‍රයක් නිර්මාණය කිරීමට ඉතා පහසුවෙන් අනුවර්තනය කළ හැකි දත්ත ජනනය කරන සංවේදක දස හෝ සිය ගණනක් මඟින් සම්ප්‍රේෂණය වන දුරේක්ෂයට යන්ත්‍ර ඉගෙනීම යෙදීමට අවශ්‍ය වනු ඇත. ඉගෙනුම් ආකෘතිය ). උපකල්පිත ලෙස, ඔබට මෙසේ පැවසිය හැකිය, “මෙන්න ටර්බයින දහසකින් අසාර්ථක වීමට පෙර අසාර්ථක වූ දත්ත, සහ අසාර්ථක නොවූ ටර්බයින දහසක දත්ත මෙන්න. ඔවුන් අතර ඇති වෙනස කුමක්දැයි පැවසීමට ආකෘතියක් සාදන්න. හොඳයි, දැන් සිතන්න Siemens සංවේදක නරක ටර්බයින වලින් 75% ක් මත ස්ථාපනය කර ඇති අතර හොඳ ඒවායින් 12% ක් පමණක් (අසාර්ථකවීම් සමඟ සම්බන්ධයක් නොමැත). මෙම පද්ධතිය Siemens සංවේදක සහිත ටර්බයින සොයා ගැනීමට ආකෘතියක් සාදනු ඇත. අපොයි!

කෘතිම බුද්ධියේ නැඹුරුව ගැන
පින්තූරය - Moritz Hardt, UC Berkeley

AI Bias කළමනාකරණය කිරීම

ඒ ගැන අපට කුමක් කළ හැකිද? ඔබට කෝණ තුනකින් ගැටලුවට ප්‍රවේශ විය හැකිය:

  1. පද්ධතිය පුහුණු කිරීම සඳහා දත්ත රැස් කිරීම සහ කළමනාකරණය කිරීමේ ක්‍රමවේද දැඩි බව.
  2. ආදර්ශ හැසිරීම් විශ්ලේෂණය සහ රෝග විනිශ්චය සඳහා තාක්ෂණික මෙවලම්.
  3. නිෂ්පාදන බවට යන්ත්‍ර ඉගෙනීම ක්‍රියාත්මක කිරීමේදී පුහුණු කරන්න, දැනුවත් කරන්න සහ ප්‍රවේශම් වන්න.

Moliere ගේ "The Bourgeois in the Nobility" පොතේ විහිළුවක් ඇත: සාහිත්‍යය ගද්‍ය හා පද්‍ය ලෙස බෙදා ඇති බව එක් මිනිසෙකුට පවසා ඇති අතර, ඔහු නොදැනුවත්වම තම ජීවිත කාලය පුරාම ගද්‍යයෙන් කතා කළ බව දැනගැනීමෙන් ඔහු සතුටට පත් විය. අද සංඛ්‍යාලේඛනවේදීන්ට හැඟෙන්නේ මෙයයි: එය අවබෝධ කර නොගෙන, ඔවුන් කෘතිම බුද්ධිය සහ නියැදීමේ දෝෂ සඳහා ඔවුන්ගේ වෘත්තීය ජීවිතය කැප කර ඇත. නියැදීමේ දෝෂයක් සෙවීම සහ ඒ ගැන කරදර වීම අලුත් ගැටලුවක් නොවේ, අපි ක්‍රමානුකූලව එහි විසඳුම වෙත ප්‍රවේශ විය යුතුය. ඉහත සඳහන් කළ පරිදි, සමහර අවස්ථාවලදී මිනිසුන්ගේ දත්ත සම්බන්ධ ගැටළු අධ්යයනය කිරීමෙන් මෙය කිරීමට පහසුය. විවිධ පුද්ගල කණ්ඩායම් සම්බන්ධයෙන් අපට අගතීන් තිබිය හැකි බව අපි පූර්වයෙන් උපකල්පනය කරමු, නමුත් Siemens සංවේදක පිළිබඳ අගතියක් අපට සිතීම පවා අපහසුය.

ඇත්ත වශයෙන්ම, මේ සියල්ලේ අලුත් දෙය නම්, මිනිසුන් තවදුරටත් සංඛ්‍යානමය විශ්ලේෂණයන් සෘජුව සිදු නොකරන බවයි. එය සිදු කරනු ලබන්නේ තේරුම් ගැනීමට අපහසු විශාල සංකීර්ණ ආකෘති නිර්මාණය කරන යන්ත්‍ර මගිනි. විනිවිදභාවය පිළිබඳ ගැටළුව පක්ෂග්‍රාහී ගැටලුවේ ප්‍රධාන අංගයකි. පද්ධතිය හුදෙක් පක්ෂග්‍රාහී නොවන බවත්, එහි පක්ෂග්‍රාහී බව හඳුනා ගැනීමට ක්‍රමයක් නොමැති බවත්, යන්ත්‍ර ඉගෙනීම පරීක්ෂා කළ හැකි පැහැදිලි තාර්කික පියවරයන්ගෙන් සමන්විත විය යුතු අනෙකුත් ස්වයංක්‍රීයකරණයට වඩා වෙනස් බවත් අපි බිය වෙමු.

මෙහි ගැටළු දෙකක් තිබේ. යන්ත්‍ර ඉගෙනුම් පද්ධතිවල යම් ආකාරයක විගණනයක් කිරීමට අපට තවමත් හැකි විය හැක. වෙනත් ඕනෑම පද්ධතියක් විගණනය කිරීම ඇත්ත වශයෙන්ම පහසු නැත.

පළමුව, යන්ත්‍ර ඉගෙනීමේ ක්‍ෂේත්‍රයේ නවීන පර්යේෂණවල එක් දිශාවක් වන්නේ යන්ත්‍ර ඉගෙනුම් පද්ධතිවල වැදගත් ක්‍රියාකාරීත්වය හඳුනා ගැනීමට ක්‍රම සෙවීමයි. එනම්, යන්ත්‍ර ඉගෙනීම (එහි වත්මන් තත්වයේ) ඉක්මනින් වෙනස් වන විද්‍යාවේ සම්පූර්ණයෙන්ම නව ක්ෂේත්‍රයකි, එබැවින් අද කළ නොහැකි දේවල් ඉක්මනින් සැබෑ විය නොහැකි යැයි නොසිතන්න. ව්යාපෘතිය OpenAI - මේ සඳහා සිත්ගන්නා උදාහරණයක්.

දෙවනුව, කෙනෙකුට පවතින පද්ධති හෝ සංවිධානවල තීරණ ගැනීමේ ක්‍රියාවලිය පරීක්‍ෂා කර තේරුම් ගත හැකිය යන අදහස න්‍යායාත්මකව යහපත් නමුත් ප්‍රායෝගිකව එසේ ය. විශාල සංවිධානයක් තුළ තීරණ ගන්නා ආකාරය තේරුම් ගැනීම පහසු නැත. විධිමත් තීරණ ගැනීමේ ක්‍රියාවලියක් තිබුණද, මිනිසුන් සැබවින්ම අන්තර් ක්‍රියා කරන ආකාරය එයින් පිළිබිඹු නොවන අතර, බොහෝ විට ඔවුන්ගේ තීරණ ගැනීම සඳහා ඔවුන්ටම තාර්කික, ක්‍රමානුකූල ප්‍රවේශයක් නොමැත. මගේ සගයා පැවසූ පරිදි විජය පාණ්ඩේ, මිනිස්සුත් කළු පෙට්ටි.

අතිච්ඡාදනය වන සමාගම් සහ ආයතන කිහිපයක පුද්ගලයින් දහසක් ගන්න, එවිට ගැටලුව වඩාත් සංකීර්ණ වේ. අභ්‍යවකාශ ෂටලය ආපසු පැමිණීමෙන් පසු බිඳී යාමට නියමිත බව අපි දනිමු, සහ NASA තුළ සිටින පුද්ගලයින්ට නරක දෙයක් සිදු විය හැකි යැයි සිතීමට හේතු වූ තොරතුරු තිබූ නමුත් පද්ධතිය සාමාන්යයෙන් මම මේක දැනගෙන හිටියේ නැහැ. නාසා ආයතනය එහි පෙර ෂටලය අහිමි වීමෙන් පසුවද එවැනිම විගණනයක් සිදු කළ අතර, ඊට සමාන හේතුවක් නිසා තවත් එකක් අහිමි විය. සංවිධාන සහ පුද්ගලයින් පරීක්ෂා කළ හැකි, තේරුම් ගත හැකි සහ වෙනස් කළ හැකි පැහැදිලි, තාර්කික නීති අනුගමනය කරන බවට තර්ක කිරීම පහසුය - නමුත් අත්දැකීම් වෙනත් ආකාරයකින් ඔප්පු කරයි. මෙය "Gosplan ගේ මායාව".

මම බොහෝ විට යන්ත්‍ර ඉගෙනීම දත්ත සමුදායන් සමඟ සංසන්දනය කරමි, විශේෂයෙන් සම්බන්ධිත ඒවා - පරිගණක විද්‍යාවේ සහ ඒ අවට ලෝකයේ හැකියාවන් වෙනස් කර ඇති, සෑම දෙයකම කොටසක් බවට පත් වූ, අප නොදැනුවත්වම නිරන්තරයෙන් භාවිතා කරන නව මූලික තාක්‍ෂණයකි. දත්ත සමුදායන් ද ගැටළු ඇති අතර ඒවා සමාන ස්වභාවයක් ඇත: පද්ධතිය නරක උපකල්පන හෝ නරක දත්ත මත ගොඩනගා ඇත, නමුත් එය දැකීමට අපහසු වනු ඇත, සහ පද්ධතිය භාවිතා කරන පුද්ගලයින් ප්‍රශ්න ඇසීමෙන් තොරව එය පවසන දේ කරනු ඇත. වරක් ඔබේ නම වැරදි ලෙස උච්චාරණය කළ බදු අය ගැන පැරණි විහිළු රාශියක් ඇති අතර, වැරැද්ද නිවැරදි කිරීමට ඔවුන්ට ඒත්තු ගැන්වීම ඔබේ නම වෙනස් කිරීමට වඩා දුෂ්කර ය. මේ ගැන සිතීමට බොහෝ ක්‍රම ඇත, නමුත් වඩා හොඳ කුමක්ද යන්න පැහැදිලි නැත: SQL හි තාක්ෂණික ගැටළුවක් ලෙසද, නැතහොත් Oracle නිකුතුවක දෝෂයක් ලෙසද, නැතහොත් නිලධාරිවාදී ආයතනවල අසාර්ථක වීමක් ලෙසද? පද්ධතියට යතුරු ලියන දෝෂ නිවැරදි කිරීමේ විශේෂාංගයක් නොමැති වීමට හේතු වූ ක්‍රියාවලියක දෝෂයක් සොයා ගැනීම කොතරම් දුෂ්කර ද? මිනිසුන් පැමිණිලි කිරීමට පෙර මෙය තේරුම් ගත හැකිද?

නැවිගේටරයේ යල් පැන ගිය දත්ත හේතුවෙන් රියදුරන් ගංගාවලට ධාවනය කරන විට කථාන්දර මගින් මෙම ගැටලුව වඩාත් සරලව විදහා දක්වයි. හරි, සිතියම් නිරන්තරයෙන් යාවත්කාලීන කළ යුතුය. නමුත් ඔබේ මෝටර් රථය මුහුදට ගසාගෙන යාම ගැන TomTom කොපමණ දොස් පැවරිය යුතුද?

මම මෙය පැවසීමට හේතුව ඔව්, යන්ත්‍ර ඉගෙනීමේ නැඹුරුව ගැටළු ඇති කරයි. නමුත් මෙම ගැටළු අප අතීතයේ මුහුණ දුන් ගැටළු වලට සමාන වනු ඇති අතර, ඒවා අතීතයේ දී අපට හැකි වූවා සේම ඒවා සැලකිල්ලට ගෙන විසඳා ගත හැකිය (හෝ නැත). එබැවින්, AI පක්ෂග්‍රාහීත්වය හානියක් සිදු කරන අවස්ථාවක් විශාල සංවිධානයක සේවය කරන ජ්‍යෙෂ්ඨ පර්යේෂකයන්ට සිදු නොවනු ඇත. බොහෝ දුරට ඉඩ ඇත, සමහර නොවැදගත් තාක්‍ෂණ කොන්ත්‍රාත්කරුවෙකු හෝ මෘදුකාංග වෙළෙන්දෙකු ඔවුන්ට නොතේරෙන විවෘත මූලාශ්‍ර සංරචක, පුස්තකාල සහ මෙවලම් භාවිතා කරමින් දණින් වැටී යමක් ලියයි. අවාසනාවන්ත සේවාදායකයා නිෂ්පාදන විස්තරයේ “කෘතිම බුද්ධිය” යන වාක්‍ය ඛණ්ඩය මිලදී ගන්නා අතර, කිසිදු ප්‍රශ්නයක් ඇසීමෙන් තොරව, එය ඔහුගේ අඩු වැටුප් ලබන සේවකයින්ට බෙදා හරිනු ඇත, AI පවසන දේ කිරීමට ඔවුන්ට නියෝග කරයි. දත්ත සමුදායන් සමඟ සිදු වූයේ මෙයයි. මෙය කෘත්‍රිම බුද්ධියේ ගැටලුවක් හෝ මෘදුකාංග ගැටලුවක් නොවේ. මෙය මානව සාධකයයි.

නිගමනය

යන්ත්‍ර ඉගෙනීමෙන් ඔබට බල්ලෙකුට ඉගැන්විය හැකි ඕනෑම දෙයක් කළ හැක - නමුත් ඔබ බල්ලාට හරියටම ඉගැන්වූයේ කුමක්දැයි ඔබට කිසිදා සහතික විය නොහැක.

"කෘතිම බුද්ධිය" යන යෙදුම බොහෝ විට එවැනි සංවාදවලට පමණක් ඇතුල් වන බව මට හැඟේ. මෙම යෙදුම ඇත්ත වශයෙන්ම අප එය නිර්මාණය කළ බවට වැරදි හැඟීමක් ලබා දෙයි - මෙම බුද්ධිය. අපි HAL9000 හෝ Skynet වෙත ගමන් කරමින් සිටින බව - ඇත්තටම එය දෙයක් අවබෝධ වෙනවා. නමුත් නැහැ. මේවා යන්ත්‍ර පමණක් වන අතර ඒවා රෙදි සෝදන යන්ත්‍රයක් සමඟ සංසන්දනය කිරීම වඩාත් නිවැරදි ය. ඇය මිනිසෙකුට වඩා හොඳින් රෙදි සෝදනවා, නමුත් ඔබ රෙදි සෝදනවා ​​වෙනුවට ඇය තුළ පිඟන් තැබුවහොත්, ඇය... ඒවා සෝදනු ඇත. පිඟන් කෝප්ප පවා පිරිසිදු වනු ඇත. නමුත් මෙය ඔබ අපේක්ෂා කළ දේ නොවනු ඇති අතර, පිඟන් සම්බන්ධයෙන් පද්ධතියට කිසියම් අගතියක් ඇති නිසා මෙය සිදු නොවේ. රෙදි සෝදන යන්ත්‍රය පිඟන් මොනවාද හෝ ඇඳුම් මොනවාදැයි නොදනී - එය ස්වයංක්‍රීයකරණයේ උදාහරණයක් පමණි, සංකල්පමය වශයෙන් පෙර ක්‍රියාවලීන් ස්වයංක්‍රීය වූ ආකාරයට වඩා වෙනස් නොවේ.

අපි මෝටර් රථ, ගුවන් යානා හෝ දත්ත සමුදායන් ගැන කතා කළත්, මෙම පද්ධති ඉතා බලවත් මෙන්ම ඉතා සීමිත වනු ඇත. ඔවුන් සම්පූර්ණයෙන්ම රඳා පවතින්නේ මිනිසුන් මෙම පද්ධති භාවිතා කරන ආකාරය, ඔවුන්ගේ අභිප්‍රාය හොඳ හෝ නරකද යන්න සහ ඔවුන් ක්‍රියා කරන ආකාරය ඔවුන් කොතරම් අවබෝධ කර ගනීද යන්න මතය.

එබැවින්, "කෘතිම බුද්ධිය ගණිතය, එබැවින් එයට පක්ෂග්රාහී විය නොහැක" යනුවෙන් පැවසීම සම්පූර්ණයෙන්ම අසත්යයකි. නමුත් යන්ත්‍ර ඉගෙනීම “ස්වභාවයෙන් ආත්මීය” යැයි පැවසීමද ඒ හා සමානව අසත්‍යයකි. යන්ත්‍ර ඉගෙනීම දත්තවල රටා සොයා ගන්නා අතර එය සොයා ගන්නා රටා දත්ත මත රඳා පවතින අතර දත්ත අප මත රඳා පවතී. හරියට අපි ඔවුන් සමඟ කරන දේ වගේ. යන්ත්‍ර ඉගෙනීම සමහර දේවල් අපට කළ හැකි දේට වඩා හොඳින් සිදු කරයි - නමුත් නිදසුනක් වශයෙන්, සුනඛයන් මත්ද්‍රව්‍ය හඳුනාගැනීමේදී මිනිසුන්ට වඩා බෙහෙවින් ඵලදායී වේ, එය ඔවුන් සාක්ෂිකරුවන් ලෙස භාවිතා කිරීමට සහ ඔවුන්ගේ සාක්ෂි මත පදනම්ව විනිශ්චය කිරීමට හේතුවක් නොවේ. ඒ වගේම බල්ලන්, ඕනෑම යන්ත්‍ර ඉගෙනුම් පද්ධතියකට වඩා දක්ෂයි.

පරිවර්තනය: ඩයනා ලෙට්ස්කායා.
සංස්කරණය: ඇලෙක්සි ඉවානොව්.
ප්රජාව: @PonchikNews.

මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න