Mradi Debian ilianza kupiga kura ya jumla kuhusu vigezo vya uwazi wa mifumo ya akili bandia (AI)

Mradi Debian ilitangaza kura ya azimio la jumla (GR) miongoni mwa wasanidi programu wa mradi ili kuidhinisha vigezo vya kukubali mifumo ya kujifunza kwa mashine katika hazina kuu ya mradi. Awamu ya majadiliano sasa imeanza, ambapo kura zitaanza kukusanywa (tarehe ya kuanza kwa kura bado haijabainishwa). Takriban wasanidi programu 1,000 wanaohusika katika kutunza vifurushi na miundombinu wanastahili kupiga kura. Debian.

Mifumo ya akili bandia (AI) inayosambazwa chini ya leseni wazi, lakini bila kutoa nyenzo chanzo na zana za kufunza mfumo huo, inapendekezwa kutambuliwa kama isiyoendana na vigezo. Debian, kufafanua programu huru (DFSG, Debian Mwongozo wa Programu Bila Malipo). Ikiwa pendekezo litaidhinishwa, mifumo kama hiyo haitaweza kujumuishwa katika hazina kuu ya mradi. Uwezekano wa kuwasilisha mifumo kama hiyo kwenye hazina zisizo za bure hauzingatiwi katika mchakato wa sasa wa upigaji kura.

Miongoni mwa shida zinazotokea wakati data haipatikani kwa mafunzo, yafuatayo yanatajwa:

  • Ukosefu wa data ya chanzo au programu zinazotumiwa kwa mafunzo hupunguza sana uwezo wa kurekebisha mifano ya AI iliyotengenezwa tayari. Ingawa urekebishaji unaruhusiwa katika leseni, kiutendaji urekebishaji kama huo ni mgumu. Mabadiliko yanaweza kuhitajika, kwa mfano, ikiwa tokenizer inahitaji kubadilishwa ili kuongeza usaidizi kwa lugha mpya.
  • Data inayotumika kwa mafunzo inaweza kufasiriwa kama "msimbo wa chanzo" wa modeli, na modeli iliyokamilishwa kama matokeo ya kuchakata "msimbo wa chanzo" huu na zana ya mafunzo. Ipasavyo, kwa marekebisho kamili ya mfano, lazima iweze kurekebisha data na zana za awali.
  • Haiwezekani kuzalisha kazi iliyofanywa ili kuunda mfano bila upatikanaji wa data na zana za awali.
  • Masuala ya usalama na maadili. Bila data na zana chanzo, uwezo wa kurekebisha udhaifu katika miundo ni mdogo kwa kutumia viraka vya jozi au kubadilisha kabisa muundo. Mwandishi tu wa mfano anaweza kuandaa patches vile, na watumiaji wa mfano kuwa tegemezi kabisa juu yake. Wakati huo huo, hakuna mtu, ikiwa ni pamoja na waandishi wa mfano, anayeweza kuelewa kiini cha mabadiliko yaliyopendekezwa kwa njia hii. Ukosefu wa data ya chanzo pia hufanya iwe vigumu kugundua viingilio vya mlango wa nyuma katika miundo ya kujifunza ya mashine.
  • Mapungufu ya masomo. Bila data asilia, haiwezekani kuthibitisha kwamba modeli hiyo ilifunzwa juu ya data iliyotolewa chini ya leseni zinazoruhusu matumizi hayo, au kukataa kwamba data iliyopatikana kinyume cha sheria haikutumiwa katika mafunzo. Zaidi ya hayo, ikiwa data iliyoidhinishwa na GPL ilitumika wakati wa mafunzo, inaweza kuhitajika kuchanganua ikiwa matokeo ya muundo huo yana vipande vilivyo na nakala ya data hii, ambayo yanahitaji rejeleo la chanzo na leseni. Msanidi programu anaweza kuongeza msimbo/maudhui yanayotokana na muundo kwenye mradi wake na kukiuka leseni ya baadhi ya data chanzo bila kukusudia.

Oktoba iliyopita, Mpango wa Open Source (OSI) ulichapisha ufafanuzi wa mfumo huria wa AI. Mfumo wa AI wazi unapaswa kutoa uwezo wafuatayo: kutumia kwa madhumuni yoyote bila ya haja ya kupata ruhusa tofauti; kusoma uendeshaji wa mfumo na kukagua vipengele vyake; kufanya mabadiliko kwa madhumuni yoyote; kuhamisha kwa watu wengine toleo la asili na toleo lililosahihishwa baada ya mabadiliko kufanywa, bila kuweka kikomo madhumuni ya matumizi. Mfumo wazi wa AI lazima ujumuishe maelezo ya kina kuhusu usanifu wa kielelezo, data inayotumika kwa mafunzo, na mbinu ya mafunzo, pamoja na msimbo wa chanzo wa kuendesha na kufunza mfumo wa AI. Taarifa inapaswa kutosha kwa msanidi programu kuweza kuunda upya mfumo sawa wa AI peke yake, kwa kutumia data sawa au sawa kwa mafunzo.

Uhifadhi wa Uhuru wa Programu (SFC) umekosoa ufafanuzi huu. Kutoridhika kunasababishwa na ukweli kwamba vigezo hazihitaji utoaji wa data kutumika kufundisha mfano. Ufafanuzi wa OSI unahitaji tu kwamba maelezo ya data ya mafunzo itolewe, si data ya mafunzo yenyewe. Ufafanuzi unaokubalika unahakikisha uhuru mbili tu kati ya nne zilizotajwa za Open Source - haki ya kutumia na haki ya kusambaza, huku haki za kurekebisha na kusoma hazijahakikishwa kikamilifu.

Uamuzi wa OSI unafafanuliwa na ukweli kwamba uchapishaji wa data asili katika hali nyingi hauwezekani kwa sababu zilizo nje ya udhibiti wa msanidi wa muundo wa AI, kama vile hitaji la kudumisha usiri, utumiaji wa nyenzo zilizo na hakimiliki, kutoa leseni ya data kutoka kwa watoa huduma wengine, n.k. Ikiwa hitaji la utoaji wa data liliongezwa, hakuna miundo mikubwa ya lugha iliyopo ingezingatiwa kuwa wazi, na ufafanuzi yenyewe.

Chanzo: opennet.ru

Nunua upangishaji wa kuaminika wa tovuti zilizo na ulinzi wa DDoS, seva za VPS VDS 🔥 Nunua upangishaji wa tovuti unaoaminika kwa ulinzi wa DDoS, seva za VPS VDS | ProHoster