Kesi za kisheria dhidi ya Microsoft na OpenAI zinazohusiana na jenereta ya nambari ya GitHub Copilot

Msanidi programu wa uchapaji wa chanzo huria Matthew Butterick na Kampuni ya Sheria ya Joseph Saveri wamewasilisha kesi (PDF) dhidi ya waundaji wa teknolojia inayotumiwa katika huduma ya GitHub's Copilot. Washtakiwa ni pamoja na Microsoft, GitHub na kampuni zinazosimamia mradi wa OpenAI, ambao ulitoa modeli ya kuunda msimbo wa OpenAI Codex ambayo msingi wa GitHub Copilot. Kesi inajaribu kuhusisha mahakama katika kubaini uhalali wa kuunda huduma kama vile GitHub Copilot na kubaini kama huduma kama hizo zinakiuka haki za wasanidi programu wengine.

Shughuli za washtakiwa zimelinganishwa na uundaji wa aina mpya ya uharamia wa programu, kulingana na uchakachuaji wa kanuni zilizopo kwa kutumia mbinu za kujifunza mashine na kuwaruhusu kufaidika na kazi za watu wengine. Kuundwa kwa Copilot pia kunaonekana kama kuanzishwa kwa utaratibu mpya wa kuchuma mapato kwa kazi ya watengenezaji wa programu huria, licha ya ukweli kwamba GitHub ilikuwa imeahidi hapo awali kutofanya hivi.

Msimamo wa walalamikaji unatokana na ukweli kwamba matokeo ya kuzalisha msimbo kwa mfumo wa mashine ya kujifunza yaliyofunzwa kwenye maandishi chanzo yanayopatikana hadharani hayawezi kufasiriwa kuwa kazi mpya na huru, kwa kuwa ni matokeo ya algorithms kuchakata misimbo iliyopo tayari. Kulingana na walalamikaji, Copilot hutoa tena msimbo ambao una marejeleo ya moja kwa moja ya msimbo uliopo kwenye hazina za umma, na ghiliba kama hizo hazianguki chini ya vigezo vya matumizi ya haki. Kwa maneno mengine, usanisi wa msimbo katika GitHub Copilot huzingatiwa na walalamikaji kama uundaji wa kazi inayotokana na msimbo uliopo, inayosambazwa chini ya leseni fulani na kuwa na waandishi mahususi.

Hasa, wakati wa kufundisha mfumo wa Copilot, kanuni hutumiwa ambayo inasambazwa chini ya leseni wazi, katika hali nyingi zinahitaji taarifa ya uandishi (attribution). Sharti hili halifikiwi wakati wa kuunda nambari inayotokana, ambayo ni ukiukaji wa wazi wa leseni nyingi za programu huria kama vile GPL, MIT na Apache. Kwa kuongezea, Copilot inakiuka sheria na masharti ya huduma na faragha ya GitHub, haitii DMCA, ambayo inakataza uondoaji wa maelezo ya hakimiliki, na CCPA (Sheria ya Faragha ya Watumiaji ya California), ambayo inadhibiti ushughulikiaji wa data ya kibinafsi.

Maandishi ya kesi yanatoa hesabu ya takriban ya uharibifu uliosababishwa kwa jamii kutokana na shughuli za Copilot. Kwa mujibu wa Kifungu cha 1202 cha Sheria ya Milenia ya Hakimiliki Dijiti (DMCA), malipo ya chini zaidi ni $2500 kwa kila ukiukaji. Kwa kuzingatia ukweli kwamba huduma ya Copilot ina watumiaji milioni 1.2 na kila wakati huduma inatumiwa, ukiukaji tatu wa DMCA hutokea (masharti, hakimiliki na masharti ya leseni), kiwango cha chini cha uharibifu wa jumla kinakadiriwa kuwa dola bilioni 9 (1200000 * 3). * $2500).

Shirika la haki za binadamu la Software Freedom Conservancy (SFC), ambalo hapo awali lilikosoa GitHub na Copilot, lilitoa maoni kuhusu kesi hiyo kwa pendekezo la kutokengeuka kutoka kwa mojawapo ya kanuni zake zilizotajwa hapo awali wakati wa kulinda maslahi ya jumuiya - "utekelezaji unaozingatia jamii unapaswa sio kutanguliza faida ya kifedha." Kulingana na SFC, vitendo vya Copilot havikubaliki kimsingi kwa sababu vinadhoofisha utaratibu wa kutoa nakala, unaolenga kutoa haki sawa kwa watumiaji, wasanidi programu na watumiaji. Miradi mingi inayoshughulikiwa katika Copilot inasambazwa chini ya leseni za nakala, kama vile GPL, ambayo inahitaji msimbo wa kazi zinazotokana na kazi kusambazwa chini ya leseni inayolingana. Kwa kuingiza msimbo uliopo kama ilivyopendekezwa na Copilot, wasanidi programu wanaweza kukiuka leseni ya mradi ambao msimbo huo ulikopwa bila kukusudia.

Tukumbuke kwamba katika majira ya kiangazi GitHub ilizindua huduma mpya ya kibiashara, GitHub Copilot, iliyofunzwa safu ya maandishi chanzo yaliyotumwa kwenye hazina za umma za GitHub, na yenye uwezo wa kutoa miundo ya kawaida wakati wa kuandika msimbo. Huduma inaweza kutoa vizuizi ngumu na vikubwa vya nambari, hadi vitendaji vilivyotengenezwa tayari ambavyo vinaweza kurudia vifungu vya maandishi kutoka kwa miradi iliyopo. Kulingana na GitHub, mfumo unajaribu kuunda tena muundo wa nambari badala ya kunakili nambari yenyewe, hata hivyo, katika takriban 1% ya visa, pendekezo lililopendekezwa linaweza kujumuisha vijisehemu vya msimbo wa miradi iliyopo ambayo ina urefu wa zaidi ya herufi 150. Ili kuzuia uingizwaji wa msimbo uliopo, Copilot ana kichujio kilichojengewa ndani ambacho hukagua makutano na miradi iliyopangishwa kwenye GitHub, lakini kichujio hiki huwashwa kwa hiari ya mtumiaji.

Siku mbili kabla ya kesi hiyo kuwasilishwa, GitHub ilitangaza nia yake ya kutekeleza kipengele mnamo 2023 ambacho kingeruhusu ufuatiliaji wa uhusiano kati ya vipande vilivyotengenezwa katika Copilot na nambari iliyopo kwenye hazina. Wasanidi programu wataweza kuona orodha ya msimbo sawa ambao tayari upo katika hazina za umma, na pia kupanga makutano kwa leseni ya msimbo na wakati wa marekebisho.

Chanzo: opennet.ru

Kuongeza maoni