Microsoft eta OpenAIren aurkako prozedura juridikoak GitHub Copilot kode-sorgailuarekin lotuta

Matthew Butterick kode irekiko tipografia garatzaileak eta Joseph Saveri Abokatu Bulegoak auzi bat aurkeztu dute (PDF) GitHub-en Copilot zerbitzuan erabiltzen den teknologiaren arduradunen aurka. Akusatuen artean daude Microsoft, GitHub eta OpenAI proiektua gainbegiratzen duten enpresak, GitHub Copilot oinarrian dagoen OpenAI Codex kodea sortzeko eredua sortu zutenak. Prozedurak epaileak parte hartzen saiatzen da GitHub Copilot bezalako zerbitzuak sortzearen legezkotasuna zehazten eta zerbitzu horiek beste garatzaileen eskubideak urratzen dituzten ala ez zehazten.

Auzipetuen jarduera software-pirateria mota berri baten sorrerarekin alderatu da, lehendik dagoen kodearen manipulazioan oinarritutako ikaskuntza automatikoko teknikak erabiliz eta beste pertsonen lanari etekina ateratzeko aukera emanez. Copilot sortzea ere kode irekiko software garatzaileen lana dirua irabazteko mekanismo berri baten sarrera gisa ikusten da, nahiz eta GitHub-ek inoiz ez zuela egingo agindua eman.

Auzi-jartzaileen jarrera zera da: jendaurrean eskuragarri dauden iturburu-testuetan trebatutako ikaskuntza automatikoko sistema batek kodea sortzearen emaitza ezin dela interpretatu funtsean lan berri eta independente gisa, lehendik dagoen kodea prozesatzen duten algoritmoen ondorioa baita. Salatzaileen arabera, Copilot-ek biltegi publikoetan dagoen kodeari erreferentzia zuzenak dituen kodea baino ez du erreproduzitzen, eta manipulazio horiek ez dira bidezko erabileraren irizpideetan sartzen. Beste era batera esanda, GitHub Copilot-en kode-sintesia lehendik dagoen kodetik lan eratorri bat sortzea dela uste dute demandatzaileek, lizentzia jakin batzuekin banatuta eta egile zehatzak dituena.

Bereziki, Copilot sistema entrenatzerakoan, lizentzia irekien arabera banatzen den kodea erabiltzen da, kasu gehienetan egiletza (esleipena) jakinaraztea eskatzen duena. Baldintza hori ez da betetzen ondoriozko kodea sortzean, hau da, GPL, MIT eta Apache bezalako kode irekiko lizentzia gehienen urraketa argia. Horrez gain, Copilot-ek GitHub-en zerbitzu-baldintzak eta pribatutasuna urratzen ditu, ez ditu betetzen copyright-informazioa kentzea debekatzen duen DMCA eta datu pertsonalen tratamendua arautzen duen CCPA (California Consumer Privacy Act).

Auziaren testuak Copiloten jardueren ondorioz komunitateari eragindako kalteen gutxi gorabeherako kalkulua ematen du. Digital Millennium Copyright Act (DMCA) 1202. artikuluaren arabera, gutxieneko kalteak 2500 $ dira arau-hauste bakoitzeko. Copilot zerbitzuak 1.2 milioi erabiltzaile dituela eta zerbitzua erabiltzen den bakoitzean hiru DMCA urraketa gertatzen direla kontuan hartuta (esleipena, copyright eta lizentzia-baldintzak), kalte osoaren gutxieneko zenbatekoa 9 milioi dolar (1200000 * 3) dela kalkulatzen da. * 2500 $).

Software Freedom Conservancy (SFC) giza eskubideen erakundeak, aurretik GitHub eta Copilot kritikatu dituenak, auzia komentatu zuen komunitatearen interesak babestean aldez aurretik adierazitako printzipioetako batetik ez desbideratzeko gomendio batekin - "komunitatera zuzendutako betearazpenak behar luke. ez lehenetsi irabazi ekonomikoakΒ». SFCren arabera, Copiloten ekintzak onartezinak dira, batez ere, copyleft mekanismoa ahultzen dutelako, erabiltzaileei, garatzaileei eta kontsumitzaileei eskubide berdintasuna eskaintzera zuzenduta. Copilot-en biltzen diren proiektu asko copyleft lizentzien bidez banatzen dira, hala nola GPL, lan eratorrien kodea lizentzia bateragarri baten arabera banatzea eskatzen baitute. Copilotek iradokitako lehendik dagoen kodea txertatuz, garatzaileek nahi gabe urra dezakete kodea mailegatu zen proiektuaren lizentzia.

Gogora dezagun udan GitHub-ek zerbitzu komertzial berri bat abiarazi zuela, GitHub Copilot, GitHub-eko biltegi publikoetan argitaratutako iturri-testu sorta batean trebatua eta kodea idaztean diseinu estandarrak sortzeko gai dena. Zerbitzuak kode bloke nahiko konplexuak eta handiak sor ditzake, lehendik dauden proiektuetako testu-pasarteak errepika ditzaketen prest dauden funtzioetaraino. GitHub-en arabera, sistema kodearen egitura birsortzen saiatzen da kodea bera kopiatu beharrean; hala ere, kasuen %1 gutxi gorabehera, proposatutako gomendioak 150 karaktere baino gehiago dituzten proiektuen kode zatiak izan ditzake. Lehendik dagoen kodea ordezkatzea ekiditeko, Copilot-ek iragazkia integratua du GitHub-en ostatatutako proiektuekin elkarguneak egiaztatzen dituena, baina iragazkia erabiltzailearen erabakian aktibatzen da.

Auzia aurkeztu baino bi egun lehenago, GitHub-ek 2023an Copilot-en sortutako zatien eta biltegietan dagoen kodearen arteko erlazioaren jarraipena ahalbidetuko zuen funtzio bat ezartzeko asmoa iragarri zuen. Garatzaileek biltegi publikoetan lehendik dauden antzeko kodeen zerrenda ikusi ahal izango dute, baita elkarguneak kode lizentziaren eta aldaketa-orduaren arabera ordenatu ere.

Iturria: opennet.ru

Gehitu iruzkin berria