Sudski spor protiv Microsofta i OpenAI-ja u vezi s generatorom koda GitHub Copilot

Programer tipografije otvorenog koda Matthew Butterick i odvjetničko društvo Joseph Saveri podnijeli su tužbu (PDF) protiv kreatora tehnologije koja se koristi u GitHubovoj usluzi Copilot. Optuženi uključuju Microsoft, GitHub i tvrtke koje nadziru projekt OpenAI, koji je proizveo model generiranja koda OpenAI Codex koji je temelj GitHub Copilota. Postupkom se pokušava uključiti sud u utvrđivanje zakonitosti stvaranja usluga kao što je GitHub Copilot i utvrđivanje krše li te usluge prava drugih programera.

Aktivnosti optuženih uspoređene su sa stvaranjem nove vrste softverskog piratstva, temeljenog na manipulaciji postojećim kodom pomoću tehnika strojnog učenja i dopuštajući im da imaju koristi od rada drugih ljudi. Stvaranje Copilota također se smatra uvođenjem novog mehanizma za unovčavanje rada programera otvorenog koda, unatoč činjenici da je GitHub prethodno obećao da to nikada neće učiniti.

Stav tužitelja svodi se na činjenicu da se rezultat generiranja koda od strane sustava strojnog učenja obučenog na javno dostupnim izvornim tekstovima ne može tumačiti kao temeljno nov i neovisan rad, budući da je posljedica algoritama koji obrađuju već postojeći kod. Prema tužiteljima, Copilot samo reproducira kod koji ima izravne reference na postojeći kod u javnim spremištima, a takve manipulacije ne potpadaju pod kriterij poštene upotrebe. Drugim riječima, sintezu koda u GitHub Copilot-u tužitelji smatraju stvaranjem izvedenog rada iz postojećeg koda, koji se distribuira pod određenim licencama i ima određene autore.

Konkretno, pri obuci sustava Copilot koristi se kod koji se distribuira pod otvorenim licencama, u većini slučajeva zahtijevajući naznaku autorstva (atribuciju). Ovaj zahtjev nije ispunjen prilikom generiranja rezultirajućeg koda, što je jasno kršenje većine licenci otvorenog koda kao što su GPL, MIT i Apache. Osim toga, Copilot krši GitHubove vlastite uvjete pružanja usluge i privatnosti, nije u skladu s DMCA, koji zabranjuje uklanjanje informacija o autorskim pravima, i CCPA (California Consumer Privacy Act), koji regulira rukovanje osobnim podacima.

U tekstu tužbe daje se približan izračun štete nanesene zajednici kao rezultat aktivnosti Copilota. U skladu s Odjeljkom 1202 Zakona o autorskim pravima u digitalnom tisućljeću (DMCA), minimalna odšteta iznosi 2500 USD po kršenju. Uzimajući u obzir činjenicu da usluga Copilot ima 1.2 milijuna korisnika te da se pri svakom korištenju usluge dogodi tri kršenja DMCA (atribucija, autorska prava i uvjeti licence), minimalni iznos ukupne štete procjenjuje se na 9 milijardi dolara (1200000 * 3 * 2500 dolara).

Organizacija za zaštitu ljudskih prava Software Freedom Conservancy (SFC), koja je ranije kritizirala GitHub i Copilot, komentirala je tužbu preporukom da ne odstupi od jednog od svojih prethodno navedenih načela kada štiti interese zajednice - "provedba usmjerena na zajednicu treba ne daj prednost financijskoj dobiti.” Prema SFC-u, postupci Copilota su neprihvatljivi prije svega jer potkopavaju mehanizam copylefta, čiji je cilj pružanje jednakih prava korisnicima, programerima i potrošačima. Mnogi projekti obuhvaćeni Copilotom distribuiraju se pod licencama za kopiranje, kao što je GPL, koje zahtijevaju distribuciju koda izvedenih radova pod kompatibilnom licencom. Umetanjem postojećeg koda kako je predložio Copilot, programeri mogu nesvjesno prekršiti licencu projekta iz kojeg je kod posuđen.

Podsjetimo, GitHub je u ljeto pokrenuo novu komercijalnu uslugu, GitHub Copilot, obučenu na nizu izvornih tekstova objavljenih u javnim GitHub repozitorijima, te sposobnu generirati standardni dizajn prilikom pisanja koda. Usluga može generirati prilično složene i velike blokove koda, sve do gotovih funkcija koje mogu ponavljati odlomke teksta iz postojećih projekata. Prema GitHubu, sustav pokušava ponovno stvoriti strukturu koda, a ne kopirati sam kod, međutim, u približno 1% slučajeva, predložena preporuka može uključivati ​​isječke koda postojećih projekata koji su duži od 150 znakova. Kako bi spriječio zamjenu postojećeg koda, Copilot ima ugrađeni filtar koji provjerava sjecišta s projektima koji se nalaze na GitHubu, ali se ovaj filtar aktivira prema nahođenju korisnika.

Dva dana prije podnošenja tužbe, GitHub je objavio svoju namjeru da 2023. godine implementira značajku koja bi omogućila praćenje odnosa između fragmenata generiranih u Copilotu i postojećeg koda u spremištima. Programeri će moći vidjeti popis sličnog koda koji je već prisutan u javnim spremištima, kao i sortirati sjecišta prema licenci koda i vremenu izmjene.

Izvor: opennet.ru

Dodajte komentar