Pravni postupci protiv Microsofta i OpenAI vezani za generator koda GitHub Copilot

Programer tipografije otvorenog koda Matthew Butterick i Joseph Saveri Law Firm podneli su tužbu (PDF) protiv proizvođača tehnologije koja se koristi u GitHub-ovom Copilot servisu. Optuženi su Microsoft, GitHub i kompanije koje nadgledaju projekat OpenAI, koji je proizveo model generisanja OpenAI Codex koda koji je u osnovi GitHub Copilot-a. Postupkom se pokušava uključiti sud u utvrđivanje zakonitosti kreiranja usluga kao što je GitHub Copilot i utvrđivanje da li takve usluge krše prava drugih programera.

Aktivnosti optuženih su upoređene sa stvaranjem nove vrste softverske piraterije, zasnovane na manipulaciji postojećim kodom koristeći tehnike mašinskog učenja i omogućavajući im da imaju koristi od rada drugih ljudi. Kreiranje Copilot-a se takođe smatra uvođenjem novog mehanizma za monetizaciju rada programera otvorenog koda, uprkos činjenici da je GitHub ranije obećao da to nikada neće učiniti.

Stav tužitelja se svodi na činjenicu da se rezultat generisanja koda od strane sistema mašinskog učenja obučenog na javno dostupnim izvornim tekstovima ne može tumačiti kao suštinski nov i nezavisan rad, jer je posledica algoritama obrade već postojećeg koda. Prema tužiocima, Copilot samo reprodukuje kod koji ima direktne reference na postojeći kod u javnim repozitorijumima, a takve manipulacije ne potpadaju pod kriterijum poštenog korišćenja. Drugim riječima, sintezu koda u GitHub Copilot-u tužitelji smatraju stvaranjem izvedenog djela iz postojećeg koda, distribuiranog pod određenim licencama i sa određenim autorima.

Konkretno, kada se obučava sistem Copilot, koristi se kod koji se distribuira pod otvorenim licencama, u većini slučajeva koji zahtijevaju napomenu o autorstvu (atribucija). Ovaj zahtjev nije ispunjen prilikom generiranja rezultirajućeg koda, što je jasno kršenje većine licenci otvorenog koda kao što su GPL, MIT i Apache. Osim toga, Copilot krši GitHub-ove vlastite uvjete usluge i privatnosti, nije u skladu sa DMCA, koji zabranjuje uklanjanje informacija o autorskim pravima, i CCPA (Kalifornijski zakon o privatnosti potrošača), koji reguliše rukovanje ličnim podacima.

U tekstu tužbe dat je okvirni izračun štete nanesene zajednici kao rezultat aktivnosti Copilot-a. U skladu sa članom 1202 Zakona o digitalnom milenijumu o autorskim pravima (DMCA), minimalna šteta je 2500 USD po kršenju. Uzimajući u obzir činjenicu da Copilot servis ima 1.2 miliona korisnika i svaki put kada se usluga koristi, dođe do tri kršenja DMCA (atribucija, autorska prava i uslovi licence), minimalni iznos ukupne štete procjenjuje se na 9 milijardi dolara (1200000*3 * 2500 dolara).

Organizacija za ljudska prava Software Freedom Conservancy (SFC), koja je ranije kritikovala GitHub i Copilot, prokomentarisala je tužbu preporukom da se ne odstupa od jednog od svojih ranije navedenih principa kada se štite interesi zajednice – „sprovođenje orijentisano na zajednicu treba ne davati prioritet finansijskoj dobiti.” Prema SFC-u, radnje Copilota su neprihvatljive prvenstveno zato što potkopavaju mehanizam copyleft-a, koji ima za cilj pružanje jednakih prava korisnicima, programerima i potrošačima. Mnogi projekti obuhvaćeni Copilot-om se distribuiraju pod licencama copyleft-a, kao što je GPL, koji zahtijevaju da se kod izvedenih djela distribuira pod kompatibilnom licencom. Umetanjem postojećeg koda kako je predložio Copilot, programeri mogu nesvjesno prekršiti licencu projekta iz kojeg je kod posuđen.

Podsjetimo, GitHub je u ljeto lansirao novu komercijalnu uslugu GitHub Copilot, obučenu za niz izvornih tekstova objavljenih u javnim GitHub repozitorijumima i sposobnu da generiše standardne dizajne prilikom pisanja koda. Servis može generirati prilično složene i velike blokove koda, sve do gotovih funkcija koje mogu ponavljati tekstualne pasuse iz postojećih projekata. Prema GitHub-u, sistem pokušava da rekreira strukturu koda radije nego da kopira sam kod, međutim, u otprilike 1% slučajeva, predložena preporuka može uključivati ​​isječke koda postojećih projekata koji su duži od 150 znakova. Kako bi spriječio zamjenu postojećeg koda, Copilot ima ugrađeni filter koji provjerava ukrštanje s projektima koji se nalaze na GitHubu, ali se ovaj filter aktivira prema nahođenju korisnika.

Dva dana prije podnošenja tužbe, GitHub je najavio svoju namjeru da implementira funkciju 2023. koja bi omogućila praćenje odnosa između fragmenata generiranih u Copilot-u i postojećeg koda u spremištima. Programeri će moći da vide listu sličnog koda koji je već prisutan u javnim repozitorijumima, kao i da sortiraju raskrsnice prema licenci koda i vremenu modifikacije.

izvor: opennet.ru

Dodajte komentar