Tiesvedība pret Microsoft un OpenAI saistībā ar GitHub Copilot kodu ģeneratoru

Atvērtā koda tipogrāfijas izstrādātājs Metjū Batiriks un Džozefa Saveri advokātu birojs ir iesnieguši tiesā prasību (PDF) pret GitHub Copilot pakalpojumā izmantotās tehnoloģijas veidotājiem. Apsūdzēto vidū ir Microsoft, GitHub un uzņēmumi, kas pārrauga OpenAI projektu, kas izstrādāja OpenAI Codex koda ģenerēšanas modeli, kas ir GitHub Copilot pamatā. Tiesvedībā mēģināts iesaistīt tiesu, lai noteiktu tādu pakalpojumu kā GitHub Copilot izveides likumību un noteiktu, vai šādi pakalpojumi pārkāpj citu izstrādātāju tiesības.

Apsūdzēto darbības ir salīdzinātas ar jauna veida programmatūras pirātisma izveidi, kuras pamatā ir manipulācijas ar esošo kodu, izmantojot mašīnmācīšanās metodes un ļaujot viņiem gūt labumu no citu cilvēku darba. Copilot izveide tiek uzskatīta arī par jauna mehānisma ieviešanu atvērtā pirmkoda programmatūras izstrādātāju darba monetizācijai, neskatoties uz to, ka GitHub iepriekš bija solījis to nekad nedarīt.

Prasītāju nostāja ir saistīta ar to, ka koda ģenerēšanas rezultāts ar mašīnmācīšanās sistēmu, kas apmācīta uz publiski pieejamiem avota tekstiem, nevar tikt interpretēta kā principiāli jauns un patstāvīgs darbs, jo tas ir jau esošā koda apstrādes algoritmu rezultāts. Pēc prasītāju domām, Copilot reproducē tikai kodu, kuram ir tiešas atsauces uz esošo kodu publiskajos krātuvēs, un šādas manipulācijas neietilpst godīgas lietošanas kritērijos. Citiem vārdiem sakot, koda sintēzi GitHub Copilot prasītāji uzskata par atvasināta darba izveidi no esoša koda, kas tiek izplatīts saskaņā ar noteiktām licencēm un kam ir noteikti autori.

Jo īpaši, apmācot sistēmu Copilot, tiek izmantots kods, kas tiek izplatīts saskaņā ar atklātām licencēm, un vairumā gadījumu ir nepieciešams paziņojums par autorību (attiecinājums). Šī prasība netiek izpildīta, ģenerējot iegūto kodu, kas ir acīmredzams vairuma atvērtā pirmkoda licenču, piemēram, GPL, MIT un Apache, pārkāpums. Turklāt Copilot pārkāpj paša GitHub pakalpojumu sniegšanas un privātuma noteikumus, neievēro DMCA, kas aizliedz noņemt informāciju par autortiesībām, un CCPA (California Consumer Privacy Act), kas regulē personas datu apstrādi.

Prasības tekstā sniegts aptuvens aprēķins par Copilota darbību rezultātā sabiedrībai nodarīto kaitējumu. Saskaņā ar Digitālās tūkstošgades autortiesību likuma (DMCA) 1202. sadaļu minimālie zaudējumi ir 2500 ASV dolāru par katru pārkāpumu. Ņemot vērā to, ka pakalpojumam Copilot ir 1.2 miljoni lietotāju un katru reizi, kad pakalpojums tiek izmantots, tiek konstatēti trīs DMCA pārkāpumi (attiecinājums, autortiesības un licences noteikumi), minimālā kopējā kaitējuma summa tiek lēsta 9 miljardu dolāru (1200000 3 2500 * XNUMX) apmērā. * XNUMX USD).

Cilvēktiesību organizācija Software Freedom Conservancy (SFC), kas iepriekš ir kritizējusi GitHub un Copilot, komentēja prasību tiesā ar ieteikumu neatkāpties no viena no saviem iepriekš paustajiem principiem, aizsargājot kopienas intereses - "uz sabiedrību vērstai izpildei vajadzētu nepiešķirt prioritāti finansiālam ieguvumam. Saskaņā ar SFC teikto, Copilot darbības ir nepieņemamas galvenokārt tāpēc, ka tās grauj copyleft mehānismu, kura mērķis ir nodrošināt vienlīdzīgas tiesības lietotājiem, izstrādātājiem un patērētājiem. Daudzi no Copilot aptvertajiem projektiem tiek izplatīti saskaņā ar copyleft licencēm, piemēram, GPL, kas prasa, lai atvasinātu darbu kods tiktu izplatīts saskaņā ar saderīgu licenci. Ievietojot esošo kodu, kā ieteica Copilot, izstrādātāji var netīši pārkāpt tā projekta licenci, no kura kods tika aizgūts.

Atcerēsimies, ka vasarā GitHub atklāja jaunu komerciālu pakalpojumu GitHub Copilot, kas apmācīts publiskajās GitHub krātuvēs ievietoto avota tekstu masīvā un spēj ģenerēt standarta dizainus, rakstot kodu. Pakalpojums var ģenerēt diezgan sarežģītus un lielus koda blokus, līdz pat gatavām funkcijām, kas var atkārtot teksta fragmentus no esošajiem projektiem. Saskaņā ar GitHub teikto, sistēma mēģina no jauna izveidot koda struktūru, nevis kopēt pašu kodu, tomēr aptuveni 1% gadījumu ierosinātajā ieteikumā var būt iekļauti esošo projektu koda fragmenti, kas ir garāki par 150 rakstzīmēm. Lai novērstu esošā koda aizstāšanu, Copilot ir iebūvēts filtrs, kas pārbauda krustojumus ar GitHub mitinātiem projektiem, taču šis filtrs tiek aktivizēts pēc lietotāja ieskatiem.

Divas dienas pirms tiesas prāvas iesniegšanas GitHub paziņoja par nodomu 2023. gadā ieviest funkciju, kas ļautu izsekot attiecībām starp Copilot ģenerētajiem fragmentiem un krātuvēs esošo kodu. Izstrādātāji varēs apskatīt līdzīgu kodu sarakstu, kas jau atrodas publiskajos krātuvēs, kā arī kārtot krustojumus pēc koda licences un modifikācijas laika.

Avots: opennet.ru

Pievieno komentāru