GitHub Copiloti koodigeneraatoriga seotud kohtuvaidlus Microsofti ja OpenAI vastu

Avatud lähtekoodiga tüpograafia arendaja Matthew Butterick ja Joseph Saveri advokaadibüroo on esitanud GitHub Copiloti teenuses kasutatavate tehnoloogiamüüjate vastu hagi (PDF). Vastajate hulka kuuluvad Microsoft, GitHub ja OpenAI projekti taga olevad ettevõtted, mis koostasid OpenAI Codexi koodi genereerimise mudeli, mis on GitHub Copiloti aluseks. Menetluse käigus püüti kohut kaasata GitHub Copiloti laadsete teenuste loomise seaduslikkuse väljaselgitamisse ning välja selgitama, kas sellised teenused rikuvad teiste arendajate õigusi.

Süüdistatavate tegevust võrreldakse uut tüüpi tarkvarapiraatluse loomisega, mis põhineb masinõppemeetodite abil olemasoleva koodiga manipuleerimisel ja võimaldab kasu saada teiste inimeste tööst. Copiloti loomist nähakse ka kui uue mehhanismi kasutuselevõttu avatud lähtekoodiga arendajate töö monetiseerimiseks, hoolimata sellest, et GitHub lubas varem seda mitte kunagi teha.

Hagejate seisukoht on, et avalikult kättesaadavatel lähtetekstidel koolitatud masinõppesüsteemiga koodi genereerimise tulemust ei saa tõlgendada põhimõtteliselt uue ja iseseisva tööna, kuna tegemist on olemasoleva koodi algoritmidega töötlemise tagajärg. Hagejate sõnul reprodutseerib Copilot ainult koodi, millel on otseviited avatud hoidlates olemasolevale koodile ning sellised manipulatsioonid ei kuulu õiglase kasutamise kriteeriumide alla. Teisisõnu peavad hagejad GitHub Copiloti koodi sünteesiks tuletatud teose loomist olemasolevast koodist, mida levitatakse teatud litsentside alusel ja millel on kindlad autorid.

Eelkõige kasutatakse Copiloti süsteemi koolitamisel koodi, mida levitatakse avatud litsentside alusel, mis enamikul juhtudel nõuab autoriteadet (omistamist). Saadud koodi genereerimisel ei ole see nõue täidetud, mis on enamiku avatud lähtekoodiga litsentside, nagu GPL, MIT ja Apache, selge rikkumine. Lisaks rikub Copilot GitHubi enda teenusetingimusi ja privaatsust, ei järgi DMCA-d, mis keelab autoriõiguse teabe eemaldamise, ega CCPA-d (California Consumer Privacy Act), mis reguleerib isikuandmete töötlemist.

Hagi tekst annab ligikaudse arvutuse Copiloti tegevusega kogukonnale tekitatud kahju kohta. DMCA (Digital Millennium Copyright Act – DMCA) jaotise 1202 kohaselt on minimaalne kahjutasu 2500 dollarit rikkumise kohta. Arvestades, et teenusel Copilot on 1.2 miljonit kasutajat ja iga teenuse kasutamise puhul on kolm DMCA rikkumist (omistamine, autoriõigus ja litsentsitingimused), on minimaalne kogukahju hinnanguliselt 9 miljardit dollarit (1200000 * 3 * 2500 dollarit).

Software Freedom Conservancy (SFC), kes on varem GitHubi ja Copiloti suhtes kriitiliselt suhtunud, kommenteeris kohtuasja, soovitades kogukonna kaitsmisel mitte kalduda kõrvale ühest varem sõnastatud põhimõttest – "kogukonnale suunatud jõustamine ei tohiks eelistada rahalist kasu". SFC hinnangul on Copiloti tegevus vastuvõetamatu eelkõige seetõttu, et õõnestab "copyleft" mehhanismi, mille eesmärk on tagada kasutajatele, arendajatele ja tarbijatele võrdsed õigused. Paljud Copilotiga hõlmatud projektid tarnitakse copyleft litsentsidega, nagu GPL, mis nõuavad tuletatud teoste koodi esitamist ühilduva litsentsi alusel. Copiloti pakutava olemasoleva koodi kleepimine võib tahtmatult rikkuda selle projekti litsentsi, kust kood laenati.

Tuletame meelde, et suvel käivitas GitHub uue kommertsteenuse GitHub Copilot, mis on koolitatud avalikes GitHubi hoidlates hostitud lähtekoodide massiivi kohta ja suudab koodi kirjutamisel genereerida tüüpilisi konstruktsioone. Teenus võib moodustada üsna keerulisi ja suuri koodiplokke, kuni valmisfunktsioonideni, mis suudavad korrata tekstifragmente olemasolevatest projektidest. GitHubi sõnul üritab süsteem koodi struktuuri uuesti luua, mitte koodi ennast kopeerida, kuid umbes 1% juhtudest võib pakutud soovitus sisaldada olemasolevate projektide koodilõike, mis on suuremad kui 150 tähemärki. Olemasoleva koodi asendamise vältimiseks on Copilotil spetsiaalne filter, mis kontrollib ristumisi GitHubis hostitud projektidega, kuid see filter aktiveeritakse kasutaja äranägemisel.

Kaks päeva enne hagi esitamist teatas GitHub oma kavatsusest juurutada 2023. aastal funktsioon, mis võimaldab jälgida Copilotis genereeritud juppide seost hoidlates olemasoleva koodiga. Arendajad saavad vaadata avalikes hoidlates juba olevate sarnaste koodide loendit, samuti sorteerida ristumiskohti koodilitsentside ja muudatuse tegemise aja järgi.

Allikas: opennet.ru

Lisa kommentaar