Litigasie teen Microsoft en OpenAI wat verband hou met die GitHub Copilot-kodegenerator

Matthew Butterick, 'n oopbron-tipografie-ontwikkelaar, en Joseph Saveri Law Firm het 'n regsgeding (PDF) aanhangig gemaak teen die tegnologieverkopers wat in die GitHub Copilot-diens gebruik word. Respondente sluit in Microsoft, GitHub en die maatskappye agter die OpenAI-projek, wat die OpenAI Codex-kodegenereringsmodel vervaardig het wat GitHub Copilot ondersteun. Tydens die verrigtinge is gepoog om die hof te betrek by die bepaling van die wettigheid van die skep van dienste soos GitHub Copilot, en om uit te vind of sulke dienste die regte van ander ontwikkelaars skend.

Die verweerders se aktiwiteit word vergelyk met die skep van 'n nuwe soort sagteware-piraterij gebaseer op die manipulasie van bestaande kode deur masjienleermetodes te gebruik en om voordeel te trek uit die werk van ander mense. Die skepping van Copilot word ook gesien as die bekendstelling van 'n nuwe meganisme om die werk van oopbronontwikkelaars te monetiseer, ten spyte van die feit dat GitHub voorheen belowe het om dit nooit te doen nie.

Die standpunt van die eisers is dat die resultaat van kodegenerering deur 'n masjienleerstelsel wat op publiek beskikbare brontekste opgelei is, nie geïnterpreteer kan word as 'n fundamenteel nuwe en onafhanklike werk nie, aangesien dit 'n gevolg is van die verwerking van bestaande kode deur algoritmes. Volgens die eisers reproduseer Copilot slegs kode wat direkte verwysings het na bestaande kode in oop bewaarplekke, en sulke manipulasies val nie onder billike gebruik-kriteria nie. Met ander woorde, die sintese van kode in GitHub Copilot word deur die eisers beskou as die skepping van 'n afgeleide werk van bestaande kode versprei onder sekere lisensies en met spesifieke outeurs.

In die besonder, wanneer die Copilot-stelsel opgelei word, word kode gebruik wat onder oop lisensies versprei word, wat in die meeste gevalle 'n kennisgewing van outeurskap (toeskrywing) vereis. Wanneer die resulterende kode gegenereer word, word hierdie vereiste nie nagekom nie, wat 'n duidelike oortreding is van die meeste oopbronlisensies soos die GPL, MIT en Apache. Boonop skend Copilot GitHub se eie diensbepalings en privaatheid, voldoen nie aan die DMCA, wat die verwydering van kopiereginligting verbied nie, en die CCPA (California Consumer Privacy Act), wat die behandeling van persoonlike data reguleer.

Die teks van die regsgeding verskaf 'n benaderde berekening van die skade wat die gemeenskap aangerig is as gevolg van Copilot se aktiwiteite. Kragtens Artikel 1202 van die Digital Millennium Copyright Act (DMCA), is die minimum skadevergoeding $2500 1.2 per oortreding. Aangesien die Copilot-diens 9 miljoen gebruikers het en daar drie DMCA-oortredings (toeskrywing, kopiereg en lisensiebepalings) is vir elke gebruik van die diens, word die minimum totale skade op 1200000 miljard dollar (3 * 2500 * $XNUMX) geraam.

Die Software Freedom Conservancy (SFC), wat voorheen krities oor GitHub en Copilot was, het kommentaar gelewer op die regsgeding en aanbeveel dat gemeenskapsvoorspraak nie afwyk van een van die voorheen geformuleerde beginsels nie - "gemeenskapsgerigte afdwinging moet nie prioriteit gee aan finansiële gewin nie." Volgens die SFC is Copilot se optrede onaanvaarbaar hoofsaaklik omdat dit die “copyleft”-meganisme ondermyn wat daarop gemik is om gelyke regte aan gebruikers, ontwikkelaars en verbruikers te verskaf. Baie van die projekte wat in Copilot gedek word, word verskaf onder copyleft-lisensies, soos die GPL, wat vereis dat afgeleide werke-kode onder 'n versoenbare lisensie verskaf moet word. Die plak van bestaande kode wat deur Copilot verskaf is, kan onbewustelik die lisensie van die projek waaruit die kode geleen is, oortree.

Onthou dat GitHub in die somer 'n nuwe kommersiële diens GitHub Copilot bekendgestel het, opgelei op 'n verskeidenheid bronkodes wat in openbare GitHub-bewaarplekke aangebied word, en in staat is om tipiese konstrukte te genereer wanneer kode geskryf word. Die diens kan taamlik komplekse en groot blokke kode vorm, tot klaargemaakte funksies wat teksfragmente van bestaande projekte kan herhaal. Volgens GitHub probeer die stelsel om die struktuur van die kode te herskep eerder as om die kode self te kopieer, maar in ongeveer 1% van die gevalle kan die voorgestelde aanbeveling kodebrokkies van bestaande projekte groter as 150 karakters insluit. Om vervanging van bestaande kode te voorkom, het Copilot 'n spesiale filter wat nagaan vir kruisings met projekte wat op GitHub aangebied word, maar hierdie filter word geaktiveer volgens die diskresie van die gebruiker.

Twee dae voor die indiening van die regsgeding het GitHub sy voorneme aangekondig om 'n funksie in 2023 te implementeer wat jou toelaat om die verhouding van brokkies wat in Copilot gegenereer word met bestaande kode in die bewaarplekke na te spoor. Ontwikkelaars sal 'n lys soortgelyke kode wat reeds in openbare bewaarplekke teenwoordig is, kan sien, asook kruisings kan sorteer volgens kodelisensies en wanneer die verandering gemaak is.

Bron: opennet.ru

Voeg 'n opmerking