Matthew Butterick, en typografiutvecklare med öppen källkod, och Joseph Saveri Law Firm har lämnat in en stämningsansökan (PDF) mot tillverkarna av tekniken som används i GitHub Copilot. De tilltalade inkluderar Microsoft, GitHub och de företag som övervakar OpenAI-projektet, som producerade OpenAI Codex-kodgenereringsmodellen som ligger till grund för GitHub Copilot. Målet syftar till att involvera domstolen i att fastställa lagligheten av tjänster som GitHub Copilot och om sådana tjänster kränker andra utvecklares rättigheter.
De tilltalades verksamhet har jämförts med att skapa en ny typ av piratkopiering av programvara som bygger på att manipulera befintlig kod med hjälp av maskininlärningstekniker för att dra nytta av andras arbete. Skapandet av Copilot ses också som introduktionen av en ny mekanism för att tjäna pengar på arbete med öppen källkodsutvecklare, trots att GitHub tidigare lovat att aldrig göra det.
Målsägandenas ställningstagande bottnar i att resultatet av kodgenerering av ett maskininlärningssystem tränat på allmänt tillgängliga källtexter inte kan tolkas som i grunden nytt och självständigt arbete, eftersom det är en konsekvens av bearbetningen av befintlig kod med algoritmer. Enligt kärandena återger Copilot endast kod som har direkta referenser till befintlig kod i öppna arkiv, och sådana manipulationer faller inte under kriterierna för skälig användning. Med andra ord anses kodsyntesen i GitHub Copilot av kärandena vara skapandet av ett härlett verk från befintlig kod distribuerad under vissa licenser och med specifika författare.
Speciellt tränas Copilot-systemet med hjälp av kod distribuerad under öppna licenser, som i de flesta fall kräver attribution. När den resulterande koden genereras uppfylls inte detta krav, vilket är ett tydligt brott mot de flesta öppen källkodslicenser som GPL, MIT och Apache. Dessutom bryter Copilot mot GitHubs egna användarvillkor och integritet, DMCA, som förbjuder borttagning av upphovsrätt, och California Consumer Privacy Act (CCPA), som reglerar hanteringen av personlig information.
Texten i kravet ger en ungefärlig beräkning av den skada som orsakats för samhället till följd av Copilots verksamhet. Enligt avsnitt 1202 i Digital Millennium Copyright Act (DMCA) är minimiskadeståndet $2500 1.2 per överträdelse. Med tanke på att Copilot har 9 miljoner användare och varje användning av tjänsten resulterar i tre DMCA-överträdelser (tillskrivning, upphovsrätt och licensvillkor), beräknas de minsta totala skadorna till 1200000 miljarder USD (3 2500 XNUMX * XNUMX * XNUMX XNUMX USD).
Software Freedom Conservancy (SFC), en människorättsorganisation som tidigare har kritiserat GitHub och Copilot, kommenterade stämningsansökan genom att rekommendera att skyddet av samhällets intressen inte bör avvika från en av dess tidigare formulerade principer - "gemenskapsorienterad brottsbekämpning bör inte ta primär hänsyn till ekonomisk vinning." Enligt SFC är Copilots agerande oacceptabla främst för att de undergräver copyleft-mekanismen, som syftar till att ge lika rättigheter till användare, utvecklare och konsumenter. Många av projekten som täcks av Copilot släpps under copyleft-licenser som GPL, som kräver att härledda verk släpps under en kompatibel licens. Genom att klistra in befintlig kod som föreslagits av Copilot kan utvecklare omedvetet bryta mot licensen för projektet som koden lånades från.
Låt oss komma ihåg att GitHub under sommaren lanserade en ny kommersiell tjänst, GitHub Copilot, utbildad på en rad källtexter som finns i offentliga GitHub-repositories och som kan generera standardkonstruktioner när du skriver kod. Tjänsten kan generera ganska komplexa och stora kodblock, inklusive färdiga funktioner som kan upprepa textfragment från befintliga projekt. Enligt GitHub försöker systemet återskapa kodens struktur istället för att kopiera själva koden, men i cirka 1% av fallen kan den föreslagna rekommendationen innehålla kodavsnitt från befintliga projekt som är längre än 150 tecken. För att förhindra ersättning av befintlig kod har Copilot ett inbyggt filter som letar efter korsningar med projekt som finns på GitHub, men detta filter aktiveras efter användarens gottfinnande.
Två dagar innan stämningsansökan lämnades tillkännagav GitHub planer på att rulla ut en funktion 2023 som skulle göra det möjligt för den att spåra förhållandet mellan utdrag som genereras i Copilot och befintlig kod i arkiv. Utvecklare kommer att kunna se en lista med liknande kod som redan finns i offentliga arkiv, samt sortera korsningar efter kodlicenser och tidpunkt för ändring.
Källa: opennet.ru
