Teisminis procesas prieš „Microsoft“ ir „OpenAI“, susijęs su „GitHub Copilot“ kodų generatoriumi

Atvirojo kodo tipografijos kūrėjas Matthew Butterickas ir Joseph Saveri Law Firm pateikė ieškinį (PDF) prieš „GitHub Copilot“ paslaugoje naudojamų technologijų kūrėjus. Atsakovai yra „Microsoft“, „GitHub“ ir bendrovės, prižiūrinčios OpenAI projektą, kuris sukūrė „OpenAI Codex“ kodo generavimo modelį, kuriuo grindžiamas „GitHub Copilot“. Proceso metu bandoma įtraukti teismą nustatant paslaugų, tokių kaip „GitHub Copilot“, kūrimo teisėtumą ir nustatyti, ar tokios paslaugos nepažeidžia kitų kūrėjų teisių.

Kaltinamųjų veikla buvo lyginama su naujo tipo programinės įrangos piratavimo kūrimu, paremtu esamo kodo manipuliavimu naudojant mašininio mokymosi metodus ir leidžiant pasinaudoti kitų žmonių darbu. „Copilot“ sukūrimas taip pat vertinamas kaip naujo mechanizmo, leidžiančio užsidirbti pinigų iš atvirojo kodo programinės įrangos kūrėjų darbo, įdiegimas, nepaisant to, kad „GitHub“ anksčiau pažadėjo to niekada nedaryti.

Ieškovų pozicija susiveda į tai, kad kodo generavimo mašininio mokymosi sistema, parengta pagal viešai prieinamus šaltinio tekstus, rezultatas negali būti interpretuojamas kaip iš esmės naujas ir savarankiškas darbas, nes tai yra algoritmų, apdorojančių jau esamą kodą, pasekmė. Ieškovų teigimu, „Copilot“ atkuria tik kodą, kuris turi tiesiogines nuorodas į viešose saugyklose esantį kodą, o tokios manipuliacijos nepatenka į sąžiningo naudojimo kriterijus. Kitaip tariant, kodo sintezę „GitHub Copilot“ ieškovai vertina kaip išvestinio kūrinio sukūrimą iš esamo kodo, platinamo pagal tam tikras licencijas ir turintį konkrečius autorius.

Visų pirma, mokant Copilot sistemą, naudojamas kodas, platinamas pagal atvirąsias licencijas, daugeliu atvejų reikalaujantis įspėjimo apie autorystę (priskyrimą). Šis reikalavimas neįvykdytas generuojant gautą kodą, o tai akivaizdžiai pažeidžia daugumą atvirojo kodo licencijų, tokių kaip GPL, MIT ir Apache. Be to, „Copilot“ pažeidžia paties „GitHub“ paslaugų teikimo sąlygas ir privatumą, nesilaiko DMCA įstatymo, kuris draudžia pašalinti autorių teisių informaciją, ir CCPA įstatymo (Kalifornijos vartotojų privatumo akto), reglamentuojančio asmens duomenų tvarkymą, reikalavimų. .

Ieškinio tekste pateikiamas apytikslis „Copilot“ veiklos rezultato bendrijai padarytos žalos apskaičiavimas. Pagal Skaitmeninio tūkstantmečio autorių teisių įstatymo (DMCA) 1202 skirsnį minimali žala yra 2500 1.2 USD už kiekvieną pažeidimą. Atsižvelgiant į tai, kad Copilot paslauga turi 9 milijono vartotojų ir kiekvieną kartą naudojantis paslauga, įvyksta trys DMCA pažeidimai (priskyrimas, autorių teisės ir licencijos sąlygos), minimali bendros žalos suma yra 1200000 milijardai dolerių (3 2500 XNUMX * XNUMX). * XNUMX USD).

Žmogaus teisių organizacija Software Freedom Conservancy (SFC), anksčiau kritikavusi „GitHub“ ir „Copilot“, ieškinį pakomentavo su rekomendacija ginant bendruomenės interesus nenukrypti nuo vieno iš anksčiau nurodytų principų – „į bendruomenę orientuotas vykdymas turėtų neteikite pirmenybės finansinei naudai“. Pasak SFC, „Copilot“ veiksmai yra nepriimtini visų pirma dėl to, kad jie kenkia „copyleft“ mechanizmui, kuriuo siekiama užtikrinti lygias teises vartotojams, kūrėjams ir vartotojams. Daugelis projektų, kuriems taikomas „Copilot“, yra platinami pagal „copyleft“ licencijas, pvz., GPL, pagal kurią išvestinių kūrinių kodas turi būti platinamas pagal suderinamą licenciją. Įterpdami esamą kodą, kaip siūlo Copilot, kūrėjai gali nesąmoningai pažeisti projekto, iš kurio kodas buvo pasiskolintas, licenciją.

Prisiminkime, kad vasarą „GitHub“ pristatė naują komercinę paslaugą „GitHub Copilot“, apmokytą viešose „GitHub“ saugyklose paskelbtų šaltinių tekstų masyve ir galinčią generuoti standartinius dizainus rašant kodą. Paslauga gali generuoti gana sudėtingus ir didelius kodo blokus iki paruoštų funkcijų, kurios gali pakartoti esamų projektų teksto ištraukas. „GitHub“ teigimu, sistema bando atkurti kodo struktūrą, o ne nukopijuoti patį kodą, tačiau maždaug 1% atvejų siūloma rekomendacija gali apimti esamų projektų kodo fragmentus, kurių ilgis viršija 150 simbolių. Kad būtų išvengta esamo kodo pakeitimo, „Copilot“ turi įmontuotą filtrą, kuris tikrina, ar nėra susikirtimų su „GitHub“ priglobtais projektais, tačiau šis filtras įjungiamas vartotojo nuožiūra.

Likus dviem dienoms iki ieškinio pateikimo, „GitHub“ paskelbė apie savo ketinimą 2023 m. įdiegti funkciją, kuri leistų sekti ryšį tarp „Copilot“ sugeneruotų fragmentų ir esamo kodo saugyklose. Kūrėjai galės peržiūrėti panašaus kodo, jau esančio viešose saugyklose, sąrašą, taip pat rūšiuoti sankryžas pagal kodo licenciją ir modifikavimo laiką.

Šaltinis: opennet.ru

Добавить комментарий