Një proces gjyqësor kundër Microsoft dhe OpenAI në lidhje me gjeneratorin e kodit GitHub Copilot

Zhvilluesi i tipografisë me burim të hapur Matthew Butterick dhe Firma Juridike Joseph Saveri kanë ngritur një padi (PDF) kundër krijuesve të teknologjisë së përdorur në shërbimin Copilot të GitHub. Të pandehurit përfshijnë Microsoft, GitHub dhe kompanitë që mbikëqyrin projektin OpenAI, i cili prodhoi modelin e gjenerimit të kodit OpenAI Codex që qëndron në themel të GitHub Copilot. Procedurat përpiqen të përfshijnë gjykatën në përcaktimin e ligjshmërisë së krijimit të shërbimeve si GitHub Copilot dhe përcaktimin nëse shërbime të tilla shkelin të drejtat e zhvilluesve të tjerë.

Aktivitetet e të pandehurve janë krahasuar me krijimin e një lloji të ri të piraterisë së softuerit, bazuar në manipulimin e kodit ekzistues duke përdorur teknikat e mësimit të makinerive dhe duke i lejuar ata të përfitojnë nga puna e njerëzve të tjerë. Krijimi i Copilot shihet gjithashtu si prezantimi i një mekanizmi të ri për fitimin e parave nga puna e zhvilluesve të softuerit me burim të hapur, pavarësisht faktit se GitHub më parë kishte premtuar se nuk do ta bënte kurrë këtë.

Pozicioni i paditësve zbret në faktin se rezultati i gjenerimit të kodit nga një sistem mësimi makinerie i trajnuar në tekste burimore të disponueshme publikisht nuk mund të interpretohet si një punë thelbësisht e re dhe e pavarur, pasi është pasojë e algoritmeve që përpunojnë kodin tashmë ekzistues. Sipas paditësve, Copilot riprodhon vetëm kodin që ka referenca direkte ndaj kodit ekzistues në depot publike dhe manipulime të tilla nuk bien nën kriteret e përdorimit të drejtë. Me fjalë të tjera, sinteza e kodit në GitHub Copilot konsiderohet nga paditësit si krijimi i një vepre të derivuar nga kodi ekzistues, i shpërndarë sipas licencave të caktuara dhe me autorë të veçantë.

Në veçanti, kur trajnohet sistemi Copilot, përdoret kodi që shpërndahet me licenca të hapura, në shumicën e rasteve kërkon njoftim për autorësinë (atribut). Kjo kërkesë nuk plotësohet kur gjenerohet kodi që rezulton, i cili është një shkelje e qartë e shumicës së licencave me burim të hapur si GPL, MIT dhe Apache. Për më tepër, Copilot shkel vetë kushtet e shërbimit dhe privatësinë e GitHub, nuk përputhet me DMCA, e cila ndalon heqjen e informacionit për të drejtën e autorit, dhe CCPA (Akti i Privatësisë së Konsumatorit në Kaliforni), i cili rregullon trajtimin e të dhënave personale.

Teksti i padisë jep një përllogaritje të përafërt të dëmit të shkaktuar në komunitet si rezultat i aktiviteteve të Copilot. Në bazë të seksionit 1202 të Aktit për të Drejtat e Autorit të Mijëvjeçarit Dixhital (DMCA), dëmet minimale janë 2500 dollarë për shkelje. Duke marrë parasysh faktin se shërbimi Copilot ka 1.2 milion përdorues dhe sa herë që përdoret shërbimi, ndodhin tre shkelje të DMCA (kushtet e atribuimit, të drejtës së autorit dhe licencës), shuma minimale e dëmit total vlerësohet në 9 miliardë dollarë (1200000 * 3 * 2500 dollarë).

Organizata e të drejtave të njeriut Software Freedom Conservancy (SFC), e cila ka kritikuar më parë GitHub dhe Copilot, komentoi padinë me një rekomandim për të mos devijuar nga një prej parimeve të saj të deklaruara më parë kur mbron interesat e komunitetit - “zbatimi i orientuar nga komuniteti duhet mos i jep përparësi përfitimit financiar.” Sipas SFC, veprimet e Copilot janë të papranueshme kryesisht sepse ato minojnë mekanizmin e copyleft, që synon ofrimin e të drejtave të barabarta për përdoruesit, zhvilluesit dhe konsumatorët. Shumë nga projektet e mbuluara në Copilot shpërndahen sipas licencave copyleft, të tilla si GPL, të cilat kërkojnë që kodi i veprave të derivuara të shpërndahet nën një licencë të përputhshme. Duke futur kodin ekzistues siç sugjerohet nga Copilot, zhvilluesit mund të shkelin pa dashje licencën e projektit nga i cili është huazuar kodi.

Le të kujtojmë se gjatë verës GitHub lançoi një shërbim të ri tregtar, GitHub Copilot, i trajnuar në një sërë tekstesh burimore të postuara në depot publike të GitHub dhe i aftë për të gjeneruar modele standarde kur shkruante kod. Shërbimi mund të gjenerojë blloqe mjaft komplekse dhe të mëdha kodi, deri në funksione të gatshme që mund të përsërisin pasazhe teksti nga projektet ekzistuese. Sipas GitHub, sistemi përpiqet të rikrijojë strukturën e kodit në vend që të kopjojë vetë kodin, megjithatë, në afërsisht 1% të rasteve, rekomandimi i propozuar mund të përfshijë copa kodi të projekteve ekzistuese që janë më shumë se 150 karaktere të gjata. Për të parandaluar zëvendësimin e kodit ekzistues, Copilot ka një filtër të integruar që kontrollon kryqëzimet me projektet e pritura në GitHub, por ky filtër aktivizohet sipas gjykimit të përdoruesit.

Dy ditë përpara paraqitjes së padisë, GitHub njoftoi synimin e tij për të zbatuar një veçori në vitin 2023 që do të lejonte gjurmimin e marrëdhënieve midis fragmenteve të krijuara në Copilot dhe kodit ekzistues në depo. Zhvilluesit do të jenë në gjendje të shikojnë një listë të kodeve të ngjashme tashmë të pranishme në depo publike, si dhe të renditin kryqëzimet sipas licencës së kodit dhe kohës së modifikimit.

Burimi: opennet.ru

Shto një koment