Dómsmál gegn Microsoft og OpenAI sem tengjast GitHub Copilot kóða rafallinu

Matthew Butterick, forritari fyrir opinn leturfræði, og lögfræðifyrirtækið Joseph Saveri hafa höfðað mál (PDF) gegn framleiðendum tækninnar sem notuð er í Copilot þjónustu GitHub. Stefndu eru Microsoft, GitHub og fyrirtækin sem hafa umsjón með OpenAI verkefninu, sem framleiddi OpenAI Codex kóða kynslóðarlíkanið sem liggur til grundvallar GitHub Copilot. Málsmeðferðin reynir að fá dómstólinn til að ákvarða lögmæti þess að búa til þjónustu eins og GitHub Copilot og ákvarða hvort slík þjónusta brjóti í bága við réttindi annarra þróunaraðila.

Starfsemi sakborninganna hefur verið borin saman við gerð nýrrar tegundar hugbúnaðarsjóræningja, sem byggir á því að vinna með núverandi kóða með því að nota vélanámstækni og gera þeim kleift að njóta góðs af vinnu annarra. Einnig er litið á stofnun Copilot sem kynningu á nýju kerfi til að afla tekna af starfi opinn hugbúnaðarframleiðenda, þrátt fyrir að GitHub hafi áður lofað að gera þetta aldrei.

Afstaða stefnenda snýst um það að ekki er hægt að túlka niðurstöðu kóðaframleiðslu með vélanámskerfi sem er þjálfað á opinberlega aðgengilegum frumtextum sem í grundvallaratriðum nýtt og sjálfstætt verk, þar sem hún er afleiðing af reiknirit sem vinna úr kóða sem þegar er til. Að sögn stefnenda endurskapar Copilot einungis kóða sem hefur beinar tilvísanir í gildandi kóða í opinberum geymslum og falla slík meðferð ekki undir skilyrði um sanngjarna notkun. Með öðrum orðum, kóða nýmyndun í GitHub Copilot er talin af stefnendum sem sköpun afleitt verks úr núverandi kóða, dreift með ákveðnum leyfum og hefur sérstaka höfunda.

Sérstaklega, þegar þjálfað er Copilot kerfið, er notaður kóði sem er dreift undir opnum leyfum, í flestum tilfellum þarf að tilkynna um höfundarrétt (attribution). Þessi krafa er ekki uppfyllt þegar þú býrð til kóðann sem myndast, sem er augljóst brot á flestum opnum leyfum eins og GPL, MIT og Apache. Að auki brýtur Copilot í bága við eigin þjónustuskilmála og friðhelgi GitHub, samræmist ekki DMCA, sem bannar fjarlægingu höfundarréttarupplýsinga, og CCPA (California Consumer Privacy Act), sem stjórnar meðferð persónuupplýsinga.

Texti málssóknarinnar gefur áætlaða útreikning á tjóni sem varð fyrir samfélagið vegna starfsemi Copilot. Samkvæmt kafla 1202 í Digital Millennium Copyright Act (DMCA) eru lágmarksskaðabætur $2500 fyrir hvert brot. Með hliðsjón af því að Copilot þjónustan hefur 1.2 milljónir notenda og í hvert sinn sem þjónustan er notuð eiga sér stað þrjú DMCA-brot (afsláttur, höfundarréttur og leyfisskilmálar), er lágmarksupphæð heildartjóns metin á 9 milljarða dollara (1200000 * 3 * 2500 $).

Mannréttindasamtökin Software Freedom Conservancy (SFC), sem áður hafa gagnrýnt GitHub og Copilot, tjáðu sig um málsóknina með þeim tilmælum að víkja ekki frá einni af áður settum meginreglum sínum þegar verndun hagsmuna samfélagsins er - „samfélagsmiðuð fullnustu ætti að ekki forgangsraða fjárhagslegum ávinningi.“ Samkvæmt SFC eru aðgerðir Copilot óviðunandi fyrst og fremst vegna þess að þær grafa undan copyleft kerfi, sem miðar að því að veita notendum, þróunaraðilum og neytendum jafnan rétt. Mörgum verkefna sem fjallað er um í Copilot er dreift með copyleft leyfum, eins og GPL, sem krefst þess að kóða afleiddra verka sé dreift með samhæfu leyfi. Með því að setja inn núverandi kóða eins og Copilot hefur lagt til geta verktaki óafvitandi brotið gegn leyfi verkefnisins sem kóðinn var fenginn að láni frá.

Við skulum minnast þess að sumarið setti GitHub af stað nýja viðskiptaþjónustu, GitHub Copilot, þjálfað í fjölda frumtexta sem settir eru inn í opinberar GitHub geymslur og fær um að búa til staðlaða hönnun þegar kóða er skrifað. Þjónustan getur búið til nokkuð flókna og stóra kóðablokka, allt að tilbúnum aðgerðum sem geta endurtekið textaleiðir úr núverandi verkefnum. Samkvæmt GitHub reynir kerfið að endurskapa uppbyggingu kóðans frekar en að afrita kóðann sjálfan, hins vegar, í um það bil 1% tilvika, geta fyrirhugaðar ráðleggingar innihaldið kóðabúta af núverandi verkefnum sem eru meira en 150 stafir að lengd. Til að koma í veg fyrir að núverandi kóða sé skipt út, er Copilot með innbyggða síu sem leitar að gatnamótum við verkefni sem hýst eru á GitHub, en þessi sía er virkjuð að vali notandans.

Tveimur dögum áður en málsóknin var lögð fram tilkynnti GitHub að hann hygðist innleiða eiginleika árið 2023 sem myndi gera kleift að rekja sambandið milli brota sem myndast í Copilot og núverandi kóða í geymslunum. Hönnuðir munu geta skoðað lista yfir svipaðan kóða sem þegar er til staðar í opinberum geymslum, auk þess að flokka gatnamót eftir kóðaleyfi og breytingartíma.

Heimild: opennet.ru

Bæta við athugasemd