Правни постапки против Microsoft и OpenAI поврзани со генератор на код на GitHub Copilot

Развивачот на типографија со отворен код Метју Батерик и адвокатската фирма Џозеф Савери поднесоа тужба (PDF) против креаторите на технологијата што се користи во услугата Copilot на GitHub. Обвинетите ги вклучуваат Microsoft, GitHub и компаниите кои го надгледуваат проектот OpenAI, кој го произведе моделот за генерирање код на OpenAI Codex што лежи во основата на GitHub Copilot. Постапката се обидува да го вклучи судот во утврдувањето на законитоста на создавање услуги како GitHub Copilot и утврдување дали таквите услуги ги кршат правата на другите програмери.

Активностите на обвинетите се споредуваат со создавање на нов вид софтверска пиратерија, заснована на манипулација со постоечки код користејќи техники за машинско учење и овозможувајќи им да имаат корист од работата на другите луѓе. Создавањето на Copilot исто така се смета за воведување на нов механизам за монетизирање на работата на развивачите на софтвер со отворен код, и покрај фактот што GitHub претходно вети дека никогаш нема да го стори тоа.

Позицијата на тужителите се сведува на фактот дека резултатот од генерирање код од систем за машинско учење обучен на јавно достапни изворни текстови не може да се толкува како фундаментално ново и независно дело, бидејќи тоа е последица на алгоритмите кои го обработуваат веќе постоечкиот код. Според тужителите, Copilot репродуцира само код кој има директни референци на постоечки код во јавните складишта, а таквите манипулации не спаѓаат во критериумите за правична употреба. Со други зборови, синтезата на код во GitHub Copilot се смета од страна на тужителите како создавање на изведено дело од постоечки код, дистрибуирано под одредени лиценци и има специфични автори.

Особено, кога се обучува системот Copilot, се користи код кој се дистрибуира под отворени лиценци, во повеќето случаи бара известување за авторство (наведување). Ова барање не е исполнето при генерирање на добиениот код, што е јасно прекршување на повеќето лиценци со отворен код како што се GPL, MIT и Apache. Дополнително, Copilot ги прекршува сопствените услови за користење и приватност на GitHub, не е во согласност со DMCA, кој забранува отстранување на информациите за авторски права, и CCPA (Калифорнија Закон за приватност на потрошувачите), кој го регулира ракувањето со личните податоци.

Текстот на тужбата дава приближна пресметка на штетата предизвикана на заедницата како резултат на активностите на Копилот. Согласно член 1202 од Законот за дигитални милениумски авторски права (DMCA), минималната отштета е 2500 американски долари по прекршување. Земајќи го во предвид фактот дека услугата Copilot има 1.2 милиони корисници и при секое користење на услугата, се случуваат три прекршувања на DMCA (припишување, авторски права и услови за лиценца), минималниот износ на вкупната штета се проценува на 9 милијарди долари (1200000 * 3 * 2500 долари).

Организацијата за човекови права Software Freedom Conservancy (SFC), која претходно ги критикуваше GitHub и Copilot, ја коментираше тужбата со препорака да не отстапува од еден од неговите претходно наведени принципи кога ги штити интересите на заедницата - „спроведувањето ориентирани кон заедницата треба да не давајте приоритет на финансиската добивка“. Според SFC, дејствијата на Copilot се неприфатливи првенствено затоа што го поткопуваат механизмот за copyleft, насочен кон обезбедување еднакви права на корисниците, програмерите и потрошувачите. Многу од проектите опфатени во Copilot се дистрибуираат под лиценци за copyleft, како што е GPL, кои бараат кодот на изведените дела да се дистрибуира под компатибилна лиценца. Со вметнување на постоечки код како што е предложено од Copilot, програмерите може несвесно да ја прекршат лиценцата на проектот од кој е позајмен кодот.

Да потсетиме дека летото GitHub лансираше нова комерцијална услуга, GitHub Copilot, обучена за низа изворни текстови објавени во јавните складишта на GitHub и способна да генерира стандардни дизајни при пишување код. Услугата може да генерира доста сложени и големи блокови на код, до готови функции кои можат да повторуваат текстуални пасуси од постоечките проекти. Според GitHub, системот се обидува да ја рекреира структурата на кодот наместо да го копира самиот код, меѓутоа, во приближно 1% од случаите, предложената препорака може да вклучува фрагменти од код од постоечки проекти кои се долги повеќе од 150 знаци. За да се спречи замена на постоечкиот код, Copilot има вграден филтер кој проверува дали има пресеци со проекти хостирани на GitHub, но овој филтер се активира по дискреција на корисникот.

Два дена пред поднесувањето на тужбата, GitHub ја објави својата намера да имплементира функција во 2023 година што ќе овозможи следење на врската помеѓу фрагментите генерирани во Copilot и постоечкиот код во складиштата. Програмерите ќе можат да видат листа на слични кодови кои веќе се присутни во јавните складишта, како и да ги сортираат пресеците по лиценца за код и време на измена.

Извор: opennet.ru

Додадете коментар