Proses hukum marang Microsoft lan OpenAI sing ana gandhengane karo generator kode Copilot GitHub

Pangembang tipografi sumber terbuka Matthew Butterick lan Firma Hukum Joseph Saveri wis ngajokake tuntutan hukum (PDF) marang produsen teknologi sing digunakake ing layanan Copilot GitHub. Para terdakwa kalebu Microsoft, GitHub lan perusahaan sing ngawasi proyek OpenAI, sing ngasilake model generasi kode OpenAI Codex sing dadi dhasar Copilot GitHub. Proses kasebut nyoba nglibatake pengadilan kanggo nemtokake legalitas nggawe layanan kaya GitHub Copilot lan nemtokake manawa layanan kasebut nglanggar hak pangembang liyane.

Aktivitas para terdakwa wis dibandhingake karo nggawe jinis pembajakan piranti lunak anyar, adhedhasar manipulasi kode sing ana nggunakake teknik pembelajaran mesin lan ngidini dheweke entuk manfaat saka karya wong liya. Penciptaan Copilot uga katon minangka introduksi mekanisme anyar kanggo monetisasi karya pangembang piranti lunak open source, sanajan kasunyatane GitHub sadurunge janji ora bakal nindakake iki.

Posisi penggugat dadi nyatane yen asil kode generasi dening sistem pembelajaran mesin sing dilatih ing teks sumber sing kasedhiya kanggo umum ora bisa diinterpretasikake minangka karya dhasar anyar lan mandiri, amarga iki minangka konsekuensi saka algoritma pangolahan kode sing wis ana. Miturut penggugat, Copilot mung ngasilake kode sing duwe referensi langsung menyang kode sing ana ing repositori umum, lan manipulasi kasebut ora ana ing kritéria panggunaan sing adil. Ing tembung liyane, sintesis kode ing GitHub Copilot dianggep dening penggugat minangka nggawe karya turunan saka kode sing ana, disebarake miturut lisensi tartamtu lan nduweni penulis tartamtu.

Utamane, nalika nglatih sistem Copilot, kode digunakake sing disebarake ing lisensi mbukak, ing kasus-kasus sing paling akeh mbutuhake kabar pengarang (atribusi). Persyaratan iki ora ditemokake nalika ngasilake kode sing diasilake, sing jelas nglanggar lisensi sumber terbuka kayata GPL, MIT lan Apache. Kajaba iku, Copilot nglanggar syarat layanan lan privasi GitHub dhewe, ora tundhuk karo DMCA, sing nglarang mbusak informasi hak cipta, lan CCPA (Undhang-undhang Privasi Konsumen California), sing ngatur penanganan data pribadhi.

Teks gugatan menehi pitungan kira-kira karusakan sing disebabake dening masyarakat minangka asil saka aktivitas Copilot. Miturut Bagean 1202 saka Digital Millennium Copyright Act (DMCA), kerusakan minimal yaiku $2500 saben pelanggaran. Ngelingi kasunyatan manawa layanan Copilot duwe 1.2 yuta pangguna lan saben layanan kasebut digunakake, ana telung pelanggaran DMCA (atribusi, hak cipta lan syarat lisensi), jumlah kerusakan total minimal kira-kira 9 milyar dolar (1200000 * 3). * $2500).

Organisasi hak asasi manungsa Software Freedom Conservancy (SFC), sing sadurunge ngritik GitHub lan Copilot, menehi komentar babagan tuntutan hukum kasebut kanthi menehi rekomendasi supaya ora nyimpang saka salah sawijining prinsip sing wis kasebut sadurunge nalika nglindhungi kepentingan komunitas - "penegakan berorientasi komunitas kudu ora ngutamakake keuntungan finansial." Miturut SFC, tumindak Copilot ora bisa ditampa utamane amarga ngrusak mekanisme copyleft, sing tujuane nyedhiyakake hak sing padha kanggo pangguna, pangembang lan konsumen. Akeh proyek sing dicakup ing Copilot disebarake ing lisensi copyleft, kayata GPL, sing mbutuhake kode karya turunan disebarake miturut lisensi sing kompatibel. Kanthi nglebokake kode sing wis ana kaya sing disaranake Copilot, pangembang bisa uga ora sengaja nglanggar lisensi proyek sing kode kasebut dipinjam.

Elinga yen ing musim panas GitHub ngluncurake layanan komersial anyar, GitHub Copilot, dilatih babagan macem-macem teks sumber sing dikirim ing repositori GitHub umum, lan bisa ngasilake desain standar nalika nulis kode. Layanan kasebut bisa ngasilake blok kode sing cukup rumit lan gedhe, nganti fungsi siap-siap sing bisa mbaleni perangan teks saka proyek sing wis ana. Miturut GitHub, sistem nyoba nggawe maneh struktur kode tinimbang nyalin kode kasebut dhewe, nanging ing kira-kira 1% kasus, rekomendasi sing diusulake bisa uga kalebu potongan kode proyek sing wis ana sing dawane luwih saka 150 karakter. Kanggo nyegah substitusi kode sing wis ana, Copilot duwe saringan dibangun sing mriksa prapatan karo proyek sing di-host ing GitHub, nanging saringan iki diaktifake miturut kawicaksanan pangguna.

Rong dina sadurunge tuntutan hukum diajukake, GitHub ngumumake niat kanggo ngetrapake fitur ing 2023 sing bakal ngidini nelusuri hubungan antarane fragmen sing digawe ing Copilot lan kode sing ana ing repositori. Pangembang bakal bisa ndeleng dhaptar kode sing padha sing wis ana ing repositori umum, uga ngurutake persimpangan miturut lisensi kode lan wektu modifikasi.

Source: opennet.ru

Add a comment