GitHub Copilot kod oluşturucuyla ilgili olarak Microsoft ve OpenAI'ye karşı yasal işlemler

Açık kaynak tipografi geliştiricisi Matthew Butterick ve Joseph Saveri Hukuk Bürosu, GitHub'un Copilot hizmetinde kullanılan teknolojinin yapımcılarına karşı bir dava (PDF) açtı. Sanıklar arasında Microsoft, GitHub ve GitHub Copilot'un temelini oluşturan OpenAI Codex kod oluşturma modelini üreten OpenAI projesini denetleyen şirketler yer alıyor. Duruşmada mahkemenin GitHub Copilot gibi hizmetler oluşturmanın yasallığını belirleme ve bu tür hizmetlerin diğer geliştiricilerin haklarını ihlal edip etmediğini belirleme sürecine dahil edilmesi amaçlanıyor.

Sanıkların faaliyetleri, makine öğrenimi tekniklerini kullanarak mevcut kodun manipülasyonuna dayanan ve başkalarının çalışmalarından faydalanmalarına olanak tanıyan yeni bir tür yazılım korsanlığının yaratılmasıyla karşılaştırıldı. GitHub'un daha önce bunu asla yapmayacağına söz vermesine rağmen, Copilot'un oluşturulması, açık kaynak yazılım geliştiricilerinin çalışmalarından para kazanmak için yeni bir mekanizmanın tanıtımı olarak da görülüyor.

Davacıların konumu, kamuya açık kaynak metinler üzerinde eğitilmiş bir makine öğrenimi sistemi tarafından kod oluşturma sonucunun, halihazırda mevcut kodu işleyen algoritmaların bir sonucu olması nedeniyle temelde yeni ve bağımsız bir çalışma olarak yorumlanamayacağı gerçeğine indirgeniyor. Davacılara göre, Copilot yalnızca kamuya açık depolardaki mevcut kodlara doğrudan atıfta bulunan kodları yeniden üretiyor ve bu tür manipülasyonlar adil kullanım kriterleri kapsamına girmiyor. Başka bir deyişle, GitHub Copilot'taki kod sentezi, davacılar tarafından mevcut koddan türetilmiş, belirli lisanslar altında dağıtılan ve belirli yazarlara sahip bir çalışmanın oluşturulması olarak değerlendiriliyor.

Özellikle, Copilot sistemini eğitirken, çoğu durumda yazarlık bildirimi (atıf) gerektiren, açık lisanslar altında dağıtılan kod kullanılır. Ortaya çıkan kod oluşturulurken bu gereklilik karşılanmıyor; bu, GPL, MIT ve Apache gibi çoğu açık kaynak lisansının açık bir ihlalidir. Ayrıca Copilot, GitHub'ın kendi hizmet şartlarını ve gizliliğini ihlal etmekte, telif hakkı bilgilerinin kaldırılmasını yasaklayan DMCA'ya ve kişisel verilerin işlenmesini düzenleyen CCPA'ya (Kaliforniya Tüketici Gizliliği Yasası) uymamaktadır.

Dava metni, Copilot'un faaliyetleri sonucunda topluma verilen zararın yaklaşık bir hesaplamasını sunmaktadır. Dijital Binyıl Telif Hakkı Yasası'nın (DMCA) 1202. Bölümü uyarınca, ihlal başına minimum zarar 2500 ABD dolarıdır. Copilot hizmetinin 1.2 milyon kullanıcısı olduğu ve hizmetin her kullanıldığında üç DMCA ihlali (atıf, telif hakkı ve lisans koşulları) gerçekleştiği dikkate alındığında, toplam zararın minimum tutarının 9 milyar dolar (1200000*3) olduğu tahmin edilmektedir. *2500$).

Daha önce GitHub ve Copilot'u eleştiren insan hakları örgütü Software Freedom Conservancy (SFC), topluluğun çıkarlarını korurken daha önce belirttiği ilkelerden birinden sapmama tavsiyesiyle dava hakkında yorum yaptı: "topluluk odaklı yaptırımlar Maddi kazanca öncelik vermeyin.” SFC'ye göre, Copilot'un eylemleri öncelikle kullanıcılara, geliştiricilere ve tüketicilere eşit haklar sağlamayı amaçlayan copyleft mekanizmasını baltalaması nedeniyle kabul edilemez. Copilot kapsamına giren projelerin çoğu, türetilmiş çalışmaların kodunun uyumlu bir lisans altında dağıtılmasını gerektiren GPL gibi copyleft lisansları altında dağıtılmaktadır. Geliştiriciler, Copilot'un önerdiği şekilde mevcut kodu ekleyerek, farkında olmadan kodun ödünç alındığı projenin lisansını ihlal edebilir.

Yaz aylarında GitHub'un, halka açık GitHub depolarında yayınlanan bir dizi kaynak metin üzerinde eğitim alan ve kod yazarken standart tasarımlar oluşturabilen yeni bir ticari hizmet olan GitHub Copilot'u başlattığını hatırlayalım. Hizmet, mevcut projelerden metin pasajlarını tekrarlayabilen hazır işlevlere kadar oldukça karmaşık ve büyük kod blokları oluşturabilir. GitHub'a göre sistem, kodun kendisini kopyalamak yerine kodun yapısını yeniden oluşturmaya çalışıyor ancak vakaların yaklaşık %1'inde önerilen öneri, mevcut projelerin 150 karakterden uzun kod parçacıklarını içerebilir. Mevcut kodun değiştirilmesini önlemek için Copilot'ta GitHub'da barındırılan projelerle kesişimleri kontrol eden yerleşik bir filtre bulunur, ancak bu filtre kullanıcının takdirine bağlı olarak etkinleştirilir.

Davanın açılmasından iki gün önce GitHub, 2023'te Copilot'ta oluşturulan parçalar ile depolardaki mevcut kod arasındaki ilişkinin izlenmesine olanak sağlayacak bir özelliği uygulama niyetini duyurdu. Geliştiriciler, halihazırda kamuya açık depolarda bulunan benzer kodların bir listesini görüntüleyebilecek ve kesişimleri kod lisansına ve değişiklik zamanına göre sıralayabilecek.

Kaynak: opennet.ru

Yorum ekle