Matthew Butterick ผู้พัฒนาตัวอักษรโอเพ่นซอร์สและสำนักงานกฎหมาย Joseph Saveri ได้ยื่นฟ้อง (PDF) ต่อผู้ผลิตเทคโนโลยีที่ใช้ในบริการ Copilot ของ GitHub จำเลย ได้แก่ Microsoft, GitHub และบริษัทที่ดูแลโครงการ OpenAI ซึ่งผลิตโมเดลการสร้างโค้ด OpenAI Codex ที่รองรับ GitHub Copilot การพิจารณาคดีพยายามที่จะให้ศาลมีส่วนร่วมในการพิจารณาความถูกต้องตามกฎหมายของการสร้างบริการ เช่น GitHub Copilot และพิจารณาว่าบริการดังกล่าวละเมิดสิทธิ์ของนักพัฒนารายอื่นหรือไม่
กิจกรรมของจำเลยถูกเปรียบเทียบกับการสร้างการละเมิดลิขสิทธิ์ซอฟต์แวร์รูปแบบใหม่ โดยอาศัยการบิดเบือนโค้ดที่มีอยู่โดยใช้เทคนิคการเรียนรู้ของเครื่อง และทำให้พวกเขาได้รับประโยชน์จากการทำงานของผู้อื่น การสร้าง Copilot ยังถือเป็นการแนะนำกลไกใหม่ในการสร้างรายได้จากผลงานของนักพัฒนาซอฟต์แวร์โอเพ่นซอร์ส แม้ว่า GitHub จะเคยสัญญาว่าจะไม่ทำเช่นนี้ก็ตาม
ตำแหน่งของโจทก์ขึ้นอยู่กับข้อเท็จจริงที่ว่าผลลัพธ์ของการสร้างโค้ดโดยระบบการเรียนรู้ของเครื่องจักรที่ได้รับการฝึกอบรมเกี่ยวกับข้อความต้นฉบับที่เปิดเผยต่อสาธารณะนั้น ไม่สามารถตีความได้ว่าเป็นงานที่ใหม่และเป็นอิสระโดยพื้นฐาน เนื่องจากเป็นผลมาจากอัลกอริทึมที่ประมวลผลโค้ดที่มีอยู่แล้ว ตามที่โจทก์ระบุว่า Copilot ทำซ้ำเฉพาะโค้ดที่มีการอ้างอิงโดยตรงไปยังโค้ดที่มีอยู่ในที่เก็บข้อมูลสาธารณะ และการดัดแปลงดังกล่าวไม่ตกอยู่ภายใต้เกณฑ์ของการใช้งานโดยชอบธรรม กล่าวอีกนัยหนึ่ง การสังเคราะห์โค้ดใน GitHub Copilot ถือเป็นโจทก์ว่าเป็นการสร้างงานลอกเลียนแบบจากโค้ดที่มีอยู่ เผยแพร่ภายใต้ใบอนุญาตบางอย่างและมีผู้เขียนเฉพาะ
โดยเฉพาะอย่างยิ่ง เมื่อฝึกระบบ Copilot จะมีการใช้โค้ดที่เผยแพร่ภายใต้ใบอนุญาตแบบเปิด ในกรณีส่วนใหญ่จะต้องมีการแจ้งแหล่งที่มา (การระบุแหล่งที่มา) ไม่เป็นไปตามข้อกำหนดนี้เมื่อสร้างโค้ดผลลัพธ์ ซึ่งเป็นการละเมิดใบอนุญาตโอเพ่นซอร์สส่วนใหญ่ เช่น GPL, MIT และ Apache อย่างชัดเจน นอกจากนี้ Copilot ละเมิดข้อกำหนดในการให้บริการและความเป็นส่วนตัวของ GitHub ไม่ปฏิบัติตาม DMCA ซึ่งห้ามมิให้มีการลบข้อมูลลิขสิทธิ์ และ CCPA (พระราชบัญญัติความเป็นส่วนตัวของผู้บริโภคแห่งแคลิฟอร์เนีย) ซึ่งควบคุมการจัดการข้อมูลส่วนบุคคล
ข้อความในคดีให้การคำนวณความเสียหายที่เกิดขึ้นกับชุมชนโดยประมาณอันเป็นผลมาจากกิจกรรมของ Copilot ตามมาตรา 1202 ของ Digital Millennium Copyright Act (DMCA) ค่าเสียหายขั้นต่ำคือ 2500 ดอลลาร์ต่อการละเมิด เมื่อพิจารณาถึงความจริงที่ว่าบริการ Copilot มีผู้ใช้ 1.2 ล้านคน และทุกครั้งที่ใช้บริการ มีการละเมิด DMCA สามครั้งเกิดขึ้น (การระบุแหล่งที่มา ลิขสิทธิ์ และเงื่อนไขใบอนุญาต) จำนวนความเสียหายขั้นต่ำทั้งหมดอยู่ที่ประมาณ 9 พันล้านดอลลาร์ (1200000 * 3 * 2500 ดอลลาร์)
องค์กรสิทธิมนุษยชน Software Freedom Conservancy (SFC) ซึ่งเคยวิพากษ์วิจารณ์ GitHub และ Copilot ก่อนหน้านี้ แสดงความคิดเห็นเกี่ยวกับการฟ้องร้องพร้อมคำแนะนำว่าอย่าเบี่ยงเบนไปจากหลักการข้อใดข้อหนึ่งที่ระบุไว้ก่อนหน้านี้เมื่อปกป้องผลประโยชน์ของชุมชน - “การบังคับใช้ที่มุ่งเน้นชุมชนควร ไม่ให้ความสำคัญกับผลประโยชน์ทางการเงิน” จากข้อมูลของ SFC การกระทำของ Copilot เป็นสิ่งที่ยอมรับไม่ได้ เนื่องจากการกระทำดังกล่าวบ่อนทำลายกลไกลิขสิทธิ์ที่มีจุดมุ่งหมายเพื่อให้สิทธิ์ที่เท่าเทียมกันแก่ผู้ใช้ นักพัฒนา และผู้บริโภค โครงการหลายโครงการที่ครอบคลุมใน Copilot ได้รับการเผยแพร่ภายใต้ลิขสิทธิ์ลิขสิทธิ์ เช่น GPL ซึ่งกำหนดให้ต้องมีการแจกจ่ายรหัสของผลงานลอกเลียนแบบภายใต้ลิขสิทธิ์ที่เข้ากันได้ ด้วยการแทรกโค้ดที่มีอยู่ตามที่ Copilot แนะนำ นักพัฒนาอาจละเมิดใบอนุญาตของโครงการที่ยืมโค้ดมาโดยไม่รู้ตัว
ให้เราระลึกว่าในช่วงฤดูร้อน GitHub ได้เปิดตัวบริการเชิงพาณิชย์ใหม่ GitHub Copilot ซึ่งได้รับการฝึกฝนเกี่ยวกับอาร์เรย์ของข้อความต้นฉบับที่โพสต์ในที่เก็บ GitHub สาธารณะ และสามารถสร้างการออกแบบมาตรฐานเมื่อเขียนโค้ด บริการนี้สามารถสร้างบล็อกโค้ดที่ค่อนข้างซับซ้อนและมีขนาดใหญ่ได้ จนถึงฟังก์ชันสำเร็จรูปที่สามารถทำซ้ำข้อความจากโปรเจ็กต์ที่มีอยู่ได้ ตาม GitHub ระบบพยายามที่จะสร้างโครงสร้างของโค้ดขึ้นมาใหม่แทนที่จะคัดลอกโค้ดเอง อย่างไรก็ตาม ในกรณีประมาณ 1% คำแนะนำที่เสนออาจรวมถึงตัวอย่างโค้ดของโปรเจ็กต์ที่มีอยู่ซึ่งมีความยาวมากกว่า 150 อักขระ เพื่อป้องกันการแทนที่โค้ดที่มีอยู่ Copilot มีตัวกรองในตัวที่จะตรวจสอบจุดตัดกับโปรเจ็กต์ที่โฮสต์บน GitHub แต่ตัวกรองนี้จะเปิดใช้งานตามดุลยพินิจของผู้ใช้
สองวันก่อนยื่นฟ้อง GitHub ได้ประกาศความตั้งใจที่จะใช้ฟีเจอร์ในปี 2023 ที่จะอนุญาตให้ติดตามความสัมพันธ์ระหว่างแฟรกเมนต์ที่สร้างใน Copilot และโค้ดที่มีอยู่ในที่เก็บ นักพัฒนาจะสามารถดูรายการโค้ดที่คล้ายกันซึ่งมีอยู่แล้วในพื้นที่เก็บข้อมูลสาธารณะ รวมทั้งจัดเรียงจุดตัดตามลิขสิทธิ์โค้ดและเวลาที่แก้ไข
ที่มา: opennet.ru