การดำเนินคดีทางกฎหมายกับ Microsoft และ OpenAI ที่เกี่ยวข้องกับตัวสร้างโค้ด GitHub Copilot

Matthew Butterick ผู้พัฒนาตัวอักษรโอเพ่นซอร์สและสำนักงานกฎหมาย Joseph Saveri ได้ยื่นฟ้อง (PDF) ต่อผู้ผลิตเทคโนโลยีที่ใช้ในบริการ Copilot ของ GitHub จำเลย ได้แก่ Microsoft, GitHub และบริษัทที่ดูแลโครงการ OpenAI ซึ่งผลิตโมเดลการสร้างโค้ด OpenAI Codex ที่รองรับ GitHub Copilot การพิจารณาคดีพยายามที่จะให้ศาลมีส่วนร่วมในการพิจารณาความถูกต้องตามกฎหมายของการสร้างบริการ เช่น GitHub Copilot และพิจารณาว่าบริการดังกล่าวละเมิดสิทธิ์ของนักพัฒนารายอื่นหรือไม่

กิจกรรมของจำเลยถูกเปรียบเทียบกับการสร้างการละเมิดลิขสิทธิ์ซอฟต์แวร์รูปแบบใหม่ โดยอาศัยการบิดเบือนโค้ดที่มีอยู่โดยใช้เทคนิคการเรียนรู้ของเครื่อง และทำให้พวกเขาได้รับประโยชน์จากการทำงานของผู้อื่น การสร้าง Copilot ยังถือเป็นการแนะนำกลไกใหม่ในการสร้างรายได้จากผลงานของนักพัฒนาซอฟต์แวร์โอเพ่นซอร์ส แม้ว่า GitHub จะเคยสัญญาว่าจะไม่ทำเช่นนี้ก็ตาม

ตำแหน่งของโจทก์ขึ้นอยู่กับข้อเท็จจริงที่ว่าผลลัพธ์ของการสร้างโค้ดโดยระบบการเรียนรู้ของเครื่องจักรที่ได้รับการฝึกอบรมเกี่ยวกับข้อความต้นฉบับที่เปิดเผยต่อสาธารณะนั้น ไม่สามารถตีความได้ว่าเป็นงานที่ใหม่และเป็นอิสระโดยพื้นฐาน เนื่องจากเป็นผลมาจากอัลกอริทึมที่ประมวลผลโค้ดที่มีอยู่แล้ว ตามที่โจทก์ระบุว่า Copilot ทำซ้ำเฉพาะโค้ดที่มีการอ้างอิงโดยตรงไปยังโค้ดที่มีอยู่ในที่เก็บข้อมูลสาธารณะ และการดัดแปลงดังกล่าวไม่ตกอยู่ภายใต้เกณฑ์ของการใช้งานโดยชอบธรรม กล่าวอีกนัยหนึ่ง การสังเคราะห์โค้ดใน GitHub Copilot ถือเป็นโจทก์ว่าเป็นการสร้างงานลอกเลียนแบบจากโค้ดที่มีอยู่ เผยแพร่ภายใต้ใบอนุญาตบางอย่างและมีผู้เขียนเฉพาะ

โดยเฉพาะอย่างยิ่ง เมื่อฝึกระบบ Copilot จะมีการใช้โค้ดที่เผยแพร่ภายใต้ใบอนุญาตแบบเปิด ในกรณีส่วนใหญ่จะต้องมีการแจ้งแหล่งที่มา (การระบุแหล่งที่มา) ไม่เป็นไปตามข้อกำหนดนี้เมื่อสร้างโค้ดผลลัพธ์ ซึ่งเป็นการละเมิดใบอนุญาตโอเพ่นซอร์สส่วนใหญ่ เช่น GPL, MIT และ Apache อย่างชัดเจน นอกจากนี้ Copilot ละเมิดข้อกำหนดในการให้บริการและความเป็นส่วนตัวของ GitHub ไม่ปฏิบัติตาม DMCA ซึ่งห้ามมิให้มีการลบข้อมูลลิขสิทธิ์ และ CCPA (พระราชบัญญัติความเป็นส่วนตัวของผู้บริโภคแห่งแคลิฟอร์เนีย) ซึ่งควบคุมการจัดการข้อมูลส่วนบุคคล

ข้อความในคดีให้การคำนวณความเสียหายที่เกิดขึ้นกับชุมชนโดยประมาณอันเป็นผลมาจากกิจกรรมของ Copilot ตามมาตรา 1202 ของ Digital Millennium Copyright Act (DMCA) ค่าเสียหายขั้นต่ำคือ 2500 ดอลลาร์ต่อการละเมิด เมื่อพิจารณาถึงความจริงที่ว่าบริการ Copilot มีผู้ใช้ 1.2 ล้านคน และทุกครั้งที่ใช้บริการ มีการละเมิด DMCA สามครั้งเกิดขึ้น (การระบุแหล่งที่มา ลิขสิทธิ์ และเงื่อนไขใบอนุญาต) จำนวนความเสียหายขั้นต่ำทั้งหมดอยู่ที่ประมาณ 9 พันล้านดอลลาร์ (1200000 * 3 * 2500 ดอลลาร์)

องค์กรสิทธิมนุษยชน Software Freedom Conservancy (SFC) ซึ่งเคยวิพากษ์วิจารณ์ GitHub และ Copilot ก่อนหน้านี้ แสดงความคิดเห็นเกี่ยวกับการฟ้องร้องพร้อมคำแนะนำว่าอย่าเบี่ยงเบนไปจากหลักการข้อใดข้อหนึ่งที่ระบุไว้ก่อนหน้านี้เมื่อปกป้องผลประโยชน์ของชุมชน - “การบังคับใช้ที่มุ่งเน้นชุมชนควร ไม่ให้ความสำคัญกับผลประโยชน์ทางการเงิน” จากข้อมูลของ SFC การกระทำของ Copilot เป็นสิ่งที่ยอมรับไม่ได้ เนื่องจากการกระทำดังกล่าวบ่อนทำลายกลไกลิขสิทธิ์ที่มีจุดมุ่งหมายเพื่อให้สิทธิ์ที่เท่าเทียมกันแก่ผู้ใช้ นักพัฒนา และผู้บริโภค โครงการหลายโครงการที่ครอบคลุมใน Copilot ได้รับการเผยแพร่ภายใต้ลิขสิทธิ์ลิขสิทธิ์ เช่น GPL ซึ่งกำหนดให้ต้องมีการแจกจ่ายรหัสของผลงานลอกเลียนแบบภายใต้ลิขสิทธิ์ที่เข้ากันได้ ด้วยการแทรกโค้ดที่มีอยู่ตามที่ Copilot แนะนำ นักพัฒนาอาจละเมิดใบอนุญาตของโครงการที่ยืมโค้ดมาโดยไม่รู้ตัว

ให้เราระลึกว่าในช่วงฤดูร้อน GitHub ได้เปิดตัวบริการเชิงพาณิชย์ใหม่ GitHub Copilot ซึ่งได้รับการฝึกฝนเกี่ยวกับอาร์เรย์ของข้อความต้นฉบับที่โพสต์ในที่เก็บ GitHub สาธารณะ และสามารถสร้างการออกแบบมาตรฐานเมื่อเขียนโค้ด บริการนี้สามารถสร้างบล็อกโค้ดที่ค่อนข้างซับซ้อนและมีขนาดใหญ่ได้ จนถึงฟังก์ชันสำเร็จรูปที่สามารถทำซ้ำข้อความจากโปรเจ็กต์ที่มีอยู่ได้ ตาม GitHub ระบบพยายามที่จะสร้างโครงสร้างของโค้ดขึ้นมาใหม่แทนที่จะคัดลอกโค้ดเอง อย่างไรก็ตาม ในกรณีประมาณ 1% คำแนะนำที่เสนออาจรวมถึงตัวอย่างโค้ดของโปรเจ็กต์ที่มีอยู่ซึ่งมีความยาวมากกว่า 150 อักขระ เพื่อป้องกันการแทนที่โค้ดที่มีอยู่ Copilot มีตัวกรองในตัวที่จะตรวจสอบจุดตัดกับโปรเจ็กต์ที่โฮสต์บน GitHub แต่ตัวกรองนี้จะเปิดใช้งานตามดุลยพินิจของผู้ใช้

สองวันก่อนยื่นฟ้อง GitHub ได้ประกาศความตั้งใจที่จะใช้ฟีเจอร์ในปี 2023 ที่จะอนุญาตให้ติดตามความสัมพันธ์ระหว่างแฟรกเมนต์ที่สร้างใน Copilot และโค้ดที่มีอยู่ในที่เก็บ นักพัฒนาจะสามารถดูรายการโค้ดที่คล้ายกันซึ่งมีอยู่แล้วในพื้นที่เก็บข้อมูลสาธารณะ รวมทั้งจัดเรียงจุดตัดตามลิขสิทธิ์โค้ดและเวลาที่แก้ไข

ที่มา: opennet.ru

เพิ่มความคิดเห็น