GitHub เปิดตัวระบบการเรียนรู้ของเครื่อง Copilot ที่สร้างโค้ด

GitHub ประกาศเสร็จสิ้นการทดสอบผู้ช่วยอัจฉริยะ GitHub Copilot ซึ่งสามารถสร้างโครงสร้างมาตรฐานเมื่อเขียนโค้ด ระบบได้รับการพัฒนาร่วมกับโครงการ OpenAI และใช้แพลตฟอร์มการเรียนรู้ของเครื่อง OpenAI Codex ซึ่งได้รับการฝึกฝนเกี่ยวกับซอร์สโค้ดจำนวนมากที่โฮสต์ในที่เก็บ GitHub สาธารณะ บริการนี้เป็นบริการฟรีสำหรับผู้ดูแลโครงการโอเพ่นซอร์สยอดนิยมและนักศึกษา สำหรับผู้ใช้ประเภทอื่นๆ จะมีการชำระค่าเข้าถึง GitHub Copilot ($10 ต่อเดือนหรือ $100 ต่อปี) แต่ให้สิทธิ์ทดลองใช้งานฟรีเป็นเวลา 60 วัน

การสร้างโค้ดได้รับการสนับสนุนในภาษาการเขียนโปรแกรม Python, JavaScript, TypeScript, Ruby, Go, C# และ C++ โดยใช้เฟรมเวิร์กต่างๆ มีโมดูลให้ใช้งานเพื่อรวม GitHub Copilot เข้ากับสภาพแวดล้อมการพัฒนา Neovim, JetBrains IDEs, Visual Studio และ Visual Studio Code เมื่อพิจารณาจากการวัดและส่งข้อมูลทางไกลที่รวบรวมระหว่างการทดสอบ บริการนี้ช่วยให้คุณสร้างโค้ดที่มีคุณภาพค่อนข้างสูง ตัวอย่างเช่น 26% ของคำแนะนำที่เสนอใน GitHub Copilot ได้รับการยอมรับจากนักพัฒนาตามที่เป็นอยู่

GitHub Copilot แตกต่างจากระบบการเติมโค้ดแบบเดิมตรงที่ความสามารถในการสร้างบล็อกโค้ดที่ค่อนข้างซับซ้อน จนถึงฟังก์ชันสำเร็จรูปที่สังเคราะห์ขึ้นโดยคำนึงถึงบริบทปัจจุบัน GitHub Copilot ปรับให้เข้ากับวิธีที่นักพัฒนาเขียนโค้ดและคำนึงถึง API และเฟรมเวิร์กที่ใช้ในโปรแกรม ตัวอย่างเช่น หากมีตัวอย่างโครงสร้าง JSON ในความคิดเห็น เมื่อคุณเริ่มเขียนฟังก์ชันเพื่อแยกวิเคราะห์โครงสร้างนี้ GitHub Copilot จะเสนอโค้ดสำเร็จรูป และเมื่อเขียนรายการประจำของคำอธิบายที่ซ้ำกัน มันจะสร้างส่วนที่เหลือ ตำแหน่ง

GitHub เปิดตัวระบบการเรียนรู้ของเครื่อง Copilot ที่สร้างโค้ด

ความสามารถของ GitHub Copilot ในการสร้างบล็อกโค้ดสำเร็จรูปได้นำไปสู่ความขัดแย้งที่เกี่ยวข้องกับการละเมิดลิขสิทธิ์ลิขสิทธิ์ที่อาจเกิดขึ้น เมื่อสร้างโมเดลการเรียนรู้ของเครื่อง จะใช้ข้อความต้นฉบับจริงจากที่เก็บโปรเจ็กต์โอเพ่นซอร์สที่อยู่บน GitHub โครงการเหล่านี้หลายโครงการจัดทำขึ้นภายใต้ลิขสิทธิ์ลิขสิทธิ์ เช่น GPL ซึ่งกำหนดให้ต้องมีการแจกจ่ายรหัสของผลงานลอกเลียนแบบภายใต้ลิขสิทธิ์ที่เข้ากันได้ ด้วยการแทรกโค้ดที่มีอยู่ตามที่ Copilot แนะนำ นักพัฒนาอาจละเมิดใบอนุญาตของโครงการที่ยืมโค้ดมาโดยไม่รู้ตัว

ยังไม่ชัดเจนว่างานที่สร้างโดยระบบการเรียนรู้ของเครื่องสามารถถือเป็นอนุพันธ์ได้หรือไม่ คำถามยังเกิดขึ้นว่าโมเดลการเรียนรู้ของเครื่องอยู่ภายใต้ลิขสิทธิ์หรือไม่ และหากเป็นเช่นนั้น ใครเป็นเจ้าของสิทธิ์เหล่านี้ และเกี่ยวข้องกับสิทธิ์ในโค้ดที่เป็นพื้นฐานของโมเดลอย่างไร

ในอีกด้านหนึ่ง บล็อกที่สร้างขึ้นสามารถทำซ้ำข้อความจากโปรเจ็กต์ที่มีอยู่ได้ แต่ในทางกลับกัน ระบบจะสร้างโครงสร้างของโค้ดขึ้นใหม่แทนที่จะคัดลอกโค้ดเอง จากการศึกษาของ GitHub พบว่ามีเพียง 1% ของเวลาที่คำแนะนำของ Copilot อาจรวมตัวอย่างโค้ดจากโปรเจ็กต์ที่มีอยู่ซึ่งมีความยาวมากกว่า 150 อักขระ ในสถานการณ์ส่วนใหญ่ การทำซ้ำเกิดขึ้นเมื่อ Copilot ไม่สามารถระบุบริบทได้อย่างถูกต้องหรือเสนอวิธีแก้ปัญหามาตรฐานให้กับปัญหาได้

เพื่อป้องกันการแทนที่โค้ดที่มีอยู่ จึงได้เพิ่มตัวกรองพิเศษลงใน Copilot ซึ่งไม่อนุญาตให้มีจุดตัดกับโปรเจ็กต์ที่มีอยู่ เมื่อตั้งค่า นักพัฒนาสามารถเปิดหรือปิดใช้งานตัวกรองนี้ได้ตามดุลยพินิจของเขา ท่ามกลางปัญหาอื่นๆ มีความเป็นไปได้ที่โค้ดที่สังเคราะห์อาจเกิดข้อผิดพลาดและช่องโหว่ซ้ำในโค้ดที่ใช้ในการฝึกโมเดล

ที่มา: opennet.ru

เพิ่มความคิดเห็น