GitHub ngaluncurkeun sistem pembelajaran mesin Copilot anu ngahasilkeun kode

GitHub ngumumkeun parantosan tés tina asisten calakan GitHub Copilot, sanggup ngahasilkeun konstruksi standar nalika nyerat kode. Sistem ieu dikembangkeun babarengan sareng proyék OpenAI sareng nganggo platform pembelajaran mesin OpenAI Codex, dilatih dina sajumlah ageung kode sumber anu di-host di repositori GitHub umum. Ladenan éta gratis pikeun pangropéa proyék open source populér sareng mahasiswa. Pikeun kategori pangguna anu sanés, aksés ka GitHub Copilot dibayar ($ 10 per bulan atanapi $ 100 per taun), tapi aksés uji coba gratis disayogikeun salami 60 dinten.

Generasi kode dirojong dina basa pamrograman Python, JavaScript, TypeScript, Ruby, Go, C # sareng C ++ nganggo sababaraha kerangka. Modul sayogi pikeun ngahijikeun GitHub Copilot sareng Neovim, JetBrains IDEs, Visual Studio, sareng lingkungan pangembangan Visual Studio Code. Ditilik ku telemétri anu dikumpulkeun nalika tés, jasa éta ngamungkinkeun anjeun ngahasilkeun kode anu kualitasna cukup luhur - contona, 26% tina rekomendasi anu diajukeun dina GitHub Copilot ditampi ku pamekar sapertos kitu.

GitHub Copilot béda ti sistem ngalengkepan kode tradisional dina kamampuhna pikeun ngahasilkeun blok kode cukup kompleks, nepi ka fungsi siap-dijieun disintésis nyokot kana akun konteks ayeuna. GitHub Copilot adaptasi kana cara pamekar nyerat kode sareng merhatikeun API sareng kerangka anu dianggo dina program éta. Salaku conto, upami aya conto struktur JSON dina koméntar, nalika anjeun ngamimitian nyerat fungsi pikeun ngémutan struktur ieu, GitHub Copilot bakal nawiskeun kode anu siap-siap, sareng nalika nyerat daptar rutin pikeun ngulang déskripsi, éta bakal ngahasilkeun sésa-sésa. posisi.

GitHub ngaluncurkeun sistem pembelajaran mesin Copilot anu ngahasilkeun kode

Kamampuhan GitHub Copilot pikeun ngahasilkeun blok kode anu siap-siap parantos nyababkeun kontrovérsi anu aya hubunganana sareng poténsi pelanggaran lisensi copyleft. Nalika ngabentuk modél pembelajaran mesin, téks sumber nyata tina repositori proyék open source anu aya dina GitHub dianggo. Seueur proyék ieu disayogikeun dina lisénsi copyleft, sapertos GPL, anu meryogikeun kodeu karya turunan pikeun disebarkeun dina lisénsi anu cocog. Ku nyelapkeun kode anu aya sakumaha anu disarankeun ku Copilot, pamekar tanpa disadari tiasa ngalanggar lisénsi proyék dimana kodena diinjeum.

Henteu acan écés naha karya anu dihasilkeun ku sistem pembelajaran mesin tiasa dianggap turunan. Patarosan ogé timbul ngeunaan naha modél pembelajaran mesin tunduk kana hak cipta sareng, upami kitu, saha anu gaduh hak-hak ieu sareng kumaha hubunganana sareng hak kana kode anu dumasar kana modél éta.

Di hiji sisi, blok anu dihasilkeun tiasa ngulang petikan téks tina proyék-proyék anu tos aya, tapi di sisi sanésna, sistem nyiptakeun deui struktur kode tinimbang nyalin kodeu sorangan. Numutkeun kana ulikan GitHub, ngan ukur 1% tina waktos rekomendasi Copilot tiasa ngalebetkeun snippét kode tina proyék-proyék anu aya anu panjangna langkung ti 150 karakter. Dina kalolobaan kaayaan, pangulangan lumangsung nalika Copilot teu bisa neuleu nangtukeun konteks atawa nawarkeun solusi standar pikeun masalah.

Pikeun ngahindarkeun substitusi kode anu tos aya, saringan khusus parantos ditambah kana Copilot anu henteu ngamungkinkeun parapatan sareng proyék anu tos aya. Nalika nyetél, pamekar tiasa ngaktipkeun atanapi nganonaktipkeun saringan ieu dina kawijaksanaan na. Diantara masalah anu sanés, aya kamungkinan yén kode anu disintésis tiasa ngulang kasalahan sareng kerentanan anu aya dina kode anu dianggo pikeun ngalatih modél.

sumber: opennet.ru

Tambahkeun komentar