GitHub-ek kodea sortzen duen Copilot machine learning sistema jarri zuen martxan

GitHub-ek GitHub Copilot laguntzaile adimendunaren probak amaitu zirela iragarri zuen, kodea idaztean eraikuntza estandarrak sortzeko gai dena. Sistema OpenAI proiektuarekin batera garatu zen eta OpenAI Codex ikasketa automatikoko plataforma erabiltzen du, GitHub biltegi publikoetan ostatatutako iturburu-kode sorta handi batean trebatua. Zerbitzua doakoa da kode irekiko proiektu ezagunen eta ikasleentzat. Beste erabiltzaile-kategorientzat, GitHub Copilot-erako sarbidea ordaintzen da (10 $ hilean edo $ 100 urtean), baina doako probarako sarbidea ematen da 60 egunez.

Kodea sortzea Python, JavaScript, TypeScript, Ruby, Go, C# eta C++ programazio lengoaietan onartzen da hainbat esparru erabiliz. Moduluak eskuragarri daude GitHub Copilot Neovim, JetBrains IDE, Visual Studio eta Visual Studio Code garapen-inguruneekin integratzeko. Probetan jasotako telemetriaren arabera, zerbitzuak nahiko kalitate handiko kodea sortzeko aukera ematen du; adibidez, GitHub Copilot-en proposatutako gomendioen % 26 garatzaileek bere horretan onartu zuten.

GitHub Copilot kode-osaketa-sistemetatik bereizten da kode bloke nahiko konplexuak sortzeko gaitasunagatik, egungo testuingurua kontuan hartuta sintetizatutako prest egindako funtzioetaraino. GitHub Copilot garatzaileak kodea idazteko modura egokitzen da eta programan erabiltzen diren APIak eta esparruak hartzen ditu kontuan. Adibidez, iruzkin batean JSON egitura baten adibide bat badago, egitura hau analizatzeko funtzio bat idazten hasten zarenean, GitHub Copilotek prest egindako kodea eskainiko du, eta deskribapen errepikatuen zerrendak idaztean, gainerakoak sortuko ditu. posizioak.

GitHub-ek kodea sortzen duen Copilot machine learning sistema jarri zuen martxan

GitHub Copilot-ek prest egindako kode blokeak sortzeko gaitasunak eztabaida sortu du copyleft lizentzien urraketa potentzialekin lotutako polemika. Ikaskuntza automatikoaren eredua osatzerakoan, GitHub-en kokatutako kode irekiko proiektuen biltegietako benetako iturri-testuak erabili ziren. Proiektu horietako asko copyleft lizentzien bidez ematen dira, GPL adibidez, lan eratorrien kodea lizentzia bateragarri baten arabera banatzea eskatzen baitute. Copilotek iradokitako lehendik dagoen kodea txertatuz, garatzaileek nahi gabe urra dezakete kodea mailegatu zen proiektuaren lizentzia.

Oraindik ez dago argi ikaskuntza automatikoko sistema batek sortutako lana deribatutzat har daitekeen. Gainera, galderak sortzen dira ikaskuntza automatikoko eredu bat egile-eskubideen menpe dagoen ala ez eta, hala bada, eskubide horien jabea zein den eta eredua eraiki den kodearen eskubideekin nola erlazionatzen diren jakiteko.

Alde batetik, sortutako blokeek lehendik dauden proiektuetako testu pasarteak errepika ditzakete, baina, bestetik, sistemak kodearen egitura birsortzen du kodea bera kopiatu beharrean. GitHub-en azterketa baten arabera, Copilot-en gomendioen % 1ek soilik izan ditzake lehendik dauden proiektuetako kode zatiak 150 karaktere baino gehiago dituztenak. Egoera gehienetan, errepikapenak gertatzen dira Copilotek testuingurua behar bezala zehaztu ezin duenean edo arazo bati irtenbide estandarrak eskaintzen dizkionean.

Lehendik dagoen kodea ordezkatzea saihesteko, lehendik dauden proiektuekin gurutzaketak onartzen ez dituen iragazki berezi bat gehitu zaio Copilot-i. Konfiguratzerakoan, garatzaileak iragazki hau aktibatu edo desgaitu dezake bere erabakian. Beste arazo batzuen artean, sintetizatutako kodeak eredua entrenatzeko erabiltzen den kodean dauden akatsak eta ahultasunak errepikatzeko aukera dago.

Iturria: opennet.ru

Gehitu iruzkin berria