Դատավարություն Microsoft-ի և OpenAI-ի դեմ՝ կապված GitHub Copilot կոդերի գեներատորի հետ

Բաց կոդով տպագրության մշակող Մեթյու Բաթերիքը և Joseph Saveri իրավաբանական ընկերությունը հայց են ներկայացրել (PDF) GitHub-ի Copilot ծառայության մեջ օգտագործվող տեխնոլոգիան ստեղծողների դեմ: Ամբաստանյալների թվում են Microsoft-ը, GitHub-ը և այն ընկերությունները, որոնք վերահսկում են OpenAI նախագիծը, որն արտադրել է OpenAI Codex կոդերի ստեղծման մոդելը, որն ընկած է GitHub Copilot-ի հիմքում: Դատավարությունը փորձում է դատարանին ներգրավել GitHub Copilot-ի նման ծառայությունների ստեղծման օրինականությունը և որոշել, թե արդյոք նման ծառայությունները խախտում են այլ մշակողների իրավունքները:

Մեղադրյալների գործունեությունը համեմատվել է նոր տեսակի ծրագրային հափշտակության ստեղծման հետ, որը հիմնված է գոյություն ունեցող կոդի մանիպուլյացիայի վրա՝ օգտագործելով մեքենայական ուսուցման տեխնիկան և թույլ է տալիս նրանց օգտվել այլ մարդկանց աշխատանքից: Copilot-ի ստեղծումը նաև դիտվում է որպես բաց կոդով ծրագրավորողների աշխատանքի դրամայնացման նոր մեխանիզմի ներդրում, չնայած այն հանգամանքին, որ GitHub-ը նախկինում խոստացել էր երբեք դա չանել:

Հայցվորների դիրքորոշումը հանգում է նրան, որ մեքենայական ուսուցման համակարգի կողմից մշակված կոդի ստեղծման արդյունքը չի կարող մեկնաբանվել որպես սկզբունքորեն նոր և անկախ աշխատանք, քանի որ դա արդեն գոյություն ունեցող ծածկագիրը մշակող ալգորիթմների հետևանք է: Ըստ հայցվորների՝ Copilot-ը վերարտադրում է միայն կոդ, որն ունի ուղղակի հղումներ առկա կոդերին հանրային պահեստներում, և նման մանիպուլյացիաները չեն համապատասխանում արդար օգտագործման չափանիշներին: Այլ կերպ ասած, կոդի սինթեզը GitHub Copilot-ում հայցվորների կողմից դիտվում է որպես գոյություն ունեցող կոդից ածանցյալ ստեղծագործության ստեղծում, որը բաշխվում է որոշակի լիցենզիաների ներքո և ունի կոնկրետ հեղինակներ:

Մասնավորապես, Copilot համակարգը վերապատրաստելիս օգտագործվում է ծածկագիր, որը տարածվում է բաց լիցենզիաների ներքո և շատ դեպքերում պահանջում է հեղինակության մասին ծանուցում (վերագրում): Այս պահանջը չի բավարարվում ստացված կոդը ստեղծելիս, ինչը բաց կոդով լիցենզիաների մեծ մասի ակնհայտ խախտում է, ինչպիսիք են GPL-ը, MIT-ը և Apache-ն: Բացի այդ, Copilot-ը խախտում է GitHub-ի սեփական ծառայության պայմանները և գաղտնիությունը, չի համապատասխանում DMCA-ին, որն արգելում է հեղինակային իրավունքի մասին տեղեկատվության հեռացումը, և CCPA-ին (California Consumer Privacy Act), որը կարգավորում է անձնական տվյալների մշակումը:

Հայցի տեքստում ներկայացված է Copilot-ի գործունեության արդյունքում համայնքին պատճառված վնասի մոտավոր հաշվարկ։ Համաձայն «Թվային հազարամյակի հեղինակային իրավունքի մասին» օրենքի (DMCA) 1202-րդ բաժնի՝ նվազագույն վնասը կազմում է 2500 ԱՄՆ դոլար յուրաքանչյուր խախտման համար: Հաշվի առնելով այն փաստը, որ Copilot ծառայությունն ունի 1.2 միլիոն օգտատեր, և ամեն անգամ ծառայությունն օգտագործելիս տեղի է ունենում DMCA-ի երեք խախտում (վերագրում, հեղինակային իրավունք և լիցենզիայի պայմաններ), ընդհանուր վնասի նվազագույն չափը գնահատվում է 9 միլիարդ դոլար (1200000 * 3): * 2500 դոլար):

Software Freedom Conservancy (SFC) իրավապաշտպան կազմակերպությունը, որը նախկինում քննադատել է GitHub-ը և Copilot-ը, մեկնաբանել է հայցը՝ խորհուրդ տալով չշեղվել իր նախկինում հայտարարված սկզբունքներից մեկից՝ համայնքի շահերը պաշտպանելիս. «համայնքին ուղղված կիրարկումը պետք է. առաջնահերթություն մի տվեք ֆինանսական շահին»: Ըստ SFC-ի՝ Copilot-ի գործողություններն անընդունելի են հիմնականում այն ​​պատճառով, որ դրանք խաթարում են copyleft մեխանիզմը, որն ուղղված է օգտատերերին, մշակողներին և սպառողներին հավասար իրավունքներ ապահովելուն: Copilot-ում ընդգրկված նախագծերից շատերը բաշխվում են հեղինակային իրավունքի լիցենզիաներով, ինչպիսին է GPL-ը, որը պահանջում է ածանցյալ աշխատանքների ծածկագիրը տարածել համատեղելի լիցենզիայի ներքո: Տեղադրելով գոյություն ունեցող կոդը, ինչպես առաջարկվում է Copilot-ի կողմից, ծրագրավորողները կարող են ակամա խախտել նախագծի լիցենզիան, որից վերցվել է կոդը:

Հիշեցնենք, որ ամռանը GitHub-ը գործարկեց նոր կոմերցիոն ծառայություն՝ GitHub Copilot-ը, որը վերապատրաստվել էր GitHub-ի հանրային պահեստներում տեղադրված մի շարք սկզբնաղբյուր տեքստերի վրա և կարող էր ստանդարտ ձևավորումներ ստեղծել կոդ գրելիս: Ծառայությունը կարող է ստեղծել կոդի բավականին բարդ և մեծ բլոկներ՝ ընդհուպ մինչև պատրաստի գործառույթներ, որոնք կարող են կրկնել առկա նախագծերի տեքստային հատվածները։ Ըստ GitHub-ի, համակարգը փորձում է վերստեղծել կոդի կառուցվածքը, այլ ոչ թե ինքն իրեն պատճենել, սակայն դեպքերի մոտավորապես 1%-ի դեպքում առաջարկվող առաջարկությունը կարող է ներառել գոյություն ունեցող նախագծերի կոդի հատվածներ, որոնք ունեն ավելի քան 150 նիշ: Գոյություն ունեցող կոդի փոխարինումը կանխելու համար Copilot-ն ունի ներկառուցված զտիչ, որը ստուգում է խաչմերուկները GitHub-ում տեղակայված նախագծերի հետ, սակայն այս զտիչը ակտիվանում է օգտատիրոջ հայեցողությամբ:

Դատական ​​հայցը ներկայացնելուց երկու օր առաջ GitHub-ը հայտարարեց իր մտադրության մասին 2023 թվականին ներդնելու մի գործառույթ, որը թույլ կտա հետևել Copilot-ում ստեղծված բեկորների և պահեստներում առկա կոդի փոխհարաբերություններին: Մշակողները կկարողանան դիտել նմանատիպ կոդերի ցանկը, որոնք արդեն առկա են հանրային պահեստներում, ինչպես նաև տեսակավորել խաչմերուկներն ըստ ծածկագրի լիցենզիայի և փոփոխման ժամանակի:

Source: opennet.ru

Добавить комментарий