اقدامات قانونی علیه مایکروسافت و OpenAI مربوط به تولید کننده کد GitHub Copilot

متیو باتریک، توسعه‌دهنده تایپوگرافی منبع باز و موسسه حقوقی جوزف ساوری شکایتی (PDF) علیه سازندگان فناوری مورد استفاده در سرویس Copilot GitHub تنظیم کرده‌اند. متهمان شامل مایکروسافت، گیت هاب و شرکت هایی هستند که بر پروژه OpenAI نظارت می کنند، که مدل تولید کد OpenAI Codex را که زیربنای GitHub Copilot است، تولید کردند. این روند تلاش می‌کند دادگاه را در تعیین قانونی بودن ایجاد سرویس‌هایی مانند GitHub Copilot و تعیین اینکه آیا چنین خدماتی حقوق توسعه‌دهندگان دیگر را نقض می‌کند، مشارکت دهد.

فعالیت‌های متهمان با ایجاد نوع جدیدی از سرقت نرم‌افزاری مقایسه شده است که بر اساس دستکاری کدهای موجود با استفاده از تکنیک‌های یادگیری ماشینی و امکان بهره‌مندی از کار افراد دیگر است. ایجاد Copilot همچنین به عنوان معرفی مکانیزم جدید برای کسب درآمد از کار توسعه دهندگان نرم افزار منبع باز تلقی می شود، با وجود این واقعیت که GitHub قبلاً قول داده بود هرگز این کار را انجام ندهد.

موضع شاکیان به این واقعیت خلاصه می شود که نتیجه تولید کد توسط یک سیستم یادگیری ماشینی آموزش دیده بر روی متون منبع در دسترس عموم را نمی توان به عنوان یک کار اساساً جدید و مستقل تفسیر کرد، زیرا این نتیجه الگوریتم هایی است که کدهای موجود را پردازش می کنند. به گفته شاکیان، Copilot فقط کدهایی را بازتولید می کند که به کدهای موجود در مخازن عمومی ارجاع مستقیم دارند و چنین دستکاری هایی تحت معیارهای استفاده منصفانه قرار نمی گیرند. به عبارت دیگر، ترکیب کد در GitHub Copilot توسط شاکیان به عنوان ایجاد یک اثر مشتق شده از کد موجود، توزیع شده تحت مجوزهای خاص و داشتن نویسندگان خاص در نظر گرفته می شود.

به طور خاص، هنگام آموزش سیستم Copilot، از کدی استفاده می شود که تحت مجوزهای باز توزیع می شود و در بیشتر موارد نیاز به اطلاعیه نویسندگی (اسناد) دارد. این الزام در هنگام تولید کد حاصل برآورده نمی شود، که نقض آشکار اکثر مجوزهای منبع باز مانند GPL، MIT و Apache است. علاوه بر این، Copilot شرایط خدمات و حریم خصوصی خود GitHub را نقض می‌کند، با DMCA، که حذف اطلاعات حق نسخه‌برداری را ممنوع می‌کند، و CCPA (قانون حفظ حریم خصوصی مصرف‌کننده کالیفرنیا)، که مدیریت اطلاعات شخصی را تنظیم می‌کند، مطابقت ندارد.

متن دادخواست محاسبه تقریبی از خسارت وارده به جامعه در نتیجه فعالیت های Copilot را ارائه می دهد. طبق بخش 1202 قانون حق نسخه‌برداری هزاره دیجیتال (DMCA)، حداقل خسارت 2500 دلار برای هر تخلف است. با در نظر گرفتن این واقعیت که سرویس Copilot دارای 1.2 میلیون کاربر است و در هر بار استفاده از سرویس، سه تخلف DMCA رخ می دهد (شرایط انتساب، حق چاپ و مجوز)، حداقل میزان خسارت کل 9 میلیارد دلار (1200000 * 3) برآورد شده است. * 2500 دلار).

سازمان حقوق بشر Software Freedom Conservancy (SFC) که قبلاً از GitHub و Copilot انتقاد کرده بود، در مورد این دعوی با توصیه به عدم انحراف از یکی از اصول اعلام شده قبلی در هنگام حفاظت از منافع جامعه اظهار نظر کرد - "اجرای جامعه محور باید منافع مالی را در اولویت قرار ندهید.» طبق گفته SFC، اقدامات Copilot در درجه اول غیرقابل قبول است زیرا مکانیسم کپی لفت را با هدف ارائه حقوق برابر برای کاربران، توسعه دهندگان و مصرف کنندگان تضعیف می کند. بسیاری از پروژه‌های تحت پوشش Copilot تحت مجوزهای کپی‌لفت مانند GPL توزیع می‌شوند که نیازمند توزیع کد آثار مشتق شده تحت یک مجوز سازگار است. با درج کد موجود طبق پیشنهاد Copilot، توسعه دهندگان ممکن است ناخواسته مجوز پروژه ای را که کد از آن قرض گرفته شده است، نقض کنند.

به یاد بیاوریم که در تابستان GitHub یک سرویس تجاری جدید به نام GitHub Copilot راه‌اندازی کرد که بر روی مجموعه‌ای از متون منبع ارسال شده در مخازن عمومی GitHub آموزش دید و قادر به ایجاد طرح‌های استاندارد هنگام نوشتن کد بود. این سرویس می‌تواند بلوک‌های بسیار پیچیده و بزرگی از کد تولید کند، تا توابع آماده‌ای که می‌توانند متن‌های پروژه‌های موجود را تکرار کنند. طبق گفته GitHub، سیستم به جای کپی کردن خود کد، سعی می کند ساختار کد را بازسازی کند، با این حال، تقریباً در 1٪ موارد، توصیه پیشنهادی ممکن است شامل قطعه کد پروژه های موجود با بیش از 150 کاراکتر باشد. برای جلوگیری از جایگزینی کدهای موجود، Copilot دارای یک فیلتر داخلی است که تقاطعات با پروژه های میزبانی شده در GitHub را بررسی می کند، اما این فیلتر به صلاحدید کاربر فعال می شود.

دو روز قبل از طرح شکایت، GitHub قصد خود را برای پیاده‌سازی ویژگی در سال 2023 اعلام کرد که امکان ردیابی رابطه بین قطعات تولید شده در Copilot و کدهای موجود در مخازن را فراهم می‌کند. توسعه‌دهندگان می‌توانند فهرستی از کدهای مشابه را که قبلاً در مخازن عمومی موجود است، مشاهده کنند و همچنین تقاطع‌ها را بر اساس مجوز کد و زمان اصلاح مرتب کنند.

منبع: opennet.ru

اضافه کردن نظر