GitHub Copilot コード ジェネレーターに関連する Microsoft および OpenAI に対する訴訟

オープンソースのタイポグラフィ開発者Matthew Butterick氏とJoseph Saveri法律事務所は、GitHubのCopilotサービスで使用されている技術の開発者に対して訴訟を起こした(PDF)。 被告には、Microsoft、GitHub、および GitHub Copilot の基礎となる OpenAI Codex コード生成モデルを作成した OpenAI プロジェクトを監督する企業が含まれます。 この訴訟では、GitHub Copilot のようなサービスの作成の合法性の判断、およびそのようなサービスが他の開発者の権利を侵害しているかどうかの判断に裁判所が関与しようとしています。

被告らの活動は、機械学習技術を使用した既存のコードの操作に基づいて、他人の著作物から利益を得ることを可能にする、新しいタイプのソフトウェア著作権侵害の作成と比較されてきました。 Copilot の創設は、GitHub がこれまで決してそんなことはしないと約束していたにもかかわらず、オープンソース ソフトウェア開発者の仕事を収益化するための新しいメカニズムの導入とも見なされています。

原告らの立場は要約すると、公的に入手可能なソーステキストに基づいて訓練された機械学習システムによるコード生成の結果は、既存のコードを処理するアルゴリズムの結果であるため、根本的に新しい独立した著作物として解釈することはできないという事実にある。 原告らによると、Copilot はパブリックリポジトリ内の既存のコードを直接参照するコードのみを複製しており、そのような操作はフェアユースの基準には該当しないという。 言い換えれば、原告らは、GitHub Copilot でのコード合成は、特定のライセンスに基づいて配布され、特定の作成者が所属する既存のコードから派生著作物を作成するものとみなされます。

特に、Copilot システムをトレーニングする場合、オープン ライセンスの下で配布されるコードが使用され、ほとんどの場合、作成者の通知 (帰属) が必要になります。 この要件は、結果のコードを生成するときに満たされません。これは、GPL、MIT、Apache などのほとんどのオープン ソース ライセンスに対する明らかな違反です。 さらに、CopilotはGitHub独自の利用規約やプライバシーに違反しており、著作権情報の削除を禁止するDMCAや個人データの取り扱いを規制するCCPA(カリフォルニア州消費者プライバシー法)にも準拠していない。

訴状には、副操縦士の活動の結果として地域社会に生じた損害の概算額が記載されている。 デジタル ミレニアム著作権法 (DMCA) の第 1202 条に従い、最低損害賠償額は侵害 2500 件につき 1.2 ドルです。 Copilot サービスのユーザー数は 9 万人で、サービスを利用するたびに 1200000 つの DMCA 違反(帰属、著作権、ライセンス条項)が発生することを考慮すると、被害総額は最小で 3 億ドル(2500 *XNUMX)と見積もられます。 * XNUMX ドル)。

以前に GitHub と Copilot を批判してきた人権団体 Software Freedom Conservancy (SFC) は、この訴訟についてコメントし、コミュニティの利益を保護する際に以前に述べた原則の XNUMX つから逸脱しないよう勧告した。経済的利益を優先しないでください。」 SFCによると、Copilotの行為は主に、ユーザー、開発者、消費者に平等の権利を提供することを目的としたコピーレフトの仕組みを損なうものであるため、容認できないとしている。 Copilot で取り上げられているプロジェクトの多くは、GPL などのコピーレフト ライセンスに基づいて配布されており、派生著作物のコードは互換性のあるライセンスに基づいて配布する必要があります。 Copilot の提案に従って既存のコードを挿入すると、開発者はコードを借用したプロジェクトのライセンスを知らず知らずのうちに違反してしまう可能性があります。

夏に GitHub が新しい商用サービス GitHub Copilot を開始したことを思い出してください。このサービスは、公開 GitHub リポジトリに投稿された一連のソース テキストでトレーニングされ、コードを記述するときに標準設計を生成できます。 このサービスは、既存のプロジェクトのテキストの一節を繰り返すことができる既製の関数に至るまで、非常に複雑で大きなコード ブロックを生成できます。 GitHub によると、システムはコード自体をコピーするのではなく、コードの構造を再作成しようとしますが、約 1% の場合、提案された推奨事項には 150 文字を超える既存プロジェクトのコード スニペットが含まれる可能性があります。 既存のコードの置き換えを防ぐために、Copilot には GitHub でホストされているプロジェクトとの交差をチェックする組み込みフィルターがありますが、このフィルターはユーザーの裁量でアクティブ化されます。

訴訟が起こされる2023日前に、GitHubは、Copilotで生成されたフラグメントとリポジトリ内の既存のコードとの関係を追跡できる機能をXNUMX年に実装する意向を発表した。 開発者は、パブリック リポジトリにすでに存在する同様のコードのリストを表示したり、コード ライセンスや変更時期によって交差部分を並べ替えたりできるようになります。

出所: オープンネット.ru

コメントを追加します