Licenza copyleft CCAI, che consente l'uso nella formazione di modelli di intelligenza artificiale

Un gruppo di ricercatori dell'Università di Yale ha proposto (PDF) un nuovo tipo di licenza aperta, CCAI (Contextual Copyleft), che estende l'applicazione del copyleft ai modelli di intelligenza artificiale generativa. L'idea alla base di CCAI è che l'utilizzo di contenuti con questa licenza come dati di apprendimento automatico estenda i termini del copyleft ai modelli di intelligenza artificiale generativa risultanti. Si ritiene che la nuova licenza possa contribuire a ridurre gli abusi nei progetti di intelligenza artificiale e a prevenire l'emergere di modelli di intelligenza artificiale fraudolenti che vengono formalmente presentati come open source ma, a causa dell'occultamento dei dati sorgente e degli strumenti di addestramento, sono vincolati al produttore.

Il CCAI richiede che qualsiasi distribuzione e pubblicazione di copie esatte o di opere derivate modificate concesse in licenza ai sensi del CCAI debba avvenire secondo gli stessi termini di licenza, senza ulteriori restrizioni. Questo requisito si applica a qualsiasi modello di intelligenza artificiale, set di dati o sistema di intelligenza artificiale addestrato utilizzando software con licenza CCAI o il suo output. Nel contesto dell'addestramento di modelli di intelligenza artificiale generativa, il CCAI richiede la divulgazione del codice sorgente del modello, una descrizione dettagliata dei dati utilizzati nell'addestramento, dei parametri, dei pesi e dell'architettura del modello.

La licenza CCAI può anche essere utilizzata come requisito aggiuntivo per le licenze copyleft esistenti, come AGPLv3. Questo requisito estende la copertura della licenza a set di dati di training, codice modello e pesi, in conformità con i criteri dell'Open Source Initiative (OSI) per i sistemi di intelligenza artificiale aperti. Il codice distribuito con questa licenza può essere utilizzato per addestrare un modello di intelligenza artificiale solo se a tutti gli utenti viene fornita una descrizione del set di dati di training, del codice di training del modello e del modello di intelligenza artificiale addestrato.

Il testo del requisito aggiuntivo allegato recita: "Quando si utilizza un software per addestrare, ottimizzare o creare un modello di apprendimento automatico o un sistema di intelligenza artificiale generativa, qualsiasi modello, set di dati o sistema risultante deve essere reso pubblico a condizioni che non estendano i requisiti di questa licenza. Questo requisito include la messa a disposizione del codice di addestramento, dei dati utilizzati per l'addestramento, dei parametri e dell'architettura del modello. Rendere disponibile il modello o il suo output su Internet è considerato distribuzione e costituisce motivo per adempiere agli obblighi imposti dalla licenza."

Fonte: opennet.ru