Dan Blanchard, desarrollador de la biblioteca chardet para la detección de codificación de caracteres en Python, ha publicado una nueva versión de la biblioteca bajo una nueva licencia. La versión 7.0 utiliza la licencia MIT en lugar de la LGPL. El desarrollador afirma que el asistente de inteligencia artificial Anthropic Claude, ahora incluido como colaborador, reescribió la biblioteca sin usar el código original, lo que le permitió reemplazar la licencia copyleft por una permisiva.
Un usuario que se identificó como Mark Pilgrim, el creador original de la biblioteca (desafortunadamente, la cuenta de este usuario está vacía y es imposible verificar si es quien dice ser) se unió a la discusión de esta acción y creó un problema en el que afirma que Dan no tiene derecho a cambiar la licencia del proyecto.
Dan replicó que había comparado las versiones 7.0.0 y 6.0.0 con una biblioteca de detección de plagio, y que la similitud entre ambas era inferior al 1.3 %. Afirmó que ningún archivo del código base de la versión 7.0.0 se parecía en estructura a ningún archivo de ninguna versión anterior.
Dan explicó que quería que la biblioteca chardet se incluyera en la biblioteca estándar de Python, ya que es una dependencia clave para muchos proyectos de Python. Sin embargo, tres obstáculos obstaculizaban la integración: licencias, velocidad y precisión. Como resultado de este trabajo, la velocidad de detección de codificación de la biblioteca se ha multiplicado por 48. Para un proyecto que muchos otros utilizan activamente, esta optimización supondrá una mejora significativa del rendimiento para millones de usuarios (el paquete se descarga aproximadamente 130 millones de veces al mes).
Zoe Kooyman, directora ejecutiva de la Free Software Foundation, dijo a The Register: "No podemos comentar sobre los detalles específicos ni la legalidad de este proyecto sin realizar más investigaciones o consultar con un asesor legal, pero no hay nada 'limpio' en un modelo de lenguaje grande (LLM) que utiliza código que se le pide reescribir".
Zoe, sin embargo, decidió ofrecer una evaluación moral de las acciones de Dan: «En cuanto al significado de la GPL, una licencia permisiva técnicamente sigue siendo una licencia de software libre, pero socavar el copyleft es un acto grave. Negarse a conceder a otros los derechos que uno se ha ganado como usuario es profundamente antisocial, independientemente del método utilizado».
Bruce Perens, autor de la definición original de código abierto, expresó su preocupación por la situación actual: “Los cambios sociales que se avecinan son igualmente masivos y, como ya estamos viendo, aún más aterradores”.
Las consecuencias legales de usar un modelo de lenguaje extenso para reelaborar proyectos tanto de código abierto como propietarios (de los cuales se extrajo el código fuente) son difíciles de predecir y dependen en gran medida de la jurisprudencia. Sin embargo, si un modelo de lenguaje extenso reescribe código en un lenguaje de programación diferente al original, demostrar la creación de una obra derivada se vuelve prácticamente imposible.
Recientemente, la Corte Suprema de Estados Unidos se negó a revisar el caso Thaler contra Perlmutter, en el que el demandante pretendía revocar la sentencia de un tribunal inferior que le impedía registrar una imagen creada mediante inteligencia artificial. La Corte Suprema confirmó la sentencia del tribunal inferior, que establecía que las obras creadas íntegramente por IA no están sujetas a derechos de autor.
Fuente: opennet.ru
