Distintos escritores; desde periodistas hasta autores como George R. R. Martin (“Game of Thrones”) han denunciado el uso de contenidos ajenos (no consentidos) para el entrenamiento de chatbots de distintas desarrolladoras.
A continuación, exploraremos dos grandes casos donde el conflicto recae en el cruce entre derechos de autor y el desarrollo de la Inteligencia Artificial. En primer lugar, nos adentraremos en la demanda del New York Times contra OpenIA y Microsoft, creadores de ChatGPT. Luego, examinaremos la acción legal emprendida por un grupo de autores de libros contra NVIDIA, por entrenar a chatbots personalizados a partir de un conjunto de datos que copiaba y distribuía ilegalmente sus textos.
New York Times vs. ChatGPT

Foto: Unsplash
La demanda realizada a fines del año pasado, explica que OpenAI y Microsoft, replicaron un volumen masivo del contenido protegido por derechos de autor del Times sin ningún tipo de licencia o compensación. Se afirma que estas obras fueron copiadas e ingeridas repetidamente para entrenar los modelos GPT de OpenAI.
A pesar de esto, durante el último año, las búsquedas de la aplicación ChatGPT a través de Google han sólo aumentado al rededor de todo el mundo y siguen haciéndolo, por usuarios que probablemente desconocen esta demanda.
(Si no puedes ver el gráfico, haz click aquí)
Por su parte, la ‘startup’ dirigida por Sam Altman reconoció en un documento dirigido al Parlamento de Reino Unido en enero de este año, que “sería imposible entrenar los modelos actuales de IA sin material con derechos de autor“. La compañía asegura que no recurrir a esas obras produciría sistemas de IA deficientes. “Limitar los datos de entrenamiento a libros de dominio público y dibujos creados hace más de un siglo podría dar lugar a un experimento interesante, pero no proporcionaría sistemas de IA que satisfagan las necesidades de los ciudadanos de hoy“, explicaron.
Novelistas vs. NVIDIA

Foto: Unsplash
Nvidia Corporation es una empresa de software y fabless que impulsa avances en IA, HPC, juegos, diseño creativo, vehículos autónomos y robótica.
En una demanda colectiva, los autores Abdi Nazemian (Like a Love Story), Brian Keene (Ghost Walk) y Stewart O’Nan (Last Night at the Lobster) argumentaron que NVIDIA debía pagar una indemnización por daños y perjuicios, así como destruir todas las copias del conjunto de datos Books3 utilizado para para potenciar chatbots personalizados.
Según los novelistas, el conjunto de datos Books3 copiaba una biblioteca clandestina de aproximadamente 196,640 libros pirateados. Inicialmente compartido a través de la comunidad interesada en la IA del sitio web Hugging Face, el conjunto de datos Books3 “desapareció y ya no se puede acceder [a él] debido a una infracción de derechos de autor reportada”, según Hugging Face.
Según los autores, retiró el conjunto de datos no antes de que compañías de IA como NVIDIA se apropiaran de él e “hicieran múltiples copias”. Por entrenar modelos de NeMo con este conjunto, los novelistas sostuvieron que NVIDIA “violó sus derechos exclusivos en virtud de la Ley de Derechos de Autor (EEUU).
Por su parte, un portavoz de NVIDIA dijo a The Wall Street Journal que “respetamos los derechos de todos los creadores de contenido y somos de la idea de que creamos NeMo cumpliendo plenamente con la ley de derechos de autor“.
Conflictos en un nuevo panorama
El entrenamiento de Inteligencia Artificial plantea una serie de dilemas éticos y legales que reflejan la complejidad de la intersección entre la innovación tecnológica y la protección de la propiedad intelectual. Dilemas que actualmente pasamos por alto al usar libre y confiadamente información proveniente de chatbots, pues es un fenómeno muy reciente como para conocer e incluso dimensionar sus consecuencias.
Sin embargo, según afirman Wired y Fairly Trained, es posible entrenar a Inteligencia Artificial sin infringir derechos de autor. Lee más al respecto aquí.