Meta entrenó a su chatbot usando libros con copyright sacados de una web de descargas. Y todo con el visto bueno de Zuckerberg

Publicado el

enero 10, 2025

En los últimos meses, Meta, la compañía liderada por Mark Zuckerberg, se ha gastado envuelta en una controversia (bueno, en dos, si contamos con la nuevo polémica sobre la moderación de contenido). Respecto al caso que nos interesa, documentos recientemente desclasificados en el caso Kadrey vs. Meta revelan que la empresa habría utilizado obras protegidas por derechos de autor...

...provenientes de Library Genesis, una plataforma conocida por la distribución no autorizada de libros, todo con el fin de entrenar con sus contenidos al maniquí de idioma para chatbots desarrollado por Meta: LlaMa.

Para los demandantes del caso Kadrey (incluido el propio novelista Richard Kadrey y otros autores como Sarah Silverman y Ta-Nehisi Coates) la utilización de esta pulvínulo de datos por parte de Meta representa una violación evidente de sus derechos.

Pero, ¿qué es LibGen?

Library Genesis, conocida popularmente como 'LibGen', es un motor de búsqueda que facilita el golpe de balde a libros, artículos científicos y otros contenidos protegidos por derechos de autor. Aunque su golpe ha sido bloqueado en varios países y se ha enfrentado a múltiples demandas judiciales, LibGen sigue operando mediante dominios alternativos, a imagen y dependencia de Sci-Hub o Z-Library.

Zuckerberg, el CEO en el ojo del huracán

Los documentos legales señalan que Meta no solo accedió al contenido pirateado, sino que igualmente eliminó deliberadamente las etiquetas de derechos de autor, incluidos metadatos y símbolos de copyright, de los materiales utilizados. Esta entusiasmo habría permitido entrenar los modelos LlaMa sin alertar a usuarios o reguladores sobre la naturaleza de los datos empleados.

Pero quizá una de las revelaciones más impactantes sea que el propio Mark Zuckerberg aprobó el uso de LibGen a pesar de las preocupaciones expresadas por algunos miembros del equipo de inteligencia industrial de Meta. Sin confiscación, las advertencias sobre cómo esta organización podría socavar la posición negociadora de Meta delante reguladores no disuadieron al CEO de dar luz verde al esquema.

Un Premio Pulitzer acusa a ChatGPT y LLaMa de violar sus derechos de autor extrayendo contenidos de las "bibliotecas fantasma"

Por otra parte, Meta habría recurrido al uso de torrents para descargar los contenidos de LibGen. Este método, que implica compartir archivos a través de redes descentralizadas, convirtió a la compañía en un nodo más de distribución de contenido protegido, exacerbando las acusaciones de violación de derechos de autor.

La defensa de Meta: ¿'uso acordado' o exceso de la ley?

Meta ha defendido sus prácticas argumentando que el uso de los materiales se encuentra amparado bajo el principio de 'uso acordado' ('fair use') contemplado en la reglamento estadounidense. Sin confiscación, este argumento ha sido cuestionado, ya que Meta no solo utilizó las obras sin permiso, sino que igualmente implementó medidas para encubrir su origen ilegal.

Casos previos ofrecen un panorama fósforo sobre la efectividad de esta defensa. En 2023, un tribunal desestimó demandas similares contra Meta, argumentando que los demandantes no pudieron demostrar daños claros. Sin confiscación, en esta ocasión, la magnitud y la intención detrás de las acciones de Meta podrían inclinar la peso en contra de la empresa.

Una experiencia popular en la industria

Si adecuadamente Meta está en el ojo del huracán, no es la única empresa tecnológica acusada de consumir contenido protegido sin autorización para entrenar sus modelos de IA: OpenAI, Google y otras compañías han enfrentado demandas similares. En algunos casos, estas empresas han comenzado a negociar acuerdos con editoriales y creadores para finalizar sus contenidos, marcando un posible cambio en las dinámicas de esta industria.

El problema, no obstante, radica en la voraz menester de datos para impulsar y mejorar los modelos de inteligencia industrial. Este apetito insaciable ha llevado a prácticas cuestionables, desde el uso de libros pirateados hasta la procedencia masiva de contenido de plataformas públicas como YouTube e incluso fotografías privadas publicadas en redes sociales.

Imagen | Marcos Merino mediante IA

En Genbeta | Qué fue de Alexandra Elbakyan, la 'Robin Hood' que puso patas hacia lo alto la ciencia con Sci-Hub, una Z-Library de 'papers'

Source link

Compartir este artículo

[social_warfare]

Consultoria Personalizada

¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!

Enviar Consulta Gratis

Más para leer

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

En ARTDEPARTMENT nos especializamos en brindar soluciones para que tu negocio, empresa o proyecto sea visible en internet.

Meta entrenó a su chatbot usando libros con copyright sacados de una web de descargas. Y todo con el visto bueno de Zuckerberg

Pero, ¿qué es LibGen?

Zuckerberg, el CEO en el ojo del huracán

La defensa de Meta: ¿'uso acordado' o exceso de la ley?

Una experiencia popular en la industria

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

Diseño WEB

Hosting

Google Ads

WordPress

Posicionamiento SEO

Nuestras Redes

Meta entrenó a su chatbot usando libros con copyright sacados de una web de descargas. Y todo con el visto bueno de Zuckerberg

Pero, ¿qué es LibGen?

Zuckerberg, el CEO en el ojo del huracán

La defensa de Meta: ¿'uso acordado' o exceso de la ley?

Una experiencia popular en la industria

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

Por favor, complete este formulario, a la brevedad no estaremos contactando con usted.

Diseño WEB

Hosting

Google Ads

WordPress

Posicionamiento SEO

Nuestras Redes