ARTDEPARTMENT

Solicitar una consulta

bloquea el acceso a quien archiva la historia de la web

Publicado el 
agosto 15, 2025

Reddit afirma que empresas de IA han extraído datos de Wayback Machine, por lo que limitará el entrada a esta reconocida utensilio. Su objetivo será impedir que Internet Archive indexe la gran mayoría de la información de Reddit lo que se traduce a que ya no podrá rastrear páginas de detalles de publicaciones, comentarios ni perfiles.

En cambio, solo podrá indexar la página principal de Reddit.com, lo que significa que Internet Archive solo podrá registrar información sobre los titulares y publicaciones más populares en un día determinado.

Cómo ver la versión antigua de una web con Archive.org y la caché de Google

La encargo de Internet Archive es suministrar un archivo digital de sitios web en internet y otros temas culturales, y Wayback Machine es una utensilio que permite consultar las páginas tal como aparecieron en determinadas fechas. Se ha aguado como la máquina del tiempo de internet.

Quejas a cómo se hace este archivo

El portavoz de Reddit, Tim Rathschmidt ha relatado a The Verge que "Internet Archive ofrece un servicio a la web abierta, pero hemos tenido conocimiento de casos en los que empresas de IA infringen las políticas de la plataforma, incluida la nuestra, y extraen datos de Wayback Machine", declaró.

Y es que Reddit cree que no todo su contenido debería archivarse de esa modo: "Hasta que puedan defender su sitio y cumplir con las políticas de la plataforma (por ejemplo, respetar la privacidad del afortunado o eliminar contenido eliminado), estamos limitando parte de su entrada a los datos de Reddit para proteger a los redditors", ha explicado Rathschmidt.

Los límites han comenzado a aumentar gradualmente desde hace un par de días y seguirán. Por otra parte, Reddit ha dicho suceder contactado con Internet Archive con delantera para informarles sobre esta valentía.

Derecho al ¿olvido?

Afirma que Reddit todavía ha expresado su preocupación por la capacidad de las personas para extraer contenido de Internet Archive en el pasado. Esta plataforma permite a usuarios presentar sus quejas y frustraciones y todavía alegrías y solicitar consejo. Y mucha gentío acaba eliminando las publicaciones tras un tiempo. Muchas veces, puede ser, porque ya han manido los comentarios de la gentío, ya han recibido ideas y consejos...

Por otra parte, Reddit decidió hace tiempo cortar el entrada a herramientas de procedencia de datos, ya que las empresas de IA las usan masivamente sin permiso (a veces mintiendo, como ya hemos manido). Aunque sí que están en disposición de proporcionar esos datos si las empresas de IA pagan (de hecho se descubrió en el pasado de que ya lo han hecho).

Reddit ha vendido todo su contenido para entrenar a una IA: ahora sabemos que Google ha sido el comprador

El año pasado, Reddit llegó a un acuerdo con Google para la Búsqueda de Google y los datos de entrenamiento de IA a principios del año pasado, y unos meses a posteriori, comenzó a impedir que los principales motores de búsqueda rastrearan sus datos a menos que pagaran, como recuerda The Verge.

Hace unas semanas, Reddit acusó a Anthropic de usar sus datos para entrenar su IA más  de 100.000 veces a posteriori de aseverar que habían dejado de hacerlo. Al mismo tiempo, se ha probado que Anthropic contrató a un ex directivo de Google Books para comprar "todos los libros del mundo" y usarlos para entrenar IA y luego deshacerse de esos libros.

Imagen | Foto de Brett Jordan en Unsplash

Source link

Compartir este artículo

[social_warfare]

Consultoria Personalizada

¡Si aun no tienes presencia en internet o 
necesitas ayuda con tus proyectos, por favor, escribenos!

Enviar Consulta Gratis

Más para leer

En ARTDEPARTMENT nos especializamos en brindar soluciones para que tu negocio, empresa o proyecto sea visible en internet.

Diseño WEB

Hosting

Google Ads

WordPress

Posicionamiento SEO

cloud-syncearthbullhorn linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram