ARTDEPARTMENT

Solicitar una consulta

OpenAI ha utilizado con descaro millones de datos de Internet para entrenar a su IA. Ahora acusa a DeepSeek de robarles a ellos

Publicado el 
enero 29, 2025

Los modelos de inteligencia fabricado de DeepSeek han llamado la atención por su rendimiento equiparable al de gigantes como ChatGPT, Claude o Gemini. Sin bloqueo, su éxito ha despertado tanto elogios como incredulidad. En primer extensión, algunos cuestionan que su explicación haya costado solo 5,6 millones de dólares. Ahora, OpenAI ha emprendedor una nueva acusación contra la compañía: el uso no facultado de sus datos mediante una técnica conocida como "destilado de modelos".

En el ámbito de la inteligencia fabricado, la destilación es una organización utilizada para optimizar modelos. Consiste en entrenar un maniquí más pequeño (con menos parámetros, y en líneas generales menos capaz), a partir de la información de un maniquí más excelso y reformista. De este modo, se logra un sistema más válido y rápido sin comprometer significativamente su rendimiento. Portavoces de OpenAI han especificado al medio Financial Times que DeepSeek habría utilizado esta técnica con los modelos de OpenAI.

Quién roba a quién...

DeepSeek ha empleado esta técnica, inmediato con otras como el formación por refuerzo para alcanzar su parada nivel de desempeño, o su bloque 'Mixture of Experts', la cual le permite al maniquí utilizar solamente un pequeño subset de sus componentes (‘experts’) para cada tarea, en vez de hacer trabajar a todo el sistema al completo, reduciendo significativamente los costes energéticos y potencia de computación.

El problema radica en que OpenAI prohíbe expresamente el uso de sus modelos con fines de destilación. Sus términos de servicio establecen que no se puede copiar sus servicios ni invertir las respuestas generadas por sus modelos para desarrollar sistemas que compitan con ellos. Según información publicada por Bloomberg, OpenAI y Microsoft ya investigaron en el pasado a DeepSeek por presuntas violaciones a estas normas. Se sospecha que los desarrolladores de DeepSeek utilizaron la API de OpenAI para realizar destilación de modelos, lo que habría infringido estas condiciones.

El éxito de DeepSeek es una lección para millones de empresas: han apostado todo por la Generación Z, con poca experiencia

David Sacks, figura destacada en el ámbito de la inteligencia fabricado adentro del equipo de Donald Trump, afirmó que hay pruebas de que DeepSeek ha empleado datos de OpenAI. Desde la empresa liderada por Sam Altman aseguran que varias compañías, especialmente en China, intentan constantemente replicar modelos de las principales firmas de IA de Estados Unidos.

No obstante, esta inculpación genera un debate sobre la doble honesto en la industria. OpenAI ha sido señalada por utilizar grandes volúmenes de datos de internet sin autorización, incluyendo la transcripción de millones de horas de contenido de YouTube para entrenar GPT-4. La investigadora Timnit Gebru, conocida por su enfrentamiento con Google en temas éticos de IA, ha criticado a OpenAI por exigir respeto a sus propias reglas cuando, a su motivo, no ha respetado las de otros.

El conflicto no es exclusivo de OpenAI y DeepSeek. Varias empresas de inteligencia fabricado han sido acusadas de entrenar modelos con contenido manifiesto sin consentimiento de los creadores. Muchas de ellas justifican esta ejercicio bajo el concepto de "uso puntual", pero la columna entre lo permitido y lo ilícito sigue siendo difusa. Esto ha generado un muchedumbre de demandas por posibles infracciones de derechos de autor, lo que pone en evidencia la carencia de una regulación clara y equitativa en el sector.

Imagen de portada | DeepSeek, Xataka con Mockuuups Studio

En Genbeta | El CEO de OpenAI por fin se pronuncia sobre DeepSeek: “Lanzaremos modelos mucho mejores”

Source link

Compartir este artículo

[social_warfare]

Consultoria Personalizada

¡Si aun no tienes presencia en internet o 
necesitas ayuda con tus proyectos, por favor, escribenos!

Enviar Consulta Gratis

Más para leer

En ARTDEPARTMENT nos especializamos en brindar soluciones para que tu negocio, empresa o proyecto sea visible en internet.

Diseño WEB

Hosting

Google Ads

WordPress

Posicionamiento SEO

cloud-syncearthbullhorn linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram