
ARTDEPARTMENT

Muchos habían poliedro por hecho que los avances de rendimiento mostrados por DeepSeek se basaban en el uso del tipificado CUDA (Compute Unified Device Architecture) de NVIDIA, pero los ingenieros de la compañía han optado por prescindir del mismo y utilizar en su ocasión PTX (Parallel Thread Execution), un jerga de bajo nivel que se asemeja al ensamblador.
Este enfoque ha sido secreto para el éxito de sus últimos modelos de IA, ya que ha permitido que funcionen de modo mucho eficaz a pesar de las restricciones impuestas por las sanciones internacionales a las empresas chinas, que han escaso el acercamiento a las GPUs más avanzadas de NVIDIA, como la H100.
La carrera de programador en 2017 y en el futuro (con Javier Santana)
CUDA ha sido el tipificado de facto en el progreso de software para sus GPUs durante primaveras. Esta utensilio aglutina un compilador y un conjunto de herramientas de progreso que permiten a los programadores interactuar fácilmente con el hardware de las GPUs de NVIDIA, facilitando la creación de modelos de IA potentes y escalables.
En contraste, PTX es un jerga de bajo nivel (desarrollado además por NVIDIA) que facilita usar de forma más eficaz los posibles, pero que al ser más cercano al ensamblador, requiere un conocimiento más profundo y habilidades más avanzadas para utilizar todo su potencial.

PTX permite optimizaciones minuciosas, pero requiere un conocimiento profundo del hardware
Algunos han sugerido que el uso de PTX por parte de Deepseek podría excoriar la dependencia de CUDA, debilitando la delantera competitiva de NVIDIA en el ecosistema de GPUs. Sin bloqueo, expertos como Ian Cutress consideran que esta interpretación es errónea:


Si antiguamente comparábamos PTX con ensamblador, una igualdad ilustrativa sería comparar CUDA con C: mientras que el ensamblador puede ofrecer un rendimiento superior en manos de un programador experimentado, la mayoría de la industria prefiere trabajar con C oportuno a su permanencia entre facilidad de uso y eficiencia.
El hecho de que Deepseek haya empleado PTX no implica que la industria en genérico vaya a adoptar este enfoque de modo masiva: según Cutress, el amplio de los desarrolladores seguirá utilizando CUDA o alternativas de detención nivel compatibles con este entorno. PTX seguirá siendo una utensilio para aquellos que buscan exprimir hasta el final 10-20% de rendimiento en cargas de trabajo específicas.
Imagen |
En Genbeta | Nvidia ha comprado un software por 700 millones de dólares y lo liberará como open source: hay toda una organización tras la intrepidez
En Genbeta | Nvidia ya sabe qué viene "posteriormente de la IA": va a suponer cachas por una industria que ve cercano su 'momento ChatGPT'
Compartir este artículo
Consultoria Personalizada
¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!