La startup de inteligencia artificial china DeepSeek confirmó que utilizará chips de IA de Huawei en lugar de Nvidia para entrenar modelos de IA pequeños. Si bien la compañía consideró usar el procesador Ascend para su modelo de razonamiento de IA de próxima generación, podría descartar este plan por el momento.
Un reporte del medio especializado en tecnología The Information afirma que DeepSeek adoptará chips de Huawei para sus modelos de IA pequeños. El objetivo es reducir la dependencia de Nvidia para sus procesadores de IA.
Se menciona además que DeepSeek está probando nuevos aceleradores de GPU de IA de Huawei, Baidu y Cambricon para entrenar modelos más pequeños que la versión de IA R2. Sin embargo, esto no significa que DeepSeek vaya a usar chips Ascend para su LLM (modelo de lenguaje grande) de IA R2.
Las fuentes revelan que la startup china de IA continuará utilizando procesadores Nvidia, ya que actualmente son la fuente confiable de sus productos.
Los desafíos de DeepSeek
Los primeros informes indicaron que DeepSeek enfrenta desafíos en su próximo modelo de IA R2. Aunque Huawei envió un equipo de ingeniería altamente eficiente para ayudar a la compañía con el desarrollo de R2, las cosas no resultaron muy útiles. Tras estos problemas, DeepSeek tuvo que posponer los planes de lanzamiento del modelo de IA R2. Retrasó el lanzamiento del modelo y decidió lanzarlo a finales de este año.
El último informe revela que DeepSeek utiliza chipsets de Nvidia para desarrollar el modelo de razonamiento de IA R2, que es más potente. Mientras tanto, utilizará procesadores Huawei Ascend para entrenar y perfeccionar versiones más pequeñas del modelo R2.
DeepSeek no reveló cuándo debutará esta tecnología LLM, impulsada por chips de IA de Huawei, en la plataforma de consumo. Aunque es posible que en los próximos días se obtengan más detalles al respecto.
Se intensifica la competencia en el campo de la IA
Tras la noticia, un portavoz de Nvidia declaró que “la competencia ha llegado, sin duda. El mundo elegirá la mejor pila tecnológica para ejecutar las aplicaciones y modelos de código abierto más populares. Para ganar la carrera de la IA, la industria estadounidense debe obtener el apoyo de los desarrolladores de todo el mundo, incluyendo China”.
A mediados de agosto, DeepSeek abandonó oficialmente los chips Ascend de Huawei para optar por las GPU H20 de NVIDIA tras experimentar fallos técnicos persistentes durante el entrenamiento de su modelo R2 de nueva generación. En aquel momento, esta decisión subrayó los desafíos que enfrentaba China para sus ambiciones en el sector de los semiconductores.
Información de varias fuentes / Redacción Tecno Flash
No dejes de leer: Microsoft dice que actualización de agosto no tiene relación con fallos en discos SSD
Usa la tecnología con inteligencia, únete a nuestras redes sociales hoy