Ahora Baidu afirma superar a DeepSeek con su nuevo modelo de lenguaje

Ernie X1 Turbo ofrece un rendimiento integral que supera a DeepSeek R1 y V3, con sólo 25% del precio.

Baidu anunció el lanzamiento de su más reciente modelo de lenguaje de gran tamaño (LLM, por sus siglas en inglés) Ernie 4.5 Turbo y el nuevo modelo de pensamiento profundo Ernie X1 Turbo, con los que afirma supera a DeepSeek.

La compañía dijo que como modelo de razonamiento de pensamiento profundo, Ernie X1 Turbo ofrece un rendimiento integral que supera a DeepSeek R1 y V3. Además, aseguró que lo hace con sólo 25 por ciento del precio de DeepSeek R1.

Robin Li, cofundador, presidente y director Ejecutivo de Baidu, aseveró que el LLM multimodal, que posee la capacidad de procesar y generar varios tipos de contenidos, desde texto, imágenes, audio hasta video, se convertirá en una característica común de los futuros modelos fundacionales.

El ejecutivo aseveró que el mercado de los modelos de IA que se limitan a responder a mensajes de texto se reducirá, mientras que el de los modelos de IA multimodal seguirá expandiéndose.

También dijo que sin aplicaciones, los chips y los modelos no sirven para nada. “Hay muchos modelos, pero son las aplicaciones las que dominan el mundo. La aplicación es el rey”, aseveró.

De acuerdo con información de China Daily, el nuevo modelo de Baidu muestra mejoras en términos de preguntas y respuestas, creación literaria, razonamiento lógico y capacidades multimodales.

Su modelo actualizado Ernie 4.5 Turbo tiene una velocidad de respuesta más rápida, con una disminución de un 80 por ciento de su precio respecto a la versión anterior.

Baidu inaugura cluster

Baidu también dio a conocer la apertura de un clúster compuesto por 30 mil de sus chips P800 Kunlun de tercera generación, de desarrollo propio, que puede servir de apoyo al entrenamiento de modelos similares a DeepSeek.

Robin Li explicó que el clúster P800 puede admitir el entrenamiento de modelos similares a DeepSeek con cientos de miles de millones de parámetros, o modelos de ajuste fino de mil clientes con miles de millones de parámetros al mismo tiempo.

De acuerdo con especialistas, las plataformas para desarrolladores mejoradas de la empresa simplificarán aún más la creación y el despliegue de aplicaciones de IA mediante una selección de optimización que abarca marcos de Aprendizaje Profundo, mientras que la evolución de su propia infraestructura de hardware, como el superclúster en torno al chipset Kunlun P800, resulta crucial para lograr la autosuficiencia tecnológica.

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies