Huawei revela plan de chips Ascend hasta 2028 y expande infraestructura con SuperPoDs

Shanghái, China. Eric Xu, presidente rotatorio de Huawei, presentó en el marco de Huawei Connect 2025 los planes que tiene la compañía para el desarrollo de chips en los próximos años para responder al rápido crecimiento de la demanda de Inteligencia Artificial (IA), con una infraestructura sostenible y eficiente.

Además, mostró los sistemas SuperPoD y SuperCluster, memorias de alta banda ancha (HBM), formatos de datos, interconexión, y la apertura de software, que representan una apuesta ambiciosa y variada para atender la alta demanda de soluciones en diferentes industrias.

De acuerdo con Xu, Huawei tiene en desarrollo tres nuevas series de chips Ascend que saldrán en los próximos tres años. La primera es Ascend 950, que viene en dos variantes: Ascend 950PR, optimizadas para prefill e inferencia tipo recomendación, y Ascend 950DT para decodificación e inferencia, las cuales estarán disponibles durante el primer trimestre de 2026.

El siguiente chip es el Ascend 960, que llegará en el cuarto trimestre de 2027, y planea duplicar en varias métricas a la serie 950. Tendrá aproximadamente el doble de capacidad de cómputo, ancho de banda de memoria, capacidad de memoria y puertos de interconexión. Además, soportará un nuevo formato de datos de 4 bits de precisión llamado HiF4, orientado a maximizar eficiencia inferencial en escenarios de baja precisión.

Por su parte, el Ascend 970 será el chip más avanzado de Huawei hasta ahora y está diseñado para potenciar la infraestructura de IA duplicando la capacidad de cómputo en formatos de baja precisión, como FP4 y FP8, respecto a la serie 960. También incrementará al menos 1.5 veces el ancho de banda de acceso a memoria y ofrecerá un ancho de banda de interconexión dos veces mayor, lo que permitirá entrenar y ejecutar modelos de IA de una escala sin precedentes, con mayor velocidad, eficiencia y menor consumo de recursos.

Su desarrollo apunta a consolidar a Huawei como un actor clave en el procesamiento de grandes modelos de Inteligencia Artificial en la próxima década y se prevé que estará listo durante el cuarto trimestre de 2028.

Estos chips tienen en común que ofrecerán una mayor versatilidad en formatos de datos, interconexión más rápida entre chips, mayor ancho de banda de memoria, mejor procesamiento vectorial mediante diseño mixto SIMD/SIMT, y una granularidad de acceso a memoria más fina (de 512 a 128 bytes) para hacer frente a accesos de memoria más dispersos.

SuperPoDs, SuperClusters y capacidad de infraestructura

Cabe aclarar que los chips no funcionan de forma aislada. Huawei construye alrededor de ellos infraestructuras masivas denominadas SuperPoDs (unidades lógicas compuestas de múltiples máquinas físicas que operan como un solo sistema), y escala mayor aún con SuperClusters.

En este sentido, Huawei ofrecerá cientos de gabinetes e interconexión de gran capacidad, con protocolos que permiten usar Ethernet o adaptaciones especiales (“UB over Ethernet”, RoCE).

En relación con el SuperPoD y los chips, el modelo vigente más importante es el Atlas 900 A3 SuperPoD, basado en 384 chips Ascend 910C, capaz de alcanzar aproximadamente 300 petaflops (PFLOPS) y desplegado en más de 300 unidades en más de 20 clientes de industrias diferentes.

Ahora, con la llegada del Atlas 950 SuperPoD, ofrece hasta 8,192 chips Ascend 950DT, organizado en 160 racks/gabinetes (128 de cómputo, 32 de comunicaciones), ocupando ~1.000 metros cuadrados, con interconexión totalmente óptica.

Sus especificaciones incluyen el equivalente a 8 exaflops (EFLOPS) en FP8 y 16 EFLOPS en FP4, ancho de interconexión interno altísimo (16 petabytes/segundo), mejoras muy grandes en capacidad de memoria y rendimiento, tanto para entrenamiento como para inferencia.

El ejecutivo aseguró que el Atlas 960 SuperPoD contará con 15,488 chips Ascend 960, más racks (220 gabinetes, la mayoría para cómputo), sobre ~2.200 metros cuadrados, con especificaciones que duplican la capacidad del Atlas 950 en varios frentes.

Huawei también introdujo un producto paralelo para cómputo genérico, el Kunpeng 950, con versiones de 96 núcleos, 192 hilos y otra de 192 núcleos, 384 hilos, pensadas para servidores y para SuperPoDs de propósito general.

Se espera que en 2028 se lance el Kunpeng 960, con mejoras tanto en rendimiento por núcleo como densidad de hilos para escenarios como virtualización, bases de datos, y gran procesamiento de datos. También se presentó TaiShan 950 SuperPoD, un SuperPoD de propósito general (no sólo IA) basado en procesadores Kunpeng 950, orientado a sectores críticos como finanzas.

“Para que todos estos chips y SuperPoDs funcionen como una unidad, Huawei presentó UnifiedBus 2.0, su protocolo de interconexión mejorado que mejorará la fiabilidad, el alcance y la latencia; el ancho de banda inter-NPU con escalabilidad a más de 10.000 NPUs”, concluyó Xu.