Zhipu AI, empresa china de Inteligencia Artificial (IA), reveló que su primer modelo de generación de imagen sería el primer modelo multimodal desarrollado íntegramente con infraestructura tecnológica nacional china, lo que incluye componentes proveídos por Huawei. Este hito se enmarca dentro de los esfuerzos del país asiático por lograr su autonomía tecnológica y reducir la dependencia de proveedores estadounidenses.
El modelo, según informó la compañía china, fue entrenado completamente utilizando el servidor Ascend Atlas 800T A2 de Huawei, equipado con procesadores neuronales (NPU) Ascend AI, y el marco de trabajo de aprendizaje automático MindSpore, también desarrollado por Huawei. Estos servidores también corren sobre CPUs Kunpeng, desarrollados sobre arquitectura de la compañía británica ARM.
“Esperamos que esto pueda proporcionar una referencia valiosa para que la comunidad explore el potencial de la potencia de cómputo nacional”, dijo Zhipu, según cita South China Morning Post.
GLM-Image, modelo desarrollado por Zhipu, presenta una arquitectura híbrida que combina elementos autorregresivos y de difusión. El modelo incluye un generador autorregresivo de 9,000 millones de parámetros, un decodificador de difusión de 7,000 millones de parámetros, y funcionalidades multimodales para procesar tanto texto como imágenes.
Desde el primer periodo presidencial de Donald Trump, el gobierno de Estados Unidos ha endurecido las restricciones de acceso a tecnología clave como chips y patentes para el gobierno y las empresas chinas. Bajo este contexto, el gobierno chino ha impulsado diversos programas para acelerar el desarrollo de tecnología nacional que le permita también mantener el desarrollo de IA.
Jensen Huang, CEO de Nvidia, es uno de los directivos que había advertido que este enfoque era riesgoso, ya que impulsarían al país asiático a desarrollar su propia tecnología y, por lo tanto, adquirir menos componentes de empresas estadounidenses. El directivo también había advertido que China se encontraba muy cerca de Estados Unidos en el desarrollo de IA gracias a su amplia base de talento y la presencia de empresas nacionales como Huawei.
A finales del año pasado, el gobierno de Trump celebró que había llegado a un acuerdo con el gobierno chino para reanudar la venta de chips H20 de Nvidia. Sin embargo, el gobierno chino respondió con medidas adicionales que limitarían su importación, tales como pedir a las empresas nacionales que justifiquen por qué requieren este componente estadounidense en lugar de infraestructura nacional.
Aunque Zhipu sería uno de los primeros modelos supuestamente desarrollados íntegramente con infraestructura china, aún existen dudas respecto a la eficacia de los chips Ascend para entrenar modelos más grandes, como el próximo GLM-5. Por otro lado, el desarrollo de IA en China en general aún depende de infraestructura de compañías estadounidenses como Nvidia y AMD, así como las plataformas de desarrollo TensorFlow y PyTorch.