SoftBank Corp. inició el proceso de validación conjunta con AMD para el uso de las funcionalidades de partición de las GPUs AMD Instinct, a fin de impulsar y optimizar el uso de recursos en su infraestructura de cómputo de próxima generación para cargas de trabajo de Inteligencia Artificial (IA).
En un comunicado, las compañías de tecnología explican que los modelos de lenguaje grande (LLM), actualmente usados para IA Generativa, requieren recursos computacionales que varían considerablemente según el número de parámetros y la ejecución concurrente del modelo. Por lo tanto, la asignación uniforme de recursos puede provocar escasez o exceso de GPU, lo que resulta en un funcionamiento ineficiente.
En ese sentido, la verificación permitirá desarrollar la funcionalidad para particionar y asignar correctamente los recursos de la GPU según los requisitos, como el tamaño del modelo de la aplicación de IA y el número de ejecuciones simultáneas. SoftBank será el encargado de desarrollar un mecanismo para la gestión de los recursos de cómputo y la asignación óptima de aplicaciones de IA (Orchestrator). Esto permite que múltiples aplicaciones de IA funcionen eficazmente en las GPU AMD Instinct en respuesta a las solicitudes de los usuarios.
En ese sentido, este mecanismo bautizado como Orchestrator, que podría traducirse como orquestador, gestionará los recursos computacionales y asignará de forma óptima las aplicaciones de IA, con el objetivo de controlar de forma flexible los recursos computacionales según la demanda y requisitos de cómputo de la tarea.
Este Orchestrator aprovechará las capacidades de partición de las GPU AMD Instinct para utilizar una sola GPU como múltiples dispositivos lógicos. Esta función permite la asignación flexible y óptima de los recursos de la GPU según los requisitos de la aplicación de IA, como el tamaño del modelo y la concurrencia, de modo que se pueden ejecutar eficientemente múltiples aplicaciones de IA en una sola GPU.
Está previsto realizarse una demostración de la validación conjunta en el stand de AMD durante el MWC Barcelona 2026. Además, se pueden consultar detalles técnicos como la arquitectura y los métodos de gestión de Orchestrator en el blog del Instituto de Investigación de Tecnología Avanzada de SoftBank.