San Francisco, California.- AMD presentó la actualización de sus aceleradores Instinct, conforme la compañía busca incrementar su participación en el mercado de GPUs para entrenamiento e inferencia de modelos de Inteligencia Artificial (IA), dominado actualmente por Nvidia. La compañía presentó el nuevo Instinct MI325X, así como un adelanto del nuevo MI350 que sería lanzado en la segunda mitad del próximo año.
Lisa Su, CEO de AMD, destacó la oportunidad que representa para la compañía el creciente mercado de aceleradores para IA, por lo que para aprovecharlo se ha enfocado en integrar mayor cómputo, organizar nuevas librerías y habilitar nuevos marcos.
“Está claro que el ritmo de inversión sigue creciendo en todas partes, por la mayor demanda de cómputo, nuevos casos de uso y, simplemente por una adopción más amplia de los casos de uso de la IA. Así que ahora, al mirar hacia los próximos cuatro años, esperamos que el mercado de aceleradores de IA para centros de datos crezca a un ritmo anual de más del 60 por ciento, hasta alcanzar los 500 mil millones de dólares en 2028”, destacó.
La línea Instinct ha logrado incrementar su popularidad entre grandes compañías de IA como Microsoft, Open AI y Meta, además de startups como Cohere, así como para el desarrollo de nuevas plataformas por fabricantes como Dell, Oracle, HPE, Lenovo y QCT, entre otros.
Su también destacó el desempeño del ecosistema de AMD para modelos de IA, ROCm que ahora ofrece soporte nativo para más de un millón de modelos, así como un mejora del doble durante el último año en desempeño para cargas de inferencia y entrenamiento.
AMD presentó los aceleradores AMD Instinct MI325X que ahora cuentan con soporte para 256 GB de HBM3E, con ancho de banda de hasta 6 TBps, que permite ofrecer 1.8 veces más capacidad y 1.3 veces más ancho de banda que el H200 de Nvidia. AMD asegura también que este procesador ofrece 1.3 veces más rendimiento teórico máximo de cálculo FP16 y FP8 que la H200.
En algunos modelos como Mistral, Nimri indicó que los nuevos GPUs Instinct logran hasta 1.3 veces el rendimiento de inferencia en Mistral 7B en FP162, 1.2 veces el rendimiento de inferencia en Llama 3.1 70B en FP83 y 1.4 veces el rendimiento de inferencia en Mixtral 8x7B en FP16 respecto a H200.
Se espera que el Instinct MI325X esté disponible hacia el cuarto trimestre de 2024, con soporte en plataformas de proveedores como Dell Technologies, Eviden, Gigabyte, Hewlett Packard Enterprise, Lenovo, Supermicro y otros a partir del primer trimestre de 2025.
Por su parte, Andrew Dieckmann, CVP and GM, Data Center GPU Business, presentó también un adelanto de la serie Instinct MI350 como parte del compromiso de la compañía por mantener una cadencia anual en su hoja de ruta de GPUs. Aseguró que se trata de un rediseño completo del acelerador, construido bajo un nodo de 3nm.
El nuevo MI350 estará basado en la arquitectura AMD CDNA 4, diseñado para ofrecer una mejora de 35 veces en el rendimiento de inferencia en comparación con los aceleradores basados en AMD CDNA 3. Contará con una capacidad de hasta 256 GB de memoria HBM3E por acelerador.
Entre sus principales beneficios, AMD promete un rendimiento de hasta 1.8 veces por arriba respecto al MI325X en FP6, con soporte para hasta 8 Tbps en ancho de banda y soporte para hasta 288 GB de memoria. Se espera que el Instinct MI355X esté disponible en la segunda mitad del 2025. Posteriormente, el Instinct MI400 se presentaría en 2026 en línea con la actualización anual planeada por AMD.