Intel presenta Gaudi 3 y Xeon de 6ª generación para impulsar IA entre las empresas

Intel presentó la actualización de su portafolio para facilitar la ejecución de cargas de trabajo de Inteligencia Artificial (IA) entre las empresas, incluyendo sus nuevos procesadores Gaudi 3 y la sexta generación de procesadores Intel Xeon, además de software de código abierto encargado de la automatización y la adopción de las nuevas capacidades.

Intel considera que el uso de IA entre las empresas actualmente ha alcanzado un punto de inflexión, caracterizado por la adopción acelerada de la nueva tecnología y el desarrollo de nuevas capacidades de IA Generativa. La compañía cita que al menos el 80% de las empresas usarán algún tipo de IA Generativa hacia 2026, según cifras de Gartner.

Para Intel, la mayor oportunidad para aprovechar esta adopción se encuentra en los despliegues en el Edge, ya sea desde los equipos de cómputo hasta otros dispositivos como sensores. Gartner también señala que aproximadamente 50% de los despliegues de Edge implicarán algún tipo de Machine Learning (ML) para 2026.

Relacionado: Biden financia a Intel para avanzar en semiconductores

La compañía espera atender los múltiples casos de uso de IA que se presentarán en áreas como manufactura o minorista, como tiendas y cafeterías, que demandarán más procesamiento de cómputo para cargas de trabajo de IA en el Edge que les permita incrementar su productividad y la eficiencia de sus operaciones.

Aunque actualmente la mayor parte de los casos de uso de IA se dan a través de los llamados Copilots, que se alimentan de datos públicos, la expectativa es que eventualmente las empresas puedan desarrollar, desplegar y ajustar (fine tuning) modelos de IA que se alimenten con datos internos, que permitan inicialmente automatizar flujos de trabajo (AI Agents) y eventualmente contar con funciones de IA para asumir labores de un departamento completo.

Por otro lado, Intel también reconoce que existen retos en la adopción, ya que 46% de las empresas señalaron que la infraestructura es el mayor obstáculo para obtener la productividad esperada.

Intel Gaudi 3 disponible en la segunda mitad de 2024

Para resolver estos retos, el fabricante de chips presentó Intel Enterprise AI, una plataforma enfocada en ofrecer a las empresas diversas opciones tanto de hardware como software, incluyendo herramientas de código abierto como OpenVINO e infraestructura como Intel Gaudi 3, que permitan incrementar el ecosistema de desarrolladores, faciliten el despliegue de IA y se cumpla con estándares de seguridad.

image 7

En el caso del hardware, la compañía presentó nuevas actualizaciones de Intel Gaudi 3, la esperada actualización del acelerador enfocado en cargas de trabajo de IA para centros de datos. Según la compañía, este nuevo chip ofrecerá múltiples ventajas como hasta un entrenamiento 40% más rápido en modelos populares como GPT 3.

En comparación con Nvidia H100, la compañía adelantó que Intel Gaudi 3 ofrecerá un tiempo de entrenamiento 50% más rápido de media en los modelos Llama2, con 7 y 13 mil millones de parámetros, y en el modelo GPT-3, de 175 mil millones de parámetros. Además, se prevé que ofrezca una mejora de 40% en eficiencia energética de inferencia promediada en los modelos de parámetros Llama de 7 y 70 mil millones y Falcon de 180 mil millones de parámetros.

Este nuevo chip estará fabricado en un proceso de 5nm y ofrecerá la opción de hasta 64 unidades de procesamiento Tensor (TPU), con una capacidad de memoria RAM de hasta 96 MB, y alcanzará hasta 1835 teraflops de procesamiento de cómputo FP8.

image 6

Tras el lanzamiento de Gaudi 3, Intel anunció una meta de ventas de 100 millones de aceleradores de IA hacia 2025, un objetivo que refleja también la expectativa de la compañía por colocar 100 millones de PC impulsadas por sus nuevos procesadores Intel Core Ultra con IA en el mismo año.

Mediante el lanzamiento de Gaudi 3, Intel espera también impulsar un ecosistema abierto basado en software, así como redes Ethernet abiertas basadas en estándares formados en conjunto con el Ultra Ethernet Consortium (UEC).

Estos estándares, diseñados para escalar grandes plataformas de IA conocidas como AI Fabrics, permitirán el entrenamiento y la inferencia de modelos cada vez más amplios, con tamaños que aumentan en un orden de magnitud en cada generación.

La gama incluye la Intel AI NIC (tarjeta de interfaz de red), chiplets de conectividad de IA para integración en XPU, sistemas basados en Gaudi y una serie de diseños de interconexión de IA de referencia blanda y dura para Intel Foundry. Algunas de estas características estarán disponibles hasta el año 2026.

Estos estándares de Ethernet simplificarán también la conectividad entre los componentes, para facilitar la formación de nodos, clústers y super clústers, con miles de nodos.

Hasta el momento, Intel mantiene una fecha de lanzamiento cercana a la segunda mitad de 2024, aunque comenzará a llegar a fabricantes como Dell, Lenovo, HPE y Supermicro en el segundo trimestre del año. Hasta el momento, Gaudi 2 se puede acceder a través de Intel Developer Cloud, con opciones para facilitar la migración a la versión actualizada cuando esté disponible.

Adicionalmente, reveló nuevas colaboraciones con empresas de desarrollo para el aprovechamiento de Gaudi 3. Entre estos se incluyen Bosch, que utilizará el chip para la introducción de sistemas de manufactura impulsados por IA, como la detección de anomalías; NielsenIQ y Advent International para determinar comportamientos de compra de consumidores; y Roboflow, que lo utilizará para ejecutar flujos de producción para su plataforma de visión computarizada, entre otros.

Intel Xeon 6ª generación

El fabricante de chips anunció actualizaciones a su sitio de infraestructura, Intel Developer Cloud, que contará con acceso a nuevas opciones de almacenamiento y a los nuevos procesadores Intel Xeon de 6a Generación con E-cores (Sierra Forest) a partir del segundo trimestre de 2024. Asimismo, en la segunda mitad del año llegarían finalmente Intel Gaudi 3 e Intel Xeon con P-Cores (Granite Rapids).

Intel también anunció colaboraciones con Google Cloud, Thales y Cohesity para aprovechar las capacidades de cómputo confidencial en sus instancias en la Nube. Esto incluye Intel Trust Domain Extensions (Intel TDX), Intel Software Guard Extensions (Intel SGX) y el servicio de atestación.

En el caso de los chips Intel Xeon 6a generación con núcleos de eficiencia (E-Cores), se espera una mejora de rendimiento de hasta 2.4 veces por watt y de 2.7 veces en densidad de racks respecto a la segunda generación Xeon, con lo que se espera que las empresas puedan reducir el consumo de energía y el espacio requerido para sus centros de datos.

Para los Intel Xeon con núcleos de rendimiento (P-Cores), la compañía añadió soporte de software para el formato de datos MXFP4, que reduce la latencia del siguiente token hasta 6.5 veces en comparación con los Xeon de 4a generación que utilizan FP16, con capacidad para ejecutar modelos Llama-2 de 70 mil millones de parámetros.

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies