Intel prepara nuevo chip para inferencia de IA en Centros de Datos

Intel Corporation estaría preparando el lanzamiento de un nuevo chip destinado para cargas de trabajo de Inteligencia Artificial (IA) en Centros de Datos antes de fin de año, según revela un reporte del Financial Times (FT). Este nuevo chip buscaría fortalecer la presencia de la compañía en las cargas de trabajo de inferencia en este segmento, actualmente dominado por otros proveedores como Nvidia, AMD y las ofertas propietarias de los hiperescaladores.

El procesador, denominado “Crescent Island“, buscaría ofrecer un enfoque diferenciado al utilizar tecnología de memoria y refrigeración más económica que las ofertas rivales. A diferencia de los chips Blackwell de Nvidia que dependen de memoria de alto ancho de banda (HBM), Crescent Island empleará memoria LPDDR5 de menor costo y refrigeración por aire.

Según Kevork Kechichian, director del Grupo de Centros de Datos de Intel, el chip estará inicialmente disponible en cantidades limitadas y se enfocará en tareas de inferencia de IA, según cita el reporte de FT. “Decidimos comenzar a reconstruir nuestros músculos en IA (…), pero no estamos apuntando particularmente al mercado de entrenamiento basándonos en experiencias pasadas”, agregó.

Este chip habría sido desarrollado durante un periodo de 18 meses y representa el primer impulso importante de Intel en el mercado de infraestructura de IA bajo el liderazgo del CEO Lip-Bu Tan.

Este nuevo chip estará equipado con memoria LPDDR5x, con hasta 480 GB de capacidad para gestionar de forma eficiente grandes cargas de trabajo con uso intensivo de tokens, a la vez que reduce el coste total de propiedad.

El segmento de entrenamiento de IA está actualmente dominado por infraestructura de Nvidia como el H200 (Hopper) o el más moderno GB300 (Blackwell), así como la línea Instinct de AMD (MI350). Intel había intentado ingresar a este mercado a través de su línea de aceleradores Gaudi, pero dificultades en su desarrollo, retrasos en su lanzamiento y la fuerte competencia de las alternativas han provocado una adopción más lenta de la esperada.

De acuerdo con el reporte del medio, Intel también está evaluando si versiones de su nuevo chip de inferencia podrían venderse en China, ya que podría cumplir con las restricciones de exportación estadounidenses. “Hay niveles del chip que podrían estar bien allí (…) y lo confirmaremos con el tiempo: claramente hay demanda para ese punto de precio particular en ese mercado específico”, indicó Kechichian.

Aunque la demanda de cómputo en Centros de Datos se disparó en años recientes para el entrenamiento de modelos de IA, Intel mantiene que la inferencia representa una oportunidad importante de crecimiento, conforme nuevos casos de uso de IA y Agentes se adopten entre empresas y consumidores para la automatización de tareas diarias y rutinarias.

Cómputo para IA en el Edge

Uno de los casos de uso con importantes avances en el área de inferencia se registra en el Edge. Al respecto, Intel también destaca que su tecnología de procesamiento ya se encuentra actualmente en más de 130 proyectos de diseño de IA y Edge.

Por ejemplo, un proyecto clave es Sensory AI for Ella, la primera tienda de IA física multiagente en servicio público comercial, que ahora está migrando a la arquitectura Intel. En este caso, se destaca la integración de tres agentes de IA especializados (Avatar, Guardián y Ella Agent) que se ejecutan simultáneamente en un único SoC, gestionando la interacción con el cliente, las operaciones del sistema y la inteligencia empresarial a nivel de tienda, mientras que un orquestador determinista controla el robot.

Por otro lado, para ayudar a la industria robótica a convertir los diseños de desarrollo en flotas implementadas, Intel también presentó OpenVINO Physical AI, un marco de código abierto, optimizado por Intel y pionero en su tipo, que aborda los desafíos de la implementación rentable y la escalabilidad.

Esta nueva plataforma se integra en su Suite de IA para Robótica, enfocada en ayudar a desarrolladores y equipos de operaciones a pasar de modelos experimentales a implementaciones escalables en entornos reales.

Physical AI Studio permite a los desarrolladores recopilar datos, ajustar modelos, optimizarlos y cuantificarlos, y exportar modelos VLA prevalidados y ajustados para su implementación. OpenVINO Physical AI es la primera biblioteca de robótica de código abierto con un entorno de ejecución de inferencia optimizado para silicio.

“Los modelos de IA física están transformando la robótica, pero la implementación se ha visto ralentizada por stack de software fragmentadas e integraciones únicas para cada robot. Con Intel Core Ultra Serie 3 y OpenVINO Physical AI, proporcionamos una vía unificada, abierta y escalable desde la experimentación con IA hasta robots de producción que ofrecen inferencia de alto rendimiento acelerada por hardware”, aseguró Dan Rodriguez, vicepresidente Corporativo del Grupo de Computación Periférica de Intel, en un comunicado.

Intel renueva Xeon para Centros de Datos

En el marco de Computex, celebrado en Taiwán, Intel presentó también una renovación de su procesador estrella Xeon 6+, enfocado para el rendimiento y la eficiencia a gran escala, con la intención de optimizar cargas de trabajo para la orquestación, el movimiento de datos y la inferencia continua.

Los procesadores Intel Xeon 6+ amplían la familia Xeon 6, centrándose en la densidad de rendimiento, la eficiencia energética y la escalabilidad operativa para cargas de trabajo nativas de la Nube, impulsadas por IA autónoma y con uso intensivo de red. Basado en Intel 18A —su primer uso en una CPU para Centros de Datos—, el nuevo chip está diseñado para ofrecer un rendimiento sostenido bajo las limitaciones energéticas del mundo real.

image 2

Este componente incluye hasta 288 núcleos eficientes, memoria DDR5 de 12 canales con ancho de banda escalable para sistemas de alta densidad y 96 líneas PCIe Gen 5 y compatibilidad con CXL para acelerar la transferencia de datos a través de infraestructuras heterogéneas.

Intel promete que Xeon 6+ ofrece hasta 2.5 veces más rendimiento en comparación con la generación anterior y hasta un 45% más de rendimiento por hilo por vatio frente a la competencia, lo que permite una alta concurrencia y una gran capacidad de respuesta para cargas de trabajo nativas de la Nube, de telecomunicaciones y basadas en IA.

La compañía también revela que este chip ya se está probando en infraestructuras de redes de telecomunicaciones y se configuran en sistemas de Centros de Datos con plataformas disponibles en todo el ecosistema. Estas incluyen servidores, redes y soluciones integradas de ASUS, Dell Technologies, Ericsson, GIGABYTE, HPE, Lenovo, Supermicro y otras empresas que actualmente desarrollan soluciones con Xeon 6+.