Modelos pequeños y comunicación entre agentes: cómo IBM espera crear las tendencias del futuro de IA
En el edificio 314 de la Calle Main en Boston, mejor conocido en el área como Pi on Main, el Massachusetts Institute of Technology (MIT) e IBM codirigen el Watson AI Lab, que trabaja en las futuras tecnologías de Inteligencia Artificial (IA). El producto más reciente de esta colaboración es la familia de modelos pequeños de lenguaje (SLM) Granite, los cuales tienen el propósito de consolidar una oferta que sea más eficiente y costo-efectiva para la adopción de la IA entre las empresas.
Con más de 100 años de existencia, IBM ha mostrado cambios radicales para adaptarse a las diferentes etapas del mercado de cómputo. Más recientemente, la IA se ha convertido en uno de sus principales negocios. “Sigue habiendo una fuerte demanda de IA Generativa y nuestra cartera de negocio supera los 6 mil millones de dólares en lo que va del año, con un aumento de más de mil millones en el trimestre”, según reveló Arvind Krishna, CEO de IBM, al presentar los resultados financieros del primer trimestre del 2025.
Durante la visita al laboratorio, Adam Bogue, director de Engagement en IBM Research Cambridge, explicó que para consolidar su presencia en este nuevo mercado, la compañía ha acelerado sus esfuerzos en el área de investigación. Actualmente, IBM cuenta con más de 3 mil investigadores en 13 ubicaciones en el mundo, de los cuales, al menos un cuarto están plenamente dedicados a la IA, y el resto, a actividades relacionadas con IA.
También lee: IBM acelera automatización para desarrollar los siguientes mil millones de aplicaciones en empresas
Como parte de este esfuerzo, la compañía fundó también un laboratorio que codirige con el MIT y que ha recibido una inversión de 240 millones de dólares. El laboratorio cuenta actualmente con más de 50 proyectos que se desarrollan en conjunto con múltiples departamentos como matemáticas, física y negocios, y que en conjunto han generando más de mil 200 publicaciones en revistas académicas.
Los proyectos generados en el laboratorio también abordan múltiples soluciones y problemáticas, tales como gemelos digitales y el clima, además de investigación relacionada en temas como descubrimiento acelerado de materiales, inferencia causal, entre otros.
David Cox, vicepresidente de modelos de IA en IBM Research, aseguró que los beneficios esperados por la IA de entre 3 a 4 billones de dólares representan un “cambio económico favorable”. Sin embargo, también apuntó que existen desafíos relevantes como el incesante crecimiento de los modelos de lenguaje que demandan más cómputo y, por tanto, más energía.
En ese sentido, explicó las ventajas de adoptar ciertas tendencias como modelos Open Source y SLM que permitan que el desarrollo de IA sea más eficiente y lograr una reducción de los costos de hasta 50 veces menos respecto a un modelo grande de lenguaje (LLM).
A finales del año pasado, IBM presentó la tercera generación de su familia de modelos Granite, que buscan atender la mayoría de las actividades que se realizan en una empresa típica, como resúmenes o generación de contenido, y que no necesariamente demandan las capacidades de un LLM. Estos modelos se enfocan en tareas como ciberseguridad, recuperación de información (RAG) y tienen barreras de seguridad contra contenido dañino.
Pese a que los SLM operan con un menor número de parámetros, aún se pueden utilizar ciertas técnicas para lograr que tengan un rendimiento similar, o incluso mejor que los LLM, según explicó Cox. En el caso de Granite 3.3, se incluye la funcionalidad de Inference Scaling, por ejemplo, que da una mayor capacidad de razonamiento y da lugar a mejores respuestas.
“Un pequeño modelo dinámicamente puede ser más grande, pero uno grande no puede ser más pequeño”, explicó Cox, durante la visita al laboratorio. Granite se compone por modelos que van desde menos de mil millones hasta los 34 billones de parámetros.
Otra capacidad de Granite es que también puede mejorarse mediante módulos que atiendan ciertas funcionalidades específicas, por ejemplo, ayudar a la detección de alucinaciones o, incluso, predicción de incertidumbre y barreras para prevenir la generación de contenido dañino. De la misma manera, el modelo también busca ser más flexible, por lo que se puede adaptar a diferentes tareas como series de tiempo y visión por computadora.
IA para aplicaciones sin código
Durante el evento Think 25, celebrado en la ciudad de Boston a principios de mayo, Krishna indicó que se esperan más de mil millones de aplicaciones empresariales basadas en IA hacia el 2028. En ese sentido, la estrategia de la compañía se ha enfocado en brindar las herramientas a las empresas para acelerar el desarrollo y administración de estas aplicaciones.
En línea con esa estrategia, uno de los proyectos relevantes del laboratorio MIT-IBM es el Proyecto M, nombre provisional para la aplicación aún en desarrollo. La principal característica de este proyecto es que permitirá la generación de programas únicamente a base de prompts de IA.
Esta solución también estaría basada en SLM, por lo que se espera que pueda trabajar de forma más eficiente como dividir tareas grandes en pasos más pequeños, lo que daría como resultado una menor demanda de cómputo y menos consumo de energía. Asimismo, la flexibilidad del modelo habilitaría otras funcionalidades como revisar que no incluya contenido inapropiado, crear resúmenes o contenido sin conexión y generar reportes, entre otros.
Otro proyecto del laboratorio con grandes perspectivas a futuros es la creación de Agent Communication Protocol (ACP), que básicamente serviría como un estándar para habilitar la comunicación entre los agentes de IA, lo que permitiría automatizar tareas más complejas entre distintas aplicaciones y bases de datos.
Recientemente, empresas como OpenAI y Google adoptaron Model Context Protocol (MCP), desarrollado por Anthropic, como el estándar para habilitar la comunicación entre modelos de lenguaje, convirtiéndolo en el estándar por defecto de la industria. De manera similar, IBM espera que ACP también pueda convertirse en el estándar del mercado de agentes.