Mistral libera actualización de su modelo con mejoras en matemáticas y razonamiento

Mistral AI, startup europea de Inteligencia Artificial (IA) Generativa, anunció la actualización de su modelo insignia, Mistral Large 2, el cual cuenta ahora con una ventana de contexto de 128K, con lo que logra mejoras en tareas como generación de código, matemáticas y razonamiento.

La compañía explica que la actualización Mistral Large 2 tiene una ventana de contexto de 128k y es compatible con docenas de idiomas, como francés, alemán, español, italiano, portugués, árabe, hindi, ruso, chino, japonés y coreano, además de más de 80 lenguajes de programación, como Python, Java, C, C++, JavaScript y Bash.

El objetivo del modelo es cumplir con tareas impulsadas por IA Generativa con eficiencia en costos, velocidad y rendimiento. En ese sentido, Mistral señala que, con un tamaño de 123 mil millones de parámetros, puede realizar inferencia en un único nodo con aplicaciones de contexto largo.

Asimismo, indica que el modelo destaca en métricas de evaluación de coste por rendimiento de servicio. En concreto, en MMLU, la versión preentrenada alcanza una precisión del 84 por ciento y establece un nuevo punto en el frente de Pareto de rendimiento/coste de los modelos abiertos.

Una publicación en el blog de la compañía indica que el rendimiento de Mistral Large 2 se encuentra a la par de modelos líderes como GPT-4o, Claude 3 Opus, y Llama 3 405B.

También lee: Meta AI llega a México y otros países de América Latina. Así puedes empezar a utilizarla

Entre las principales mejoras introducidas en la actualización se encuentran la reducción de alucinaciones o la generación de resultados plausibles pero erróneos. El modelo también fue entrenado para “reconocer” cuando no puede ofrecer una solución correcta o no tiene la suficiente información.

Por otro lado, el modelo recibió también mejoras para el seguimiento de grandes conversaciones e instrucciones.

El modelo se ha liberado bajo la Licencia de Investigación Mistral, que permite su uso y modificación para investigación y usos no comerciales. Para un uso comercial de Mistral Large 2 que requiera autodespliegue, debe adquirirse una Licencia Comercial Mistral.

El anuncio se produce justo después de que Meta Platforms presentara la versión más reciente de su modelo de código abierto, Llama 3.1 405B. Mark Zuckerberg, CEO de Meta, afirmó que el código abierto es el futuro de la IA que garantizará un mejor costo, rendimiento y seguridad.

Mistral AI, que ha recibido inversiones de gigantes como Microsoft, Cisco e IBM, recaudó recientemente 643 millones de dólares en nuevos fondos, lo que eleva su valoración a más de 6 mil millones de dólares.