Mistral lanza Pixtral 12B, su primer modelo multimodal de IA que puede procesar imágenes y texto

La startup francesa de Inteligencia Artificial (IA), Mistral, lanzó su primer modelo multimodal, Pixtral 12B, diseñado para procesar imágenes y texto de manera simultánea. Este modelo se compara con otros multimodales destacados, como la familia Claude de Anthropic y GPT-4 de OpenAI.

En una publicación en la red social X, Sophia Yang, directora de relaciones con desarrolladores de Mistral, anunció la disponibilidad de Pixtral 12B, que cuenta con 12 mil millones de parámetros y un tamaño aproximado de 24 GB. Los parámetros en estos modelos determinan su capacidad para resolver problemas, y a mayor cantidad de parámetros, mayor rendimiento.

Pixtral 12B se basa en un modelo de texto previo de Mistral, Nemo 12B, y está diseñado para responder preguntas relacionadas con imágenes de cualquier tamaño, ya sea mediante URLs o imágenes codificadas. Esto le permite realizar tareas como generar subtítulos para imágenes o identificar objetos en una fotografía.

El modelo está disponible para los desarrolladores a través de un enlace de descarga en GitHub y la plataforma Hugging Face, bajo la licencia Apache 2.0, que permite su uso sin restricciones. Próximamente, también se podrá probar en las plataformas de la empresa, Le Chat y Le Plateforme, que facilitan la creación de chatbots y servicios de API.

Aunque Mistral no ha revelado los datos específicos utilizados para entrenar Pixtral 12B, es probable que, como otros modelos de IA Generativa, se haya entrenado con grandes volúmenes de datos públicos de Internet, muchos de los cuales están protegidos por derechos de autor.

El lanzamiento de Pixtral 12B sigue a una exitosa ronda de financiación en la que Mistral recaudó 645 millones de dólares, liderada por General Catalyst, lo que valoró a la empresa en 6 mil millones de dólares.

Con poco más de un año de existencia, Mistral ya se posiciona como la competencia europea de OpenAI. A diferencia de OpenAI, que sigue un enfoque más cerrado, Mistral ofrece modelos de código abierto gratuitos, mientras monetiza versiones administradas y servicios de consultoría para grandes empresas. Microsoft también posee una participación minoritaria en la startup.

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies