Alibaba presenta Qwen2-VL, su nuevo modelo de IA que asegura superar a GPT-4

Alibaba presentó Qwen2-VL, su nuevo modelo de Inteligencia Artificial que asegura superar a GPT-4 de OpenAI en la comprensión de documentos y razonamiento visual.

Alibaba Cloud lanzó Qwen2-VL, su nuevo modelo de Inteligencia Artificial (IA), que promete superar a los modelos más potentes del mercado, como GPT-4o de OpenAI y Claude 3.5 Sonnet de Anthropic. Este modelo de código abierto, especialmente la versión Qwen2-VL-72B, ha demostrado un rendimiento superior en tareas complejas, como la resolución de problemas matemáticos y la comprensión de documentos.

Qwen2-VL mejora notablemente en la comprensión de imágenes y videos, siendo capaz de analizar videos de más de 20 minutos para facilitar tareas como la respuesta a preguntas, diálogos y la creación de contenido. Además, sus avanzadas capacidades de toma de decisiones y razonamiento lo hacen ideal para su integración en dispositivos móviles y robots.

AD 4nXckvX56hXog4P8wb0DoE9iLFW DVgbyfWDZLGrMqJDN3sIzophst CGpAqRbYpvrkh 5eUKtzJy2Lw9R4qrX3cLsD5V7am3kTXz5Do 9I2WApItZ3XXh8fvNbukeuIe2G1wPyp2ZRBCdh4uIs3lrl3

Entre las mejoras más destacadas, se encuentra un reconocimiento de objetos mejorado, que le permite comprender relaciones complejas entre múltiples elementos en una escena, así como un mayor reconocimiento de texto escritos a mano y en varios idiomas.

Además, el modelo cuenta con avanzadas capacidades de razonamiento visual, interpretando gráficos y resolviendo problemas matemáticos a partir de ellos. Qwen2-VL también funciona como un agente visual, capaz de interactuar con herramientas externas para la recuperación de datos en tiempo real, ampliando así sus capacidades para percibir y responder a su entorno.

Qwen2-VL está disponible en tres variantes: Qwen2-VL-72B (72 mil millones de parámetros), Qwen2-VL-7B y Qwen2-VL-2B. Las versiones 7B y 2B, diseñadas para un uso comercial más accesible, ya están disponibles en plataformas como Hugging Face y ModelScope. Sin embargo, la variante 72B, la más potente, se lanzará más adelante a través de una licencia separada y una API de Alibaba.