Meta desvela nuevos modelos de IA: Self-Taught Evaluator y Spirit LM

Pasión Móvil

Meta anunció el lanzamiento de una serie de innovadores modelos de inteligencia artificial desarrollados por su división de investigación, Fundamental AI Research (FAIR).

Entre estas novedades destaca el Self-Taught Evaluator, un modelo que promete reducir la intervención humana en el proceso de desarrollo de IA. También se presentó un modelo que combina de manera fluida texto y voz.

Nuevas IAs de Meta

Nuevas herramientas especializadas en IA

Estas actualizaciones llegan tras la publicación de un documento en agosto, donde Meta expuso que sus nuevos modelos utilizarán el mecanismo de “cadena de pensamiento”similar a lo que OpenAI ha implementado en sus recientes modelos o1, los cuales procesan información antes de generar respuestas.

Es importante señalar que tanto Google como Anthropic también han investigado el concepto de Reinforcement Learning from AI Feedback, aunque aún no han hecho públicos sus hallazgos.

El equipo de investigadores de IA de FAIR en Meta señaló que estos nuevos lanzamientos respaldan la meta de la compañía de alcanzar una inteligencia de máquina avanzada, promoviendo al mismo tiempo la ciencia abierta y la reproducibilidad.

Los modelos recientemente anunciados incluyen una actualización del Segment Anything Model 2 para imágenes y videos, así como Meta Spirit LM, Layer Skip, SALSA, Meta Lingua, OMat24, MEXMA, y el mencionado Self-Taught Evaluator.

Self-Taught Evaluator: Una Innovación en Modelos de Recompensa

El Self-Taught Evaluator es presentado por Meta como un modelo de recompensa generativa fuerte con datos sintéticos, diseñado para validar el trabajo de otros modelos de IA. La empresa sostiene que este enfoque innovador permite generar datos de preferencia para entrenar modelos de recompensa sin depender de anotaciones humanas.

En esencia, el Self-Taught Evaluator crea sus propios datos para entrenar modelos de recompensa, eliminando la necesidad de que humanos etiqueten la información. Meta afirma que el modelo genera diversas salidas de otros modelos de IA y luego utiliza otro sistema de IA para evaluar y mejorar esos resultados en un proceso iterativo.

Leer más.

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies