Gemini mejora su capacidad de creación de imágenes generativas

Permitirá personalizar Gemini para convertirlo en una Inteligencia Artificial experta en cualquier tema que desee el usuario.

GeminiGemsIA generativa

Alejandro González Ago 29, 2024

Google I/O presentó dos novedades que ya comenzó a desplegar y estarán disponibles en los próximos días.

Se trata de Gems, una nueva función que permite personalizar Gemini para convertirlo en una Inteligencia Artificial (IA) experta en cualquier tema que desee el usuario. Desde ahora, estará disponible para los usuarios de Gemini Advanced, Business y Enterprise en determinados idiomas y países.

La otra novedad es Imagen 3, un nuevo modelo de generación de imágenes, que se puede usar para la creación de imágenes generales en Gemini (versión gratuita) y está disponible en español.

Por último, la generación de imágenes de personas está disponible en Gemini Advanced, Business y Enterprise, en inglés.

Genera imágenes de alta calidad con Imagen 3

Google informó que han dado un gran paso adelante en su capacidad de creación de imágenes generativas. En los próximos días, Imagen 3, su último modelo de generación de imágenes, llegará a las aplicaciones de Gemini (incluida la versión gratuita) y en todos los idiomas.

“Imagen 3 abre una nueva dimensión en cuanto a calidad de imagen, y es capaz de generar imágenes a partir de instrucciones breves. Permite pedirle a Gemini que cree imágenes en distintos estilos; por ejemplo, paisajes fotorrealistas, imágenes con textura de pintura al óleo o caprichosas animaciones con plastilina”, describió Google.

dplnews gemini vestido imagen3 mc29824 — Crea una imagen de un vestido de fiesta hecho con servilletas de papel en una sala de exposición elegante.

Añadió que la capacidad avanzada de generación de imágenes de Imagen 3 se acompaña de sistemas de protección y respeta sus principios de diseño de productos. Imagen 3 ha obtenido resultados superiores a los de otros modelos de generación de imágenes en una gran variedad de pruebas comparativas. Y utiliza SynthID, una herramienta de inserción de marcas de agua en las imágenes generadas.

“Nuestros principios de diseño son claros: el usuario mantiene el control del proceso creativo de principio a fin. Si la imagen inicial no cumple tus expectativas, sólo tienes que decirle a Gemini qué te gustaría cambiar y obtendrás una nueva imagen”, agregó Google.

También lee: No, no es Obama consumiendo cocaína, es una imagen hecha con Grok-2

En los próximos días comenzarán a desplegar la generación de imágenes de personas, con una versión preliminar solamente en inglés y para sus usuarios de Gemini Advanced, Business y Enterprise.

Imagen 3 supone un avance significativo en la mejora de la experiencia del usuario a la hora de generar imágenes de personas.

También dijo que no está permitido generar imágenes fotorrealistas de individuos identificables ni de menores. Igualmente, tampoco es posible obtener escenas excesivamente sangrientas, violentas o sexuales.

“Evidentemente, no todas las imágenes creadas mediante Gemini serán perfectas. Por eso, estaremos atentos a los comentarios de los usuarios de Gemini Advanced para seguir mejorando. Esta funcionalidad se irá implantando de manera gradual, con el objetivo de que llegue próximamente a más usuarios e idiomas”, añadió la compañía.

Gemini Gems IA generativa Imagen 3 imágenes generativas relevante tech

L	M	X	J	V	S	D
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31