ciudad mobileciudad
En vivo
Ciudad MagazineTecno

Make-A-Scene, la IA de Meta que genera imágenes más precisas

La nueva herramienta usa la combinación de texto y boceto.

26 de julio 2022, 11:28hs
Make-A-Scene, la IA de Meta que genera imágenes más precisas
Make-A-Scene, la IA de Meta que genera imágenes más precisas

Meta ha presentado un prototipo de inteligencia artificial (IA) generativa destinada a complementar la expresividad de los creadores, capaz de crear imágenes más precisas a partir de descripciones de texto en combinación con bocetos.

Descripciones como "un dibujo de una cebra montando en bici" ofrece una base a la IA con la que generar una imagen, pero la composición final es difícil de predecir, con variaciones de posición y tamaño de los elementos que la forman, entre otras posibilidades.

Las descripciones no permiten detallar con exactitud el tamaño de la bicicleta respecto de la cebra ni la posición del manillar, por ejemplo. Para avanzar en este plano, Meta ha presentado 'Make-A-Scene'.

Este sistema de IA se apoya en las descripciones de texto, como otras IA generativas, pero también en los dibujos que hagan las personas, que pueden detallar formas, composiciones o estructuras. La combinación de ambos permite obtener imágenes de mayor calidad, como explica en un comunicado.

En las pruebas de evaluación, la compañía presentó a los participantes dos imágenes generadas por 'Make-A-Scene', una a partir solo de la descripción de texto y otra de la descripción y el boceto, y en ellas ha encontrado que "la imagen generada tanto del texto como del boceto era casi siempre puntuada como mejor alineada con el boceto original", alcanzado este resultado en un 99,54 por ciento de las veces.

La compañía destaca que en el 66,3 por ciento de las veces la imagen estaba también más alineada con la descripción de texto. "Esto demuestra que las generaciones de Make-A-Scene son de hecho fieles a la visión de una persona comunicada a través del boceto", apunta.

Para entrenar la relación entre elementos visuales y textuales, la compañía ha empleado "millones de imágenes de ejemplo", procedentes de bases de datos públicamente disponibles. El modelo se centra en aprender aspectos clave de las imágenes que tienen más probabilidades de ser importantes para el creador, como objetos o animales.

Fuente EP.

Temas de la nota

Tecnometa

Más notas sobre Tecno

Sebastián Darcyl presentó LIT, la app que vincula marcas e influencers: “Somos como un Tinder”
EXCLUSIVO

Sebastián Darcyl presentó LIT, la app que vincula marcas e influencers: “Somos como un Tinder”

Por Fernando Gatti
Cómo evitar que una marca suene a robot con un detector de IA

Cómo evitar que una marca suene a robot con un detector de IA

Esta es la razón por la que Instagram reitera su apuesta por los vídeos cortos

Esta es la razón por la que Instagram reitera su apuesta por los vídeos cortos

Los comentarios publicados en ciudad.com.ar podrán ser reproducidos parcial o totalmente en la pantalla de Ciudad Magazine, como así también las imágenes de los autores.

© 1996 - 2025, Artear

Seguinos en las redes

Últimas noticias

  • Arroz con leche: un postre clásico con la receta de Doña Petrona
  • No es a la parrilla: cómo preparar el asado para un sándwich increíble
  • Ensaladas verdes: frescas y listas en menos de 10 minutos
  • Horóscopo de hoy por Jimena La Torre: martes 16 de septiembre de 2025

Secciones

  • Espectáculos
  • Actualidad
  • Internacional
  • Exclusivo
  • Horóscopo
  • Cine y Series
  • Videos
  • Música
  • Qué Look

Sitios amigos

  • Canal (á)
  • Cucinare
  • El Doce
  • eltrece
  • Cienradios
  • Clarín
  • Grupo Clarín
  • La 100
  • La Voz del Interior
  • Mitre
  • Olé
  • Quiero Música
  • TN
  • TyC Sports
  • Vía País

Seguinos en las redes

© 1996 - 2025, Artear

Mapa del sitio
Aviso Legal
Políticas de privacidad
Media Kit