Inteligencia Artificial para crear imágenes en 3D desde el lenguaje natural

Fecha de publicación: 31/05/2022

En los últimos años, hemos sido testigos del gran avance que ha experimentado la inteligencia artificial, que ya se está utilizando para optimizar funciones de automatización, interpretación o recuperación de datos, entre otras muchas.

Recientemente, el desarrollo de la IA ha alcanzado un enfoque más visual con la presentación de Dalle-2 por parte de OpenAI. Se trata de un sistema capaz de generar imágenes a partir de descripciones escritas por los usuarios, con resultados de un gran realismo. Cualquier imagen que seas capaz de imaginar se materializa empleando esta tecnología, dando lugar a representaciones nítidas y de gran detalle.

 
A partir de texto descriptivo, cualquier imagen que puedas imaginar se hace realidad con la Inteligencia Artificial.
 
 

Esta innovadora propuesta de OpenAI ya ha tenido una respuesta. Ahora es Google quien presenta Imagen, su propio proyecto de IA en torno a esta línea de desarrollo. Igual que Dalle-2, Imagen crea imágenes fotorrealistas a partir de textos. Está construido a partir de grandes modelos lingüísticos para lograr el gran entendimiento del lenguaje del que es capaz, y sigue trabajando con nuevos modelos para poder generar imágenes con mayor nivel de fidelidad a las descripciones.

​​Tanto Google como OpenAI son conscientes de las amplias posibilidades de uso y mal uso que estos nuevos modelos de difusión pueden ofrecer, y trabajan de forma cerrada en sus respectivas tecnologías. En el caso de Dalle-2 es posible solicitar probar la IA desde un formulario, mientras que con Imagen han decidido mantenerla completamente aislada. 

 
Los modelos de lenguaje genéricos de gran tamaño son ideales para las funciones de estos proyectos de IA y permiten conseguir imágenes de alta calidad y relación con el texto.
 
Si quieres estar al día en gestión empresarial,
apúntate a nuestra newsletter semanal