Inteligencia Artificial para crear imágenes en 3D desde el lenguaje natural

Fecha de publicación: 31/05/2022

Validado por
Lluís Soler Gomis
Cofundador y Director de negocio en SoftDoit

Primero OpenAI y ahora Google, han dado a conocer sus proyectos Dalle-2 e Imagen, respectivamente, dos proyectos que utilizan la IA para reproducir imágenes hiperrealistas a partir de texto.

En los últimos años, hemos sido testigos del gran avance que ha experimentado los software con inteligencia artificial, que ya se está utilizando para optimizar funciones de automatización, interpretación o recuperación de datos, entre otras muchas.

Recientemente, el desarrollo de la IA ha alcanzado un enfoque más visual con la presentación de Dalle-2 por parte de OpenAI. Se trata de una IA para generar imágenes a partir de descripciones escritas por los usuarios, con resultados de un gran realismo.

Cualquier imagen que seas capaz de imaginar se materializa empleando esta tecnología, dando lugar a representaciones nítidas y de gran detalle, gracias a las herramientas de procesamiento de lenguaje natural que integra.

A partir de texto descriptivo, cualquier imagen que puedas imaginar se hace realidad con la Inteligencia Artificial.

Esta innovadora propuesta de OpenAI ya ha tenido una respuesta. Ahora es Google quien presenta Imagen, su propio proyecto de IA en torno a esta línea de desarrollo. Igual que Dalle-2, Imagen crea imágenes fotorrealistas a partir de textos. Está construido a partir de grandes modelos lingüísticos para lograr el gran entendimiento del lenguaje del que es capaz, y sigue trabajando con nuevos modelos para poder generar imágenes con mayor nivel de fidelidad a las descripciones.

Tanto Google como OpenAI son conscientes de las amplias posibilidades de uso y mal uso que estos nuevos modelos de difusión pueden ofrecer, y trabajan de forma cerrada en sus respectivas tecnologías. En el caso de Dalle-2 es posible solicitar probar la IA desde un formulario, mientras que con Imagen han decidido mantenerla completamente aislada.

Los modelos de lenguaje genéricos de gran tamaño son ideales para las funciones de estos proyectos de IA y permiten conseguir imágenes de alta calidad y relación con el texto.

¿Qué más puedes encontrar en SoftDoit?

🏆 ¿Necesitas un software para resolver una necesidad de tu negocio o empresa? en SoftDoit te ofrecemos una consultoría digital gratuita para ayudarte a decidir cual es la solución ideal para ti.
🗞 Manténte al día con nuestras guías y tendencias sobre software y tecnología digital y descubre soluciones que optimizarán tu negocio.

Volver al índice de guías y reportajes

🔍 Busca el mejor software para tu empresa en nuestros directorios temáticos de soluciones.
🏅 ¿Quieres sabes cuales con las soluciones que recomendamos en nuestros rankings temáticos de software?
🚀 Y si tienes una solución de software, ya puedes aparecer en SoftDoit.