DALL-E: La IA de OpenAi para generación de imágenes

DALL-E
Solucionex
16
Feb 24

¿Qué es DALL-E?

Se trata de un modelo de inteligencia artificial desarrollado por OpenAI (los creadores de chatGPT) cuya principal misión es la generación de imágenes a partir de descripciones textuales ofrecidas por el usuario. Este modelo de lenguaje ha sido entrenado con de millones de imágenes ya existentes recopiladas por la compañía. 

¿Cómo utilizar DALL-E?

Es tan simple como usar chat+GPT, simplemente hay que describir la imagen que se busca conseguir. A mayor número de detalles más podrá ajustar la imagen a lo que se busca. Además se puede mantener una conversación e ir añadiendo detalles en sucesivas peticiones. 

Para ejemplificarlo se le ha pedido una imagen de un portátil sobre una mesa en una oficina. A partir de esas primeras imágenes se le ha pedido que cambie el estilo de la imagen y que añada detalles como un color más saturado:

Dall-e imágenes

A partir de ahí se puede pedir lo que la imaginación permita. DALL-E hará su propia interpretación, pudiendo conseguir imágenes poco realistas, pero divertidas:

Dall-e imágenes

Ventajas e inconvenientes de DALL-E

Como ventajas se pueden encontrar las siguientes:

  • Es fácil y rápido generar imágenes que se adapten a lo que se busca. Más rápido que un banco de imágenes convencional.
  • Se puede cambiar el estilo, el formato, el color, quitar y añadir elementos. Además de conseguir varias imágenes de la misma gama.
  • Diversidad de estilos: fotografía, ilustraciones, vectores...

Entre los inconvenientes

  • La falta de definición y concreción de las imágenes. Muchas veces presentan incoherencias como elementos solapados o bordes difusos.
  • La falta de originalidad. Es importante recordar que todas las imágenes generadas con esta IA o con cualquier otra estarán basadas en imágenes ya creadas por otros usuarios o artistas.
Inteligencia artificial