Dall-E vs Midjourney: comparación de dos herramientas revolucionarias de IA
Publicado: 2023-01-05La IA ya no es un concepto futuro, está sucediendo ahora. La tecnología ha evolucionado mucho y sigue creciendo rápidamente. La IA ha impulsado el crecimiento al hacer que las tareas sean más fáciles y rápidas. Dall-E y MidJourney, ambos son generadores de texto a imagen basados en inteligencia artificial que tienen la capacidad de generar imágenes digitales alucinantes con solo recibir su información.
¿No es fascinante que solo estés escribiendo algo y la IA te proporcione las imágenes deseadas? En realidad, es algo realmente genial para explorar y aprender.
Tanto Dall-E como MidJourney hacen lo mismo, que es generar imágenes a partir de la consulta del usuario, pero ciertos factores diferencian a estos dos. En este artículo, compararemos Dall-E y MidJourney, así que lea el artículo completo y actualice sus conocimientos con la última tecnología.
Comparación entre Dall-E y Midjourney
- Viaje de desarrollo
- Rendimiento y capacidades
- Calidad del Arte
- Interfaz de usuario y accesibilidad
- Comparación de precios
- Comparación de características
Comparación entre Dall-E y MidJourney
Los generadores de imágenes AI se han convertido en la próxima gran novedad en Internet. Como ambos son los generadores de imágenes más conocidos y posiblemente los más avanzados, ambos tienen el potencial de brindarle excelentes resultados.
Analicemos los diferentes aspectos, como su desarrollo, precios, calidad del arte y otros. de MidJourney y DALL-E para comparar y decidir cuál es el mejor entre estos dos.
Viaje de desarrollo
Dall-E es un sistema de IA desarrollado por OpenAI, un laboratorio de investigación con sede en San Francisco. Sam Altman y otros iniciaron OpenAI a fines de 2015 para desarrollar soluciones basadas en IA que resuelven diferentes tareas y hacen que la vida humana sea mucho más fácil. Dall-E es una de las soluciones de IA de OpenAI que presta servicios para la creación de imágenes.
Es un modelo de lenguaje grande que se entrenó en un conjunto de datos de texto e imágenes, que puede generar imágenes a partir de descripciones de texto, un proceso conocido como generación de imágenes o síntesis de imágenes. Es una versión de 12 mil millones de parámetros que utiliza conjuntos de datos de imagen de texto para generar una imagen a partir de texto.
Por otro lado, MidJourney también es una solución basada en IA desarrollada por un laboratorio de investigación independiente que brinda los mismos servicios que Dall-E. Dado que la intención detrás del desarrollo de la IA es la misma, que es entrenar la IA y hacerla capaz de resolver problemas complejos de la vida real con facilidad.
MidJourney ha surgido como una solución que crea imágenes realistas de cualquier entrada que proporcione. Se encuentra en la fase beta y está aprendiendo y actualizándose continuamente con nuevas características y capacidades. Para salvar el interés de los Artistas, MidJourney también incluyó la política de eliminación de DMCA en sus términos de servicio. Esto permitirá a los artistas solicitar la eliminación de cualquier obra de arte si consideran que está violando los derechos de autor.
Rendimiento y capacidades
Dall-E
Se somete a una gran cantidad de capacitación con conjuntos de datos para entrenar el sistema para mejorar constantemente el rendimiento y las capacidades. Dall-E utiliza descripciones de texto en lenguaje natural para crear imágenes y obras de arte de alta resolución. Se mezclan y combinan diferentes atributos, conceptos y estilos para ofrecer los mejores resultados y rendimiento.

El 6 de abril de 2022, OpenAI lanzó la forma mejorada de Dall-E con el nombre Dall-E 2. El concepto de fotorrealismo se volvió más avanzado y eficiente con Dall-E 2, que puede crear arte realista utilizando los datos del pie de foto. La funcionalidad de crear una imagen es general en Dall-E 2, pero además de eso, también puede agregar información adicional sobre la imagen existente y también crear diferentes variaciones de las imágenes dadas en función de la entrada que proporcione.
Dall-E utiliza una tecnología llamada Clip (preentrenamiento de imágenes de lenguaje contrastivo) para la fotosíntesis digital, que es desarrollada por OpenAI. Ayuda a hacer coincidir las imágenes con su título correspondiente de la mejor manera posible, en palabras simples, funciona en pares de texto e imagen. El proceso de incrustación de texto e incrustación de imágenes se lleva a cabo para producir el mejor resultado del pie de foto dado.
Medio viaje
Por otro lado, MidJourney también ofrece un gran rendimiento y proporciona arte realista de alta calidad a partir de comandos de lenguaje natural. Al actualizar continuamente la tecnología y eliminar las fallas en el sistema, MidJourney ha desarrollado mucho sus capacidades desde la versión 1 a la versión 4.
Cada semana y mes, lanza algunas actualizaciones en el sistema que mejoran aún más la eficiencia de la IA. Si compara los resultados producidos por la versión anterior con la última versión, los detalles de la imagen en la última versión son de primera categoría con más claridad.
En la versión anterior, si buscas "Nave espacial extraterrestre sobre la ciudad futurista", encontrarás la imagen con la nave espacial, pero la ubicación de la nave espacial no estaba bien, incluso la ciudad futurista también se veía un poco desordenada. La última versión mejoró estos defectos, ahora si busca la misma consulta, encontrará una imagen en la que la nave espacial se cierne sobre la ciudad e incluso la ciudad también se ve mucho más realista.
Por lo tanto, el rendimiento y las capacidades de ambos sistemas basados en IA son bastante similares y brindan el mejor resultado en la creación de imágenes de alta calidad.
Calidad del Arte
Sin duda, crear una imagen se vuelve fácil con Dall-E y MidJourney, ambos brindan una calidad excepcional y aún mejoran con diferentes actualizaciones. Aquí hemos comparado la calidad del arte creado por Dall-E y MidJourney. Hemos pasado la misma entrada que es "barcos navegando en un mar tormentoso" y obtuvimos el siguiente resultado.

La imagen de la izquierda es creada por MidJourney, que se ve clara y detallada, reconoce muy bien la consulta y representa cada palabra clave de manera eficiente para proporcionar el resultado. Un mar tormentoso se ve genial en la primera imagen con cada detalle minucioso, como que la atmósfera está armonizada con la imagen, lo que brinda una apariencia de clima tormentoso.
Por otro lado, Dall-E también generó la imagen de barcos en tiempo tormentoso, pero la imagen parece simple en comparación con la imagen de MidJourney. El clima es normal y no hay mucho efecto visible de la tormenta. Parecen barcos en el mar y nada más.
Por lo tanto, podemos decir que MidJourney es más preciso y preciso en la creación de imágenes en comparación con Dall-E. Pero aún así, están en la fase beta y en continua evolución, por lo que es demasiado pronto para juzgar la calidad.
Interfaz de usuario y accesibilidad
Dall-E
Para usar Dall-E, debe crear una cuenta con OpenAI visitando su sitio web oficial y haciendo clic en el botón de registro. Puede elegir su dirección de correo electrónico y contraseña para crear una cuenta o simplemente usar su cuenta de Gmail existente para crear una cuenta con OpenAI. Después de eso, también debe verificar su número de teléfono móvil para continuar.

Una vez que complete su proceso de registro, obtendrá 50 créditos gratis en su cuenta en el primer mes y también obtendrá 15 créditos cada mes, que puede usar para crear una imagen en Dall-E. Ahora está listo para generar imágenes a partir de una descripción del lenguaje natural.
En la barra de búsqueda, puede ingresar su imaginación a través de una consulta y el algoritmo genera automáticamente el mejor resultado en función de su consulta de búsqueda. Mezcle y combine las imágenes y pruebe diferentes variaciones para obtener el mejor resultado de su búsqueda. También puede cargar una imagen y sugerir cualquier cambio a través de su comando para crear una obra de arte única.
Medio viaje
Actualmente, MidJourney está operando solo en el servidor de Discord, por lo que para usar MidJourney necesita una cuenta en Discord. En primer lugar, debe visitar el sitio web de MidJourney y hacer clic en unirse al programa beta. Después de esto, debe aceptar una invitación al servidor de discordia de MidJourney. Ahora abra su aplicación Discord y haga clic en el icono de forma de barco de MidJourney, puede unirse a cualquier sala de recién llegados con el nombre "novato".
Use el indicador /imagine y comience a crear imágenes a partir de su imaginación y obtenga el resultado de MidJourney. Cuanto más precisamente ingrese la información en el comando, más preciso será el resultado que obtendrá. También puede cargar su imagen y aplicarle diferentes variaciones, esto cambiará su imagen existente a una nueva imagen modificada según los cambios que desee.
Comparación de precios
Dall-E
Cuando se registre en OpenAI, obtendrá 50 créditos gratis para generar imágenes en Dall-E y también obtendrá 15 créditos cada mes. Además de eso, puede comprar 115 créditos adicionales por $ 15 si no tiene crédito. Este crédito se utilizará cada vez que presione un mensaje de búsqueda y pruebe diferentes variaciones.
Suponga que ingresa una consulta de búsqueda "Una niña mirando la luna de noche" y presiona el botón generar. Esto creará algunas imágenes para usted, si selecciona cualquier imagen y prueba diferentes variaciones de la imagen, también se utilizará su crédito. En este ejemplo, se usa un crédito cuando generó una imagen y otro crédito cuando probó una variación, por lo tanto, consumió dos créditos de su cuenta.
Medio viaje
El plan de precios de MidJourney es un poco confuso para los principiantes en comparación con Dall-E porque contiene varios planes y utiliza algoritmos. Comparemos cada uno de ellos uno por uno, pero antes de comparar el plan, debe tener claras ciertas terminologías como tiempo de GPU rápido, tiempo de GPU relajado y visibilidad privada.
Tiempo de GPU rápido: cada vez que ingrese cualquier mensaje para la creación de una imagen, se necesitarán recursos de GPU para renderizar la imagen, el tiempo que tarda la GPU en renderizar la imagen depende de la complejidad, los detalles, la calidad y más. El modo de GPU tan rápido reduce el tiempo para renderizar las imágenes y proporciona la salida lo más rápido posible.
Tiempo de GPU relajado: en el modo relajado, GPU no toma su trabajo como una prioridad y se toma su tiempo para renderizar la imagen.
Visibilidad privada: sus imágenes creadas son visibles para el público a menos que las ponga en privado. Sus imágenes estarán en el servidor, pero solo serán visibles para usted.
- Prueba gratuita: cuando se registre en MidJourney por primera vez, obtendrá 25 min/tiempo de GPU rápido de por vida. Si la generación de una imagen toma alrededor de 1 minuto, entonces puede generar 25 imágenes gratis con este plan. Tenga en cuenta que cada vez que genere una imagen o variación, necesitará GPU, por lo tanto, se le cobrarán minutos mientras genera una nueva imagen y también mientras crea una variación.
El tiempo de GPU relajado y la visibilidad privada no se proporcionan en el plan gratuito.
- Básico: cobrará $ 10 / mes cuando opte por este plan. En este plan, obtendrá 200 minutos por mes de tiempo de GPU rápido y un chat de bot personal. El tiempo de GPU relajado aún no está disponible en este plan, pero puede optar por una función de visibilidad privada pagando $ 20 / mes adicionales.
- Estándar: en este plan, obtendrá 15 horas al mes a $30 al mes, incluido el tiempo de GPU relajado. Pero en este plan también debe comprar la visibilidad privada por $ 20 / mes si lo desea.
Además, para los planes Básico y Estándar, puede comprar tiempo adicional si está fuera durante el tiempo determinado en su plan. Cobrará $4 por 60 minutos.
- Corporativo: este plan es más adecuado para grandes empresas de diseño que necesitan generar muchas piezas de arte e imágenes. Por $600/año, obtendrá 120 horas/año de tiempo de GPU rápido y tiempo de GPU relajado ilimitado, además obtendrá visibilidad privada y un bot personal sin costo adicional.
Comparación de características
Características de Dall-E
- Edición rápida de la imagen cargada en función de los cambios que desee.
- Diferentes variaciones para explorar y elegir.
- Colección dedicada para almacenar imágenes generadas en carpetas públicas o privadas.
- Derecho de uso pleno para comercializar la imagen creada.
- Seguridad ya asegurada antes de lanzar la versión beta de Dall-E.
Características de MidJourney
- Cualquiera puede unirse al programa beta usando el enlace de discordia.
- Diferentes variaciones e imágenes de alta calidad.
- Planes de precios diversificados.
- Disponibilidad de modo Rápido y relajado.
- Puede cargar una imagen y hacer cambios.
Conclusión
La IA ha hecho que el trabajo sea más fácil y sin esfuerzo, pero aún así, esta tecnología está evolucionando y desarrollándose. Dall-E y MidJourney son excelentes herramientas de IA que ayudan a generar imágenes realistas a través del lenguaje natural. Entonces, únase a su programa beta y explore la nueva altura de la IA.
Preguntas más frecuentes
¿Cuál es mejor DALL-E o MidJourney?
DALL-E crea imágenes de aspecto más real, mientras que MidJourney se centra más en diferentes estilos artísticos.
¿Puedes usar imágenes DALL-E gratis?
Actualmente, DALL-E 2 es de uso gratuito, pero hay una trampa. Durante el primer mes, se le asignan 50 créditos gratuitos para usar y 15 créditos gratuitos después de eso.
¿Qué tipo de IA es MidJourney?
MidJourney es un laboratorio de investigación independiente que produce un programa de inteligencia artificial patentado con el mismo nombre que crea imágenes a partir de descripciones textuales, similar a DALL-E y Stable Diffusion de OpenAI.
¿Cómo funciona realmente MidJourney?
Actualmente, solo se puede acceder a MidJourney a través de un bot de Discord en su Discord oficial, enviando mensajes directos al bot o invitándolo a un servidor de terceros.