Dall-E vs Midjourney - Comparando duas ferramentas revolucionárias de IA

Publicados: 2023-01-05

A IA não é mais um conceito futuro, está acontecendo agora. A tecnologia evoluiu muito e ainda está crescendo rapidamente. A IA alimentou o crescimento tornando as tarefas mais fáceis e rápidas. Dall-E e MidJourney, ambos são geradores de texto para imagem baseados em IA que possuem a capacidade de gerar imagens digitais alucinantes apenas recebendo sua entrada.

Não é fascinante que você esteja apenas digitando algo e a IA esteja fornecendo as imagens desejadas? Na verdade, são coisas muito legais para explorar e aprender.

Tanto o Dall-E quanto o MidJourney fazem a mesma coisa, que é gerar imagens a partir da consulta do usuário, mas alguns fatores os diferenciam. Aqui neste artigo vamos comparar o Dall-E e o MidJourney, então leia todo o artigo e atualize seus conhecimentos com a tecnologia de ponta.

Comparação entre Dall-E e Midjourney

  • Jornada de Desenvolvimento
  • Desempenho e capacidades
  • Qualidade da Arte
  • Interface do usuário e acessibilidade
  • Comparação de preços
  • Comparação de recursos

Comparação entre Dall-E e MidJourney

Os geradores de imagem AI se tornaram a próxima grande novidade na Internet. Como ambos são os geradores de imagem mais conhecidos e indiscutivelmente os mais avançados, ambos têm o potencial de fornecer ótimos resultados.

Vejamos os diferentes aspectos, como desenvolvimento, preço, qualidade da arte e outros. de MidJourney e DALL-E para comparar e decidir qual é o melhor entre esses dois.

Jornada de Desenvolvimento

Dall-E é um sistema de IA desenvolvido pela OpenAI, um laboratório de pesquisa com sede em San Francisco. A OpenAI foi iniciada por Sam Altman e outros no final de 2015 para desenvolver soluções baseadas em IA que resolvem diferentes tarefas e tornam a vida humana muito mais fácil. Dall-E é uma das soluções de IA da OpenAI que presta serviços para criação de imagens.

É um grande modelo de linguagem que foi treinado em um conjunto de dados de texto e imagens, que pode gerar imagens a partir de descrições de texto, um processo conhecido como geração de imagens ou síntese de imagens. É uma versão de 12 bilhões de parâmetros que usa conjuntos de dados de imagem de texto para gerar uma imagem a partir do texto.

Por outro lado, o MidJourney também é uma solução baseada em IA desenvolvida por um laboratório de pesquisa independente que presta os mesmos serviços que o Dall-E. Já que a intenção por trás do desenvolvimento da IA ​​é a mesma, que é treinar a IA e torná-la capaz de resolver problemas complexos da vida real com facilidade.

MidJourney surgiu como uma solução que cria imagens realistas de qualquer entrada que você fornecer. Está na fase beta e continuamente aprendendo e atualizando com novos recursos e capacidades. Para salvar o interesse dos artistas, a MidJourney também incluiu a política de remoção DMCA em seus termos de serviço. Isso capacitará os artistas a solicitar a remoção de qualquer obra de arte se acharem que está violando os direitos autorais.

Desempenho e capacidades

Dall-E

Muito treinamento com conjuntos de dados é feito para treinar o sistema para melhorar consistentemente o desempenho e os recursos. Dall-E usa descrições de texto em linguagem natural para criar imagens de alta resolução e obras de arte. Diferentes atributos, conceitos e estilos são misturados e combinados para oferecer os melhores resultados e desempenho.

edição Dall-E

Em 6 de abril de 2022, a OpenAI lançou a forma atualizada de Dall-E com o nome Dall-E 2. O conceito de fotorrealismo tornou-se mais avançado e eficiente com Dall-E 2, que pode criar arte realista usando os dados da legenda. A funcionalidade de criar uma imagem é geral no Dall-E 2, mas além disso, ele também pode adicionar algumas informações extras na imagem existente e também criar diferentes variações das imagens fornecidas com base na entrada que você fornecer.

Dall-E usa uma tecnologia chamada Clip (Pré-treinamento de imagem em linguagem contrastiva) para fotossíntese digital, desenvolvida pela OpenAI. Ajuda a combinar as imagens com a legenda correspondente da melhor maneira possível, em palavras simples, funciona em pares de texto e imagem. O processo de incorporação de texto e incorporação de imagem ocorre para produzir o melhor resultado da legenda fornecida.

Meio da jornada

Por outro lado, MidJourney também oferece ótimo desempenho e oferece arte realista de alta qualidade a partir de comandos de linguagem natural. Ao atualizar continuamente a tecnologia e remover as falhas do sistema, o MidJourney evoluiu muito seus recursos da versão 1 para a versão 4.

Toda semana e mês, lança algumas atualizações no sistema que melhoram ainda mais a eficiência da IA. Se você comparar os resultados produzidos pela versão anterior com a versão mais recente, os detalhes da imagem na versão mais recente são excelentes com mais clareza.

Na versão anterior, se você pesquisar "nave alienígena sobre a cidade futurista", encontrará a imagem com a nave, mas o posicionamento da nave não era bom, mesmo a cidade futurista também parecia um tanto confusa. A versão mais recente melhorou essas falhas, agora se você pesquisar a mesma consulta, encontrará uma imagem em que a nave está pairando sobre a cidade e até a cidade também parece muito mais realista.

Portanto, o desempenho e os recursos de ambos os sistemas baseados em IA são bastante semelhantes e oferecem o melhor resultado na criação de imagens de alta qualidade.

Qualidade da Arte

Criar uma imagem, sem dúvida, torna-se fácil com Dall-E e MidJourney, ambos oferecem qualidade excepcional e ainda melhoram com diferentes atualizações. Aqui comparamos a qualidade da arte criada por Dall-E e MidJourney. Passamos a mesma entrada que é "navios navegando em um mar tempestuoso" e obtemos o resultado abaixo.

Comparação na qualidade da arte de Dall-E e MidJourney

A imagem à esquerda foi criada por MidJourney, que parece clara e detalhada, reconhece muito bem a consulta e processa cada palavra-chave com eficiência para fornecer o resultado. Um mar tempestuoso parece legal na primeira imagem com cada detalhe minucioso, como se a atmosfera fosse harmonizada com a imagem, proporcionando uma aparência de tempo tempestuoso.

Por outro lado, Dall-E também gerou a imagem de navios em tempo de tempestade, mas a imagem parece simples em comparação com a imagem MidJourney. O tempo está normal e não há muito efeito da tempestade visível. Parece navios no mar e nada mais.

Portanto, podemos dizer que o MidJourney é mais preciso e preciso na criação de imagens em comparação com o Dall-E. Mas ainda assim, eles estão na fase beta e em constante evolução, então é muito cedo para julgar a qualidade.

Interface do usuário e acessibilidade

Dall-E

Para usar o Dall-E, você precisa criar uma conta no OpenAI visitando o site oficial e clicando no botão de inscrição. Você pode escolher seu endereço de e-mail e senha para criar uma conta ou simplesmente usar sua conta existente do Gmail para criar uma conta com OpenAI. Depois disso, você também precisa verificar seu número de celular para continuar.

Depois de concluir o processo de inscrição, você receberá 50 créditos gratuitamente em sua conta no primeiro mês e também receberá 15 créditos todos os meses, que você pode usar para criar uma imagem no Dall-E. Agora você está pronto para gerar imagens a partir de uma descrição de linguagem natural.

Na barra de pesquisa, você pode inserir sua imaginação por meio de consulta e o algoritmo gera automaticamente o melhor resultado com base em sua consulta de pesquisa. Misture e combine as imagens e experimente diferentes variações para obter o melhor resultado de sua pesquisa. Você também pode fazer upload de uma imagem e sugerir alterações por meio de seu comando para criar uma obra de arte exclusiva.

Meio da jornada

MidJourney está atualmente operando apenas no servidor discord, então para usar MidJourney você precisa de uma conta no discord. Primeiro de tudo, você precisa visitar o site da MidJourney e clicar em entrar no programa beta. Depois disso, você precisa aceitar um convite para o servidor de discórdia do MidJourney. Agora abra seu aplicativo de discórdia e clique no ícone em forma de barco de MidJourney, você pode entrar em qualquer sala de novato com o nome "novato".

Use o prompt /imagine e comece a criar imagens de sua imaginação e obtenha o resultado do MidJourney. Quanto mais precisamente você der a entrada no comando, mais preciso será o resultado. Você também pode carregar sua imagem e aplicar diferentes variações a ela, isso mudará sua imagem existente para uma nova imagem modificada com base nas alterações desejadas.

Comparação de preços

Dall-E

Ao se inscrever no OpenAI, você receberá 50 créditos grátis para gerar imagens no Dall-E e também receberá 15 créditos todos os meses. Além disso, você pode comprar 115 créditos adicionais por $ 15 se estiver sem crédito. Esse crédito será utilizado toda vez que você clicar em um prompt de pesquisa e experimentar diferentes variações.

Suponha que você insira uma consulta de pesquisa "Uma garota olhando para a lua à noite" e pressione o botão gerar. Isso criará algumas fotos para você, se você selecionar qualquer imagem e experimentar diferentes variações da imagem, seu crédito também será utilizado. Neste exemplo, um crédito é usado quando você gerou uma imagem e um crédito é usado quando você experimentou uma variação, portanto, você consumiu dois créditos de sua conta.

Meio da jornada

O plano de preços do MidJourney é um pouco confuso para iniciantes em comparação com o Dall-E porque contém vários planos e usa algoritmos. Vamos comparar cada um deles um por um, mas antes de comparar o plano, você precisa ser claro sobre certas terminologias, como tempo de GPU rápido, tempo de GPU relaxado e visibilidade privada.

Tempo de GPU rápido: Sempre que você inserir qualquer prompt para a criação de uma imagem, serão necessários recursos da GPU para renderizar a imagem, o tempo gasto pela GPU para renderizar a imagem depende da complexidade, detalhes, qualidade e muito mais. O modo GPU tão rápido reduz o tempo de renderização das imagens e fornece a saída o mais rápido possível.

Tempo de GPU relaxado: No modo relaxado, a GPU não considera seu trabalho uma prioridade e demora para renderizar a imagem.

Visibilidade privada: suas imagens criadas são visíveis ao público, a menos que você as coloque em privado. Suas imagens estarão no servidor, mas visíveis apenas para você.

  • Avaliação gratuita: ao se inscrever no MidJourney pela primeira vez, você receberá 25 min/tempo de GPU rápido para toda a vida. Se a geração de uma imagem levar cerca de 1 minuto, você poderá gerar 25 imagens gratuitamente com este plano. Lembre-se de que toda vez que você gerar uma imagem ou variação, será necessário GPU, portanto, você será cobrado por minutos ao gerar uma nova imagem e também ao criar uma variação.

Tempo de GPU relaxado e visibilidade privada não são fornecidos no plano gratuito.

  • Básico: você cobrará US$ 10/mês ao optar por este plano. Neste plano, você receberá 200 minutos por mês de tempo rápido de GPU e um bate-papo de bot pessoal. O tempo de GPU relaxado ainda não está disponível neste plano, mas você pode optar por um recurso de visibilidade privada pagando $ 20/mês adicionais.
  • Padrão: neste plano, você terá 15 horas/mês por US$ 30/mês, incluindo tempo de GPU relaxado. Mas neste plano você também precisa adquirir a visibilidade privada por $ 20/mês, se quiser.‌‌

Além disso, para os planos Básico e Standard, você pode adquirir tempo adicional se estiver fora do horário determinado em seu plano. Ele cobrará US$ 4 por 60 minutos.

  • Corporativo: Este plano é mais adequado para grandes empresas de design que precisam gerar muitas peças de arte e imagens. Por US$ 600/ano, você terá 120 horas/ano de tempo de GPU rápido e tempo ilimitado de GPU relaxado. Além disso, você terá visibilidade privada e um bot pessoal sem nenhum custo extra.

Comparação de Recursos

Características do Dall-E

  • Edição rápida da imagem carregada com base nas alterações desejadas.
  • Diferentes variações para explorar e escolher.
  • Coleção dedicada para armazenar imagens geradas em pastas públicas ou privadas.
  • Direito de uso total para comercializar a imagem criada.
  • Já garantiu a segurança antes de lançar a versão beta do Dall-E.

Características do MidJourney

  • Qualquer pessoa pode participar do programa beta usando o link do Discord.
  • Diferentes variações e imagens de alta qualidade.
  • Planos de preços diversificados.
  • Disponibilidade de modo rápido e descontraído.
  • Pode carregar uma imagem e fazer alterações.

Conclusão

A IA tornou o trabalho mais fácil e sem esforço, mas ainda assim, essa tecnologia está evoluindo e se desenvolvendo. Dall-E e MidJourney são excelentes ferramentas de IA que ajudam a gerar imagens realistas por meio da linguagem natural. Então, junte-se ao programa beta e explore o novo patamar da IA.

Perguntas frequentes

Qual é melhor DALL-E ou MidJourney?

O DALL-E cria imagens com aparência mais real, enquanto o MidJourney está mais em diferentes estilos de arte.

Você pode usar imagens DALL-E gratuitamente?

Atualmente, o DALL-E 2 é gratuito para uso, mas há um problema. No primeiro mês, você recebe 50 créditos gratuitos para usar e 15 créditos gratuitos depois disso.

Que tipo de IA é o MidJourney?

MidJourney é um laboratório de pesquisa independente que produz um programa proprietário de inteligência artificial com o mesmo nome que cria imagens a partir de descrições textuais, semelhante ao DALL-E e Stable Diffusion da OpenAI.

Como o MidJourney realmente funciona?

Atualmente, o MidJourney só pode ser acessado por meio de um bot do Discord em seu Discord oficial, enviando uma mensagem direta ao bot ou convidando o bot para um servidor de terceiros.

‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌