Dall-E ve Midjourney - Devrim Yaratan İki Yapay Zeka Aracının Karşılaştırılması

Yayınlanan: 2023-01-05

AI artık geleceğin bir kavramı değil, şimdi oluyor. Teknoloji çok gelişti ve hızla büyümeye devam ediyor. AI, görevleri daha kolay ve daha hızlı hale getirerek büyümeyi hızlandırdı. Dall-E ve MidJourney, yalnızca sizden girdi alarak akıllara durgunluk veren dijital görüntüler oluşturma yeteneğine sahip, yapay zeka tabanlı metinden görüntüye oluşturuculardır.

Sadece bir şeyler yazarken yapay zekanın size istediğiniz görüntüleri sağlaması büyüleyici değil mi? Aslında, keşfedilmesi ve öğrenilmesi gerçekten harika şeyler.

Hem Dall-E hem de MidJourney, kullanıcı sorgusundan görüntüler oluşturmakla aynı şeyi yapar, ancak bazı faktörler bu ikisini birbirinden ayırır. İşte bu yazıda Dall-E ve MidJourney'i karşılaştıracağız, bu yüzden tüm makaleyi okuyun ve bilgilerinizi en son teknoloji ile güncelleyin.

Dall-E ve Midjourney Arasındaki Karşılaştırma

  • Geliştirme Yolculuğu
  • Performans ve Yetenekler
  • Sanat Kalitesi
  • Kullanıcı Arayüzü ve Erişilebilirlik
  • Fiyat karşılaştırması
  • Özelliklerin Karşılaştırılması

Dall-E ve MidJourney Arasındaki Karşılaştırma

Yapay Zeka Görüntü Oluşturucuları, internetteki bir sonraki büyük şey haline geldi. Her ikisi de en iyi bilinen ve muhtemelen en gelişmiş görüntü üreteçleri olduğundan, her ikisi de size harika sonuçlar verme potansiyeline sahiptir.

Geliştirme, fiyatlandırma, sanat kalitesi ve diğerleri gibi farklı yönlere bakalım. Bu ikisi arasında hangisinin en iyi olduğunu karşılaştırmak ve karar vermek için MidJourney ve DALL-E.

Geliştirme Yolculuğu

Dall-E, merkezi san-Fransisco'da bulunan bir araştırma laboratuvarı olan OpenAI tarafından geliştirilen bir yapay zeka sistemidir. OpenAI, farklı görevleri çözen ve insan hayatını çok daha kolaylaştıran yapay zeka tabanlı çözümler geliştirmek için 2015 yılının sonlarında Sam Altman ve diğerleri tarafından başlatıldı. Dall-E, OpenAI'nin görüntü oluşturma hizmetleri sunan yapay zeka çözümlerinden biridir.

Görüntü oluşturma veya görüntü sentezi olarak bilinen bir işlem olan metin açıklamalarından görüntüler üretebilen, metin ve görüntülerden oluşan bir veri kümesi üzerinde eğitilmiş büyük bir dil modelidir. Metinden bir görüntü oluşturmak için metin-görüntü veri kümelerini kullanan 12 milyar parametreli bir sürümdür.

Öte yandan MidJourney, Dall-E ile aynı hizmetleri sunan bağımsız bir araştırma laboratuvarı tarafından geliştirilen yapay zeka tabanlı bir çözümdür. Yapay zekanın geliştirilmesinin arkasındaki amaç aynı olduğundan, yapay zekayı eğitmek ve karmaşık gerçek hayat problemlerini kolaylıkla çözebilmelerini sağlamak.

MidJourney, sağladığınız tüm girdilerin gerçekçi görüntülerini oluşturan bir çözüm olarak ortaya çıktı. Beta aşamasındadır ve sürekli olarak öğrenir ve yeni özellikler ve yeteneklerle yükseltilir. Sanatçıların ilgisini korumak için MidJourney, hizmet şartlarına DMCA yayından kaldırma politikasını da dahil etti. Bu, sanatçılara, telif hakkını ihlal ettiğini düşündükleri herhangi bir sanat eserinin kaldırılmasını talep etme yetkisi verecektir.

Performans ve Yetenekler

Dall-E

Performansı ve yetenekleri sürekli olarak iyileştirmek için sistemi eğitmek için veri kümeleriyle birçok eğitim yapılır. Dall-E, yüksek çözünürlüklü görüntüler ve sanat eserleri oluşturmak için doğal dilde metin açıklamaları kullanır. En iyi sonuçları ve performansı sunmak için farklı nitelikler, kavramlar ve stiller karıştırılır ve eşleştirilir.

Dall-E düzenlemesi

OpenAI, 6 Nisan 2022'de Dall-E'nin yükseltilmiş halini Dall-E 2 adıyla piyasaya sürdü. Başlıktaki verileri kullanarak gerçekçi sanat yaratabilen Dall-E 2 ile fotogerçekçilik kavramı daha gelişmiş ve verimli hale geldi. Dall-E 2'de bir görüntü oluşturma işlevi geneldir, ancak bunun yanı sıra, mevcut görüntü hakkında bazı ekstra bilgiler ekleyebilir ve ayrıca sağladığınız girdiye göre verilen görüntülerin farklı varyasyonlarını oluşturabilir.

Dall-E, OpenAI tarafından geliştirilen dijital fotosentez için Clip (Contrastive language image pre-training) adlı bir teknoloji kullanıyor. Görselleri karşılık gelen başlıklarla mümkün olan en iyi şekilde eşleştirmeye yardımcı olur, basit kelimelerle metin ve resim çiftleri üzerinde çalışır. Metin gömme ve resim gömme işlemi, verilen başlıktan en iyi sonucu elde etmek için gerçekleşir.

MidJourney

Öte yandan, MidJourney ayrıca harika performans sunar ve doğal dil komutlarından yüksek kaliteli gerçekçi sanat sağlar. MidJourney, teknolojiyi sürekli olarak yükselterek ve sistemdeki kusurları gidererek, yeteneklerini Sürüm 1'den Sürüm 4'e kadar çok geliştirdi.

Her hafta ve ayda, sistemde yapay zekanın verimliliğini daha da artıran bazı güncellemeler yayınlar. Önceki sürüm tarafından üretilen sonuçları en son sürümle karşılaştırırsanız, en son sürümdeki görüntü ayrıntıları daha net ve birinci sınıftır.

Önceki versiyonda, "Fütüristik şehrin üzerinde uzaylı uzay gemisi" araması yaparsanız, uzay gemisinin olduğu görüntüyü bulacaksınız, ancak uzay gemisinin yerleşimi iyi değildi, fütüristik şehir bile bir şekilde dağınık görünüyordu. En son sürüm bu kusurları iyileştirdi, şimdi aynı sorguyu ararsanız, uzay gemisinin şehrin üzerinde süzüldüğü ve hatta şehrin çok daha gerçekçi göründüğü bir resim bulacaksınız.

Bu nedenle, her iki AI tabanlı sistemin performansı ve yetenekleri hemen hemen benzerdir ve yüksek kaliteli görüntüler oluşturmada en iyi sonucu verir.

Sanat Kalitesi

Her ikisi de olağanüstü kalite sunan ve farklı güncellemelerle gelişmeye devam eden Dall-E ve MidJourney ile bir görüntü oluşturmak şüphesiz kolaylaşıyor. Burada Dall-E ve MidJourney tarafından yaratılan Sanatın kalitesini karşılaştırdık. "Fırtınalı denizde seyreden gemiler" girdisini geçtik ve aşağıdaki sonucu elde ettik.

Dall-E ve MidJourney Sanat Kalitesinde Karşılaştırma

Soldaki resim, MidJourney tarafından oluşturulmuş, net ve ayrıntılı görünüyor, sorguyu çok iyi tanıyor ve sonucu sağlamak için her bir anahtar kelimeyi verimli bir şekilde işliyor. İlk görüntüde fırtınalı bir deniz, atmosferin görüntüyle uyumlu hale getirilmesi ve fırtınalı bir hava görünümü sağlanması gibi her ayrıntıyla serin görünüyor.

Öte yandan Dall-E, fırtınalı havadaki gemilerin görüntüsünü de oluşturmuş ancak görüntü, MidJourney görüntüsüne kıyasla basit görünüyor. Hava normal ve fırtınanın pek bir etkisi görünmüyor. Denizdeki gemilere benziyor ve daha fazlası değil.

Dolayısıyla MidJourney, görüntü oluşturma konusunda Dall-E'ye göre daha kesin ve doğru diyebiliriz. Ancak yine de beta aşamasındalar ve sürekli gelişiyorlar, bu nedenle kaliteyi değerlendirmek için henüz çok erken.

Kullanıcı Arayüzü ve Erişilebilirlik

Dall-E

Dall-E'yi kullanmak için OpenAI'nin resmi web sitesini ziyaret edip kayıt düğmesine tıklayarak bir hesap oluşturmanız gerekir. Bir hesap oluşturmak için e-posta adresinizi ve şifrenizi seçebilir veya OpenAI ile bir hesap oluşturmak için mevcut Gmail hesabınızı kullanabilirsiniz. Bundan sonra, devam etmek için cep telefonu numaranızı da doğrulamanız gerekir.

Kayıt işleminizi tamamladığınızda, ilk ay hesabınıza ücretsiz 50 kredi ve ayrıca her ay Dall-E'de görüntü oluşturmak için kullanabileceğiniz 15 kredi alacaksınız. Artık doğal dilin tanımından görüntüler oluşturmaya hazırsınız.

Arama çubuğuna, hayal gücünüzü sorgu yoluyla girebilirsiniz ve algoritma, arama sorgunuza göre en iyi sonucu otomatik olarak üretir. Görselleri karıştırıp eşleştirin ve aramanızdan en iyi sonucu almak için farklı varyasyonları deneyin. Ayrıca, benzersiz bir sanat eseri yaratmak için komutunuz aracılığıyla bir görüntü yükleyebilir ve üzerinde herhangi bir değişiklik önerebilirsiniz.

MidJourney

MidJourney şu anda yalnızca discord sunucusunda çalışıyor, bu nedenle MidJourney'i kullanmak için discord'da bir hesaba ihtiyacınız var. Öncelikle MidJourney web sitesini ziyaret etmeniz ve beta programına katıl seçeneğine tıklamanız gerekiyor. Bundan sonra, MidJourney'den discord sunucusuna bir daveti kabul etmeniz gerekiyor. Şimdi discord uygulamanızı açın ve MidJourney'nin tekne şekli simgesine tıklayın, "acemi" adıyla herhangi bir yeni gelen odasına katılabilirsiniz.

/imagine istemini kullanın ve hayal gücünüzden görüntüler oluşturmaya başlayın ve sonucu MidJourney'den alın. Girdiyi komuta ne kadar kesin olarak verirseniz, o kadar doğru sonuç alırsınız. Ayrıca resminizi yükleyebilir ve ona farklı varyasyonlar uygulayabilirsiniz; bu, mevcut resminizi istediğiniz değişikliklere göre değiştirilmiş yeni bir resme değiştirecektir.

Fiyat karşılaştırması

Dall-E

OpenAI'ye yeni kaydolduğunuzda, Dall-E'de görüntü oluşturmak için ücretsiz 50 kredi ve ayrıca her ay 15 kredi alacaksınız. Üstelik, krediniz bittiyse, 15 ABD Doları karşılığında ek 115 kredi satın alabilirsiniz. Bu kredi, bir arama istemine her bastığınızda ve farklı varyasyonları denediğinizde kullanılacaktır.

"Geceleri aya bakan bir kız" arama sorgusu girdiğinizi ve oluştur düğmesine bastığınızı varsayalım. Bu, sizin için bazı resimler oluşturacaktır, eğer herhangi bir resmi seçip resmin farklı varyasyonlarını denerseniz, o zaman krediniz de kullanılacaktır. Bu örnekte, bir görsel oluşturduğunuzda bir kredi ve bir varyasyonu denediğinizde bir kredi kullanılır, dolayısıyla hesabınızdan iki kredi tüketmişsinizdir.

MidJourney

MidJourney için fiyatlandırma planı, Dall-E'ye kıyasla yeni başlayanlar için biraz kafa karıştırıcı çünkü birkaç plan içeriyor ve algoritma kullanıyor. Her birini tek tek karşılaştıralım, ancak planı karşılaştırmadan önce hızlı GPU süresi, rahat GPU süresi ve özel görünürlük gibi belirli terminolojiler konusunda net olmanız gerekir.

Hızlı GPU süresi: Bir görüntü oluşturmak için herhangi bir istem girdiğinizde, görüntüyü oluşturmak için GPU kaynakları gerekir; GPU'nun görüntüyü oluşturmak için harcadığı süre karmaşıklığa, ayrıntılara, kaliteye ve daha fazlasına bağlıdır. Çok hızlı GPU modu, görüntüleri oluşturma süresini azaltır ve çıktıyı olabildiğince hızlı verir.

Rahat GPU süresi: Rahat modda, GPU işinizi bir öncelik olarak almaz ve görüntüyü oluşturmak için zaman harcar.

Özel Görünürlük: Oluşturduğunuz görseller, siz onları gizli tutmadığınız sürece herkes tarafından görülebilir. Resimleriniz sunucuda olacak ancak yalnızca sizin tarafınızdan görülebilecektir.

  • Ücretsiz deneme: MidJourney'e ilk kez kaydolduğunuzda 25 dakika/Ömür Boyu hızlı GPU süresi elde edeceksiniz. Bir görüntü oluşturma yaklaşık 1 dakika sürerse, bu planla ücretsiz olarak 25 görüntü oluşturabilirsiniz. Her görüntü veya varyasyon oluşturduğunuzda GPU'nun kullanılacağını, dolayısıyla yeni bir görüntü oluştururken ve ayrıca bir varyasyon oluştururken dakikalarca ücretlendirileceğinizi unutmayın.

Ücretsiz planda rahat GPU süresi ve özel görünürlük sağlanmaz.

  • Temel: Bu planı seçtiğinizde ayda 10 ABD doları ücretlendirileceksiniz. Bu planda, ayda 200 dakika hızlı GPU süresi ve kişisel bir bot Sohbeti alacaksınız. Bu planda rahat GPU süresi hala mevcut değildir, ancak ayda 20 ABD doları ek ödeyerek özel bir görünürlük özelliğini tercih edebilirsiniz.
  • Standart: Bu planda, rahat GPU süresi dahil olmak üzere ayda 30 ABD Doları karşılığında ayda 15 saat alacaksınız. Ancak bu planda da isterseniz özel görünürlüğü ayda 20 ABD doları karşılığında satın almanız gerekir.‌‌

Ayrıca, hem Temel hem de Standart planlar için, planınızda belirtilen süre boyunca dışarıdaysanız ek süre satın alabilirsiniz. 60 dakika için 4 $ ücret alacaktır.

  • Kurumsal: Bu plan, çok sayıda sanat eseri ve görsel üretmesi gereken büyük tasarım şirketleri için çok uygundur. Yılda 600 ABD Doları karşılığında, yılda 120 saat hızlı GPU süresi ve sınırsız rahat GPU süresi elde edeceksiniz, ayrıca ek ücret ödemeden özel görünürlük ve kişisel bir bot elde edeceksiniz.

Özelliklerin Karşılaştırılması

Dall-E'nin Özellikleri

  • İstediğiniz değişikliklere göre yüklenen görüntünün hızlı düzenlemesi.
  • Keşfetmek ve aralarından seçim yapmak için farklı varyasyonlar.
  • Oluşturulan görüntüleri genel veya özel klasörlerde depolamak için özel koleksiyon.
  • Oluşturulan görseli ticarileştirmek için tam kullanım hakkı.
  • Dall-E'nin beta sürümünü piyasaya sürmeden önce güvenliği zaten sağladı.

MidJourney'in Özellikleri

  • Discord linkini kullanarak herkes beta programına katılabilir.
  • Farklı varyasyonlar ve yüksek kaliteli görüntüler.
  • Çeşitlendirilmiş fiyatlandırma planları.
  • Hızlı ve rahat modun kullanılabilirliği.
  • Bir resim yükleyebilir ve değişiklik yapabilir.

Çözüm

AI, çalışmayı daha kolay ve zahmetsiz hale getirdi, ancak yine de bu teknoloji gelişiyor ve gelişiyor. Dall-E ve MidJourney, doğal dil aracılığıyla gerçekçi görüntüler oluşturmaya yardımcı olan olağanüstü yapay zeka araçlarıdır. Öyleyse beta programlarına katılın ve AI'nın yeni zirvesini keşfedin.

SSS

Hangisi daha iyi DALL-E veya MidJourney?

DALL-E daha gerçekçi görünen görüntüler yaratırken, MidJourney daha çok farklı sanat stillerindedir.

DALL-E görsellerini ücretsiz olarak kullanabilir misiniz?

DALL-E 2'nin kullanımı şu anda ücretsizdir, ancak bir püf noktası vardır. İlk ay, kullanmanız için 50 ücretsiz kredi ve ardından 15 ücretsiz kredi verilir.

MidJourney ne tür bir yapay zekadır?

MidJourney, OpenAI'nin DALL-E ve Stable Diffusion'a benzer şekilde, metin açıklamalarından görüntüler oluşturan, aynı ad altında tescilli bir yapay zeka programı üreten bağımsız bir araştırma laboratuvarıdır.

MidJourney aslında nasıl çalışıyor?

MidJourney'e şu anda yalnızca resmi Discord'larındaki bir Discord botu aracılığıyla, bota doğrudan mesaj göndererek veya botu üçüncü taraf bir sunucuya davet ederek erişilebilir.

‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌