Dall-E vs Midjourney - Compararea a două instrumente AI revoluționare
Publicat: 2023-01-05AI nu mai este un concept viitor, se întâmplă acum. Tehnologia a evoluat foarte mult și este încă în creștere rapidă. Inteligența artificială a alimentat creșterea făcând sarcinile mai ușoare și mai rapide. Dall-E și MidJourney, ambele sunt generatoare de text-to-image bazate pe inteligență artificială, care dețin capacitatea de a genera imagini digitale uimitoare doar luând informații de la dvs.
Nu este fascinant că doar tastezi ceva și AI vă oferă imaginile dorite? De fapt, sunt lucruri grozave de explorat și de învățat.
Atât Dall-E, cât și MidJourney fac același lucru, care este să genereze imagini din interogarea utilizatorului, dar anumiți factori le diferențiază pe acestea două. Aici, în acest articol, vom compara Dall-E și MidJourney, așa că citiți întregul articol și actualizați-vă cunoștințele cu cea mai recentă tehnologie.
Comparație între Dall-E și Midjourney
- Călătoria de dezvoltare
- Performanță și capacități
- Calitatea art
- Interfață cu utilizatorul și accesibilitate
- Compararea pretului
- Comparația caracteristicilor
Comparație între Dall-E și MidJourney
Generatoarele de imagini AI au devenit următorul lucru important pe internet. Deoarece ambele sunt cele mai cunoscute și, probabil, cele mai avansate generatoare de imagini, ambele au potențialul de a vă oferi rezultate excelente.
Să analizăm diferitele aspecte, cum ar fi dezvoltarea lor, prețul, calitatea artei și altele. de MidJourney și DALL-E pentru a compara și a decide care este cel mai bun dintre acești doi.
Călătoria de dezvoltare
Dall-E este un sistem AI dezvoltat de OpenAI, un laborator de cercetare cu sediul în San-Fransisco. OpenAI a fost lansat de Sam Altman și alții la sfârșitul anului 2015 pentru a dezvolta soluții bazate pe inteligență artificială care rezolvă diferite sarcini și ușurează mult viața omului. Dall-E este una dintre soluțiile AI de la OpenAI care oferă servicii pentru crearea de imagini.
Este un model de limbaj mare care a fost antrenat pe un set de date de text și imagini, care poate genera imagini din descrierile textului, un proces cunoscut sub numele de generare de imagini sau sinteză de imagini. Este o versiune cu 12 miliarde de parametri care utilizează seturi de date text-imagine pentru a genera o imagine din text.
Pe de altă parte, MidJourney este, de asemenea, o soluție bazată pe inteligență artificială dezvoltată de un laborator de cercetare independent care oferă aceleași servicii ca și Dall-E. Deoarece intenția din spatele dezvoltării AI este aceeași, și anume de a antrena AI și de a le face capabile să rezolve cu ușurință probleme complexe din viața reală.
MidJourney a apărut ca o soluție care creează imagini realiste ale oricărei intrări pe care le oferiți. Este în faza beta și învață și se actualizează continuu cu noi funcții și capabilități. Pentru a salva interesul artiștilor, MidJourney a inclus și politica de eliminare DMCA în termenii și condițiile lor. Acest lucru va permite artiștilor să solicite eliminarea oricărei piese de artă dacă consideră că încalcă drepturile de autor.
Performanță și capacități
Dall-E
O mulțime de instruire cu seturi de date sunt supuse pentru a instrui sistemul pentru a îmbunătăți constant performanța și capacitățile. Dall-E folosește descrieri de text în limbaj natural pentru a crea imagini de înaltă rezoluție și lucrări de artă. Diferite atribute, concepte și stiluri sunt amestecate și combinate pentru a oferi cele mai bune rezultate și performanțe.

Pe 6 aprilie 2022, OpenAI a lansat forma îmbunătățită de Dall-E cu numele Dall-E 2. Conceptul de fotorealism a devenit mai avansat și mai eficient cu Dall-E 2, care poate crea artă realistă folosind datele din legendă. Funcționalitatea de a crea o imagine este generală în Dall-E 2, dar în plus, poate adăuga și câteva informații suplimentare despre imaginea existentă și, de asemenea, poate crea diferite variații ale imaginilor date pe baza intrării pe care o furnizați.
Dall-E folosește o tehnologie numită Clip (Pre-training pentru imagini contrastante) pentru fotosinteza digitală, care este dezvoltată de OpenAI. Ajută să potriviți imaginile cu legenda lor corespunzătoare în cel mai bun mod posibil, în cuvinte simple funcționează pe perechi de text și imagini. Procesul de încorporare a textului și de încorporare a imaginii are loc pentru a produce cel mai bun rezultat din legenda dată.
MidJourney
Pe de altă parte, MidJourney oferă, de asemenea, performanțe excelente și oferă artă realistă de înaltă calitate din comenzile în limbaj natural. Prin modernizarea continuă a tehnologiei și eliminarea defectelor din sistem, MidJourney și-a evoluat foarte mult capacitățile de la versiunea 1 la versiunea 4.
În fiecare săptămână și lună, lansează câteva actualizări în sistem care îmbunătățesc și mai mult eficiența AI. Dacă comparați rezultatele produse de versiunea anterioară cu cea mai recentă versiune, detaliile imaginii din cea mai recentă versiune sunt de top, cu mai multă claritate.
În versiunea anterioară, dacă căutați „Nava extraterestră deasupra orașului futurist”, veți găsi imaginea cu nava spațială, dar plasarea navei spațiale nu a fost bine, chiar și orașul futurist arăta cumva dezordonat. Cea mai recentă versiune a îmbunătățit aceste defecte, acum, dacă căutați aceeași interogare, veți găsi o imagine în care nava spațială plutește deasupra orașului și chiar și orașul arată mult mai realist.
Prin urmare, performanța și capacitățile ambelor sisteme bazate pe AI sunt aproape similare și oferă cel mai bun rezultat în crearea de imagini de înaltă calitate.
Calitatea art
Crearea unei imagini devine, fără îndoială, ușoară cu Dall-E și MidJourney, ambele oferă o calitate excepțională și se îmbunătățesc în continuare cu diferite actualizări. Aici am comparat calitatea artei create de Dall-E și MidJourney. Am trecut de aceeași intrare care este „nave care navighează într-o mare furtunoasă” și obținem rezultatul de mai jos.

Imaginea din stânga este creată de MidJourney, care arată clar și detaliat, recunoaște foarte bine interogarea și redă eficient fiecare cuvânt cheie pentru a oferi rezultatul. O mare furtunoasă arată mișto în prima imagine cu fiecare detaliu minut, ca și cum atmosfera este armonizată cu imaginea oferind o privire de vreme furtunoasă.
Pe de altă parte, Dall-E a generat și imaginea navelor pe vreme furtunoasă, dar imaginea pare simplă în comparație cu imaginea MidJourney. Vremea este normală și nu se vede prea mult efectul furtunii. Arată ca niște nave în mare și nimic mai mult.
Prin urmare, putem spune că MidJourney este mai precis și mai precis în crearea de imagini în comparație cu Dall-E. Dar totuși, acestea sunt în faza beta și evoluează continuu, așa că este prea devreme pentru a judeca calitatea.
Interfață cu utilizatorul și accesibilitate
Dall-E
Pentru a utiliza Dall-E, trebuie să vă creați un cont la OpenAI, vizitând site-ul lor oficial și făcând clic pe butonul de înregistrare. Puteți alege adresa de e-mail și parola pentru a crea un cont sau pur și simplu puteți utiliza contul dvs. Gmail existent pentru a crea un cont cu OpenAI. După aceea, trebuie să vă verificați și numărul de telefon mobil pentru a continua.

Odată ce finalizați procesul de înscriere, veți primi 50 de credite gratuit în contul dvs. în prima lună și, de asemenea, veți primi 15 credite în fiecare lună, pe care le puteți folosi pentru a crea o imagine în Dall-E. Acum sunteți gata să generați imagini dintr-o descriere a limbajului natural.
În bara de căutare, vă puteți introduce imaginația prin interogare, iar algoritmul generează automat cel mai bun rezultat pe baza interogării dvs. de căutare. Amestecați și potriviți imaginile și încercați diferite variante pentru a obține cel mai bun rezultat din căutarea dvs. De asemenea, puteți încărca o imagine și sugerați orice modificări aduse acesteia prin comanda dvs. pentru a crea o piesă de artă unică.
MidJourney
MidJourney operează în prezent doar pe serverul discord, așa că pentru a utiliza MidJourney aveți nevoie de un cont pe discord. În primul rând, trebuie să vizitați site-ul web MidJourney și să faceți clic pe programul beta de alăturare. După aceasta, trebuie să acceptați o invitație la serverul Discord de la MidJourney. Acum deschideți aplicația Discord și faceți clic pe pictograma cu formă de barcă din MidJourney, vă puteți alătura oricărei camere pentru nou-veniți cu numele „începător”.
Utilizați promptul /imaginați și începeți să creați imagini din imaginația dvs. și obțineți rezultatul de la MidJourney. Cu cât dați mai precis intrarea în comandă, cu atât veți obține un rezultat mai precis. Puteți, de asemenea, să încărcați imaginea și să-i aplicați diferite variații, aceasta vă va schimba imaginea existentă într-o imagine nouă modificată în funcție de modificările pe care le doriți.
Compararea pretului
Dall-E
Când tocmai vă înregistrați în OpenAI, veți primi 50 de credite gratuit pentru a genera imagini în Dall-E și, de asemenea, veți primi 15 credite în fiecare lună. În plus, puteți achiziționa 115 credite suplimentare pentru 15 USD dacă nu aveți credit. Acest credit va fi utilizat de fiecare dată când apăsați o solicitare de căutare și încercați diferite variante.
Să presupunem că introduceți o interogare de căutare „O fată care se uită la luna noaptea” și apăsați butonul de generare. Acest lucru va crea câteva imagini pentru dvs., dacă selectați orice imagine și încercați diferite variante ale imaginii, atunci și creditul dvs. va fi utilizat. În acest exemplu, un credit este folosit când ați generat o imagine și un credit este utilizat când ați încercat o variantă, prin urmare ați consumat două credite din contul dvs.
MidJourney
Planul de prețuri pentru MidJourney este puțin confuz pentru începători în comparație cu Dall-E, deoarece conține mai multe planuri și folosește algoritmi. Să comparăm fiecare dintre ele unul câte unul, dar înainte de a compara planul trebuie să fii clar cu privire la anumite terminologii, cum ar fi timpul rapid de GPU, timpul GPU relaxat și vizibilitatea privată.
Timp rapid GPU: de fiecare dată când introduceți orice solicitare pentru crearea unei imagini, va fi nevoie de resurse GPU pentru a reda imaginea, timpul necesar GPU pentru a reda imaginea depinde de complexitate, detalii, calitate și multe altele. Modul GPU atât de rapid reduce timpul de redare a imaginilor și oferă o ieșire cât mai rapidă posibil.
Timp GPU relaxat: în modul relaxat, GPU nu ia munca dvs. ca prioritate și își ia timpul pentru a reda imaginea.
Vizibilitate privată: imaginile create de dvs. sunt vizibile pentru public, cu excepția cazului în care le puneți în privat. Imaginile tale vor fi pe server, dar vor fi vizibile numai pentru tine.
- Probă gratuită: când vă înregistrați în MidJourney pentru prima dată, veți obține 25 de minute/GPU rapid timp de viață. Dacă generarea unei imagini durează aproximativ 1 minut, atunci puteți genera 25 de imagini gratuit cu acest plan. Rețineți că de fiecare dată când generați o imagine sau o variantă, va fi nevoie de GPU, prin urmare veți fi taxat cu minute în timp ce generați o nouă imagine și, de asemenea, în timp ce creați o variație.
Timpul GPU relaxat și vizibilitatea privată nu sunt furnizate în planul gratuit.
- De bază: veți percepe 10 USD/lună când optați pentru acest plan. În acest plan, veți primi 200 de minute pe lună de timp GPU rapid și un chat bot personal. Timpul GPU relaxat nu este încă disponibil în acest plan, dar puteți opta pentru o funcție de vizibilitate privată plătind suplimentar 20 USD/lună.
- Standard: în acest plan, veți primi 15 ore/lună la 30 USD/lună, inclusiv timp GPU relaxat. Dar și în acest plan trebuie să achiziționați vizibilitatea privată pentru 20 USD/lună dacă doriți.
De asemenea, atât pentru planurile de bază, cât și pentru cele standard, puteți achiziționa timp suplimentar dacă sunteți în afara orelor specificate în planul dvs. Va percepe 4 USD pentru 60 de minute.
- Corporate: Acest plan este cel mai potrivit pentru marile companii de design care trebuie să genereze multe piese de artă și imagini. Pentru 600 USD/an, veți primi 120 de ore/an de timp GPU rapid și timp GPU relaxat nelimitat, în plus, veți obține vizibilitate privată și un bot personal fără costuri suplimentare.
Comparația caracteristicilor
Caracteristicile lui Dall-E
- Editare rapidă a imaginii încărcate în funcție de modificările pe care le doriți.
- Diferite variații pentru a explora și a alege.
- Colecție dedicată pentru stocarea imaginilor generate în foldere publice sau private.
- Drept de utilizare complet pentru comercializarea imaginii create.
- Deja asigurat siguranța înainte de lansarea versiunii beta a Dall-E.
Caracteristicile MidJourney
- Oricine se poate alătura programului beta utilizând link-ul discord.
- Diferite variante și imagini de înaltă calitate.
- Planuri de prețuri diversificate.
- Disponibilitatea modului rapid și relaxat.
- Poate încărca o imagine și poate face modificări.
Concluzie
AI a făcut munca mai ușoară și fără efort, dar totuși, această tehnologie evoluează și se dezvoltă. Dall-E și MidJourney sunt ambele instrumente AI remarcabile care ajută la generarea de imagini realiste prin limbajul natural. Așadar, alăturați-vă programului lor beta și explorați noua culme a AI.
FAQ
Care este mai bun DALL-E sau MidJourney?
DALL-E creează imagini mai reale, în timp ce MidJourney este mai mult pe diferite stiluri de artă.
Puteți folosi imaginile DALL-E gratuit?
DALL-E 2 este în prezent folosit gratuit, dar există o captură. Pentru prima lună, vi se acordă 50 de credite gratuite de utilizat și 15 credite gratuite după aceea.
Ce tip de IA este MidJourney?
MidJourney este un laborator de cercetare independent care produce un program proprietar de inteligență artificială sub același nume care creează imagini din descrieri textuale, similar cu DALL-E și Stable Diffusion de la OpenAI.
Cum funcționează de fapt MidJourney?
MidJourney este în prezent accesibil numai printr-un bot Discord pe Discord oficial, prin mesaje directe botului sau prin invitarea botului pe un server terță parte.