Dall-E vs Midjourney — porównanie dwóch rewolucyjnych narzędzi sztucznej inteligencji
Opublikowany: 2023-01-05Sztuczna inteligencja nie jest już przyszłością, dzieje się teraz. Technologia bardzo się rozwinęła i nadal szybko się rozwija. Sztuczna inteligencja napędza rozwój, ułatwiając i przyspieszając wykonywanie zadań. Dall-E i MidJourney to oparte na sztucznej inteligencji generatory tekstu na obraz, które mają możliwość generowania oszałamiających obrazów cyfrowych, po prostu pobierając od Ciebie dane wejściowe.
Czy to nie fascynujące, że po prostu coś wpisujesz, a sztuczna inteligencja dostarcza pożądane obrazy? Właściwie to naprawdę fajne rzeczy do odkrywania i uczenia się.
Zarówno Dall-E, jak i MidJourney robią to samo, czyli generują obrazy na podstawie zapytania użytkownika, ale pewne czynniki różnią te dwa czynniki. W tym artykule porównamy Dall-E i MidJourney, więc przeczytaj cały artykuł i zaktualizuj swoją wiedzę o najnowszą technologię.
Porównanie Dall-E i Midjourney
- Podróż rozwojowa
- Wydajność i możliwości
- Jakość sztuki
- Interfejs użytkownika i ułatwienia dostępu
- Porównanie cen
- Porównanie funkcji
Porównanie Dall-E i MidJourney
Generatory obrazów AI stały się kolejną wielką rzeczą w Internecie. Ponieważ oba są najbardziej znanymi i prawdopodobnie najbardziej zaawansowanymi generatorami obrazów, oba mają potencjał zapewnienia doskonałych wyników.
Przyjrzyjmy się różnym aspektom, takim jak ich rozwój, ceny, jakość sztuki i inne. MidJourney i DALL-E, aby porównać i zdecydować, który z nich jest najlepszy.
Podróż rozwojowa
Dall-E to system AI opracowany przez OpenAI, laboratorium badawcze z siedzibą w San-Fransisco. OpenAI zostało zapoczątkowane przez Sama Altmana i innych pod koniec 2015 roku w celu opracowania rozwiązań opartych na sztucznej inteligencji, które rozwiązują różne zadania i znacznie ułatwiają ludzkie życie. Dall-E to jedno z rozwiązań AI firmy OpenAI, które świadczy usługi tworzenia obrazów.
Jest to duży model języka, który został przeszkolony na zbiorze danych składającym się z tekstu i obrazów, który może generować obrazy z opisów tekstowych, w procesie znanym jako generowanie obrazów lub synteza obrazów. Jest to wersja o 12 miliardach parametrów, która wykorzystuje zestawy danych tekst-obraz do generowania obrazu z tekstu.
Z drugiej strony MidJourney to także rozwiązanie oparte na sztucznej inteligencji opracowane przez niezależne laboratorium badawcze, które świadczy te same usługi, co Dall-E. Ponieważ intencja stojąca za rozwojem sztucznej inteligencji jest taka sama, a mianowicie szkolenie sztucznej inteligencji i umożliwienie jej łatwego rozwiązywania złożonych problemów z życia codziennego.
MidJourney pojawiło się jako rozwiązanie, które tworzy realistyczne obrazy każdego wprowadzonego przez Ciebie wkładu. Jest w fazie beta i stale się uczy i aktualizuje o nowe funkcje i możliwości. Aby ocalić zainteresowanie Artystów, MidJourney włączyło również politykę usuwania treści DMCA do warunków korzystania z usługi. Umożliwi to artystom zażądanie usunięcia dowolnego dzieła sztuki, jeśli uznają, że narusza ono prawa autorskie.
Wydajność i możliwości
Dall-E
Przeprowadza się wiele szkoleń z zestawami danych, aby wyszkolić system w celu ciągłego doskonalenia wydajności i możliwości. Dall-E wykorzystuje opisy tekstowe w języku naturalnym do tworzenia obrazów i dzieł sztuki w wysokiej rozdzielczości. Różne atrybuty, koncepcje i style są mieszane i dopasowywane, aby zapewnić najlepsze wyniki i wydajność.

6 kwietnia 2022 r. OpenAI wypuściło ulepszoną formę Dall-E o nazwie Dall-E 2. Koncepcja fotorealizmu stała się bardziej zaawansowana i wydajna dzięki Dall-E 2, który może tworzyć realistyczną sztukę przy użyciu danych w podpisie. Funkcjonalność tworzenia obrazu jest ogólna w Dall-E 2, ale oprócz tego może również dodawać dodatkowe informacje do istniejącego obrazu, a także tworzyć różne warianty danych obrazów na podstawie wprowadzonych danych wejściowych.
Dall-E wykorzystuje technologię o nazwie Clip (Contrastive language image pre-training) do cyfrowej fotosyntezy, opracowaną przez OpenAI. Pomaga dopasować obrazy do odpowiadających im podpisów w najlepszy możliwy sposób, w prostych słowach działa na parach tekstu i obrazu. Proces osadzania tekstu i osadzania obrazu ma na celu uzyskanie jak najlepszego efektu z danego podpisu.
W połowie podróży
Z drugiej strony MidJourney oferuje również świetną wydajność i zapewnia wysokiej jakości realistyczną grafikę z poleceń języka naturalnego. Poprzez ciągłe unowocześnianie technologii i usuwanie wad systemu, MidJourney bardzo rozwinął swoje możliwości z wersji 1 do wersji 4.
Co tydzień i co miesiąc wydaje aktualizacje w systemie, które jeszcze bardziej poprawiają wydajność sztucznej inteligencji. Jeśli porównasz wyniki uzyskane przez poprzednią wersję z najnowszą wersją, szczegóły obrazu w najnowszej wersji są na najwyższym poziomie z większą przejrzystością.
W poprzedniej wersji, jeśli wyszukasz „Statek kosmitów nad futurystycznym miastem”, znajdziesz obraz ze statkiem kosmicznym, ale umieszczenie statku kosmicznego nie było dobrze, nawet futurystyczne miasto też wyglądało niechlujnie. Najnowsza wersja poprawiła te wady, teraz jeśli wyszukasz to samo zapytanie, znajdziesz zdjęcie, na którym statek kosmiczny unosi się nad miastem, a nawet miasto wygląda znacznie bardziej realistycznie.
W związku z tym wydajność i możliwości obu systemów opartych na sztucznej inteligencji są bardzo podobne i zapewniają najlepsze wyniki w tworzeniu wysokiej jakości obrazów.
Jakość sztuki
Tworzenie obrazu bez wątpienia staje się łatwe dzięki Dall-E i MidJourney, które zapewniają wyjątkową jakość i wciąż ulepszają się dzięki różnym aktualizacjom. Tutaj porównaliśmy jakość grafiki stworzonej przez Dall-E i MidJourney. Przeszliśmy przez to samo wejście, którym jest „statki pływające po wzburzonym morzu” i otrzymaliśmy poniższy wynik.

Obraz po lewej stronie jest tworzony przez MidJourney, który wygląda przejrzyście i szczegółowo, bardzo dobrze rozpoznaje zapytanie i wydajnie renderuje każde słowo kluczowe, aby zapewnić wynik. Wzburzone morze wygląda fajnie na pierwszym zdjęciu z każdym najdrobniejszym szczegółem, tak jak atmosfera jest zharmonizowana z obrazem, zapewniając wygląd sztormowej pogody.
Z drugiej strony Dall-E wygenerował również obraz statków podczas sztormowej pogody, ale obraz wygląda prosto w porównaniu z obrazem MidJourney. Pogoda jest normalna i nie widać większych skutków burzy. Wygląda jak statki na morzu i nic więcej.
Można więc powiedzieć, że MidJourney jest bardziej precyzyjny i dokładny w tworzeniu obrazów w porównaniu do Dall-E. Ale nadal są w fazie beta i stale ewoluują, więc jest zbyt wcześnie, aby oceniać jakość.
Interfejs użytkownika i ułatwienia dostępu
Dall-E
Aby korzystać z Dall-E, musisz utworzyć konto w OpenAI, odwiedzając ich oficjalną stronę internetową i klikając przycisk rejestracji. Możesz wybrać swój adres e-mail i hasło, aby utworzyć konto, lub po prostu użyć istniejącego konta Gmail, aby utworzyć konto w OpenAI. Następnie musisz również zweryfikować swój numer telefonu komórkowego, aby kontynuować.

Po zakończeniu procesu rejestracji otrzymasz 50 kredytów na swoje konto za darmo w pierwszym miesiącu, a także otrzymasz 15 kredytów co miesiąc, które możesz wykorzystać na stworzenie wizerunku w Dall-E. Teraz jesteś gotowy do generowania obrazów z opisu języka naturalnego.
Na pasku wyszukiwania możesz wprowadzić swoją wyobraźnię za pomocą zapytania, a algorytm automatycznie generuje najlepszy wynik na podstawie zapytania. Mieszaj i dopasowuj obrazy oraz wypróbuj różne warianty, aby uzyskać najlepsze wyniki wyszukiwania. Możesz także przesłać obraz i zasugerować w nim zmiany za pomocą polecenia, aby stworzyć unikalne dzieło sztuki.
W połowie podróży
MidJourney działa obecnie tylko na serwerze discord, więc aby korzystać z MidJourney, potrzebujesz konta na discordzie. Przede wszystkim musisz odwiedzić stronę internetową MidJourney i kliknąć dołącz do programu beta. Następnie musisz zaakceptować zaproszenie na serwer discord od MidJourney. Teraz otwórz swoją aplikację discord i kliknij ikonę kształtu łodzi w MidJourney, możesz dołączyć do dowolnego pokoju dla nowicjuszy o nazwie „nowicjusz”.
Użyj zachęty /imagine i zacznij tworzyć obrazy z wyobraźni i uzyskaj wynik z MidJourney. Im dokładniej wprowadzisz dane wejściowe do polecenia, tym dokładniejszy uzyskasz wynik. Możesz także przesłać swój obraz i zastosować do niego różne odmiany, co spowoduje zmianę istniejącego obrazu na nowy zmodyfikowany obraz w oparciu o pożądane zmiany.
Porównanie cen
Dall-E
Po zarejestrowaniu się w OpenAI otrzymasz 50 kredytów za darmo do generowania obrazów w Dall-E, a także otrzymasz 15 kredytów co miesiąc. Ponadto możesz kupić dodatkowe 115 kredytów za 15 USD, jeśli nie masz kredytu. Ten kredyt zostanie wykorzystany za każdym razem, gdy klikniesz monit wyszukiwania i wypróbujesz różne warianty.
Załóżmy, że wpisujesz zapytanie „Dziewczyna patrząca nocą na księżyc” i naciskasz przycisk generowania. Spowoduje to utworzenie dla Ciebie kilku zdjęć, jeśli wybierzesz dowolne zdjęcie i wypróbujesz różne warianty obrazu, wówczas również Twój kredyt zostanie wykorzystany. W tym przykładzie jeden kredyt jest używany podczas generowania obrazu, a jeden kredyt jest używany podczas wypróbowywania odmiany, stąd zużyto dwa kredyty ze swojego konta.
W połowie podróży
Plan cenowy dla MidJourney jest nieco mylący dla początkujących w porównaniu do Dall-E, ponieważ zawiera kilka planów i wykorzystuje algorytmy. Porównajmy każdy z nich jeden po drugim, ale przed porównaniem planu musisz wyjaśnić pewne terminy, takie jak szybki czas GPU, zrelaksowany czas GPU i widoczność prywatna.
Szybki czas GPU: za każdym razem, gdy wprowadzisz monit o utworzenie obrazu, renderowanie obrazu zajmie zasoby GPU, czas potrzebny GPU do renderowania obrazu zależy od złożoności, szczegółów, jakości i innych. Tak szybki tryb GPU skraca czas renderowania obrazów i zapewnia wydruk tak szybko, jak to możliwe.
Zrelaksowany czas GPU: W trybie zrelaksowanym GPU nie traktuje Twojej pracy jako priorytetu i poświęca swój czas na renderowanie obrazu.
Prywatna widoczność: Twoje utworzone obrazy są widoczne publicznie, chyba że ustawisz je jako prywatne. Twoje zdjęcia będą na serwerze, ale będą widoczne tylko dla Ciebie.
- Bezpłatna wersja próbna: kiedy zarejestrujesz się w MidJourney po raz pierwszy, otrzymasz 25 min/dożywotni szybki czas GPU. Jeśli jedno wygenerowanie obrazu zajmuje około 1 minuty, możesz wygenerować 25 obrazów za darmo w ramach tego planu. Pamiętaj, że za każdym razem, gdy generujesz obraz lub odmianę, zużywa to GPU, dlatego naliczane są minuty podczas generowania nowego obrazu, a także podczas tworzenia odmiany.
Zrelaksowany czas GPU i prywatna widoczność nie są dostępne w planie darmowym.
- Podstawowy: jeśli zdecydujesz się na ten plan, zapłacisz 10 USD miesięcznie. W tym planie otrzymasz 200 min miesięcznie szybkiego czasu GPU i osobisty czat z botem. Zrelaksowany czas GPU nadal nie jest dostępny w tym planie, ale możesz wybrać funkcję widoczności prywatnej, płacąc dodatkowo 20 USD miesięcznie.
- Standard: w tym abonamencie otrzymasz 15 godzin miesięcznie za 30 USD miesięcznie, w tym wolny czas GPU. Ale w tym planie również musisz kupić prywatną widoczność za 20 USD miesięcznie, jeśli chcesz.
Ponadto, zarówno w przypadku planu podstawowego, jak i standardowego, możesz dokupić dodatkowy czas, jeśli nie ma Cię przez określony czas w planie. Opłata wynosi 4 USD za 60 minut.
- Korporacyjny: ten plan najlepiej nadaje się dla dużych firm projektowych, które muszą generować wiele dzieł sztuki i obrazów. Za 600 USD rocznie otrzymasz 120 godzin szybkiego procesora graficznego i nieograniczony, zrelaksowany czas GPU, dodatkowo uzyskasz prywatny wgląd i osobistego bota bez dodatkowych kosztów.
Porównanie funkcji
Cechy Dall-E
- Szybka edycja przesłanego obrazu na podstawie żądanych zmian.
- Różne warianty do zbadania i wyboru.
- Dedykowana kolekcja do przechowywania wygenerowanych obrazów w folderach publicznych lub prywatnych.
- Pełne prawo użytkowania do komercjalizacji stworzonego wizerunku.
- Już zapewniono bezpieczeństwo przed uruchomieniem wersji beta Dall-E.
Cechy MidJourney
- Każdy może dołączyć do programu beta, korzystając z łącza discord.
- Różne warianty i wysokiej jakości obrazy.
- Zróżnicowane plany cenowe.
- Dostępność trybu szybkiego i swobodnego.
- Może przesłać obraz i wprowadzić zmiany.
Wniosek
Sztuczna inteligencja sprawiła, że praca jest łatwiejsza i łatwiejsza, ale wciąż ta technologia ewoluuje i rozwija się. Dall-E i MidJourney to doskonałe narzędzia AI, które pomagają generować realistyczne obrazy za pomocą języka naturalnego. Dołącz więc do ich programu beta i odkryj nowy poziom sztucznej inteligencji.
Często zadawane pytania
Co jest lepsze DALL-E czy MidJourney?
DALL-E tworzy bardziej realistyczne obrazy, podczas gdy MidJourney opiera się bardziej na różnych stylach graficznych.
Czy możesz używać obrazów DALL-E za darmo?
DALL-E 2 jest obecnie darmowy, ale jest pewien haczyk. Przez pierwszy miesiąc masz do wykorzystania 50 darmowych kredytów, a następnie 15 darmowych kredytów.
Jakim rodzajem sztucznej inteligencji jest MidJourney?
MidJourney to niezależne laboratorium badawcze, które tworzy zastrzeżony program sztucznej inteligencji o tej samej nazwie, który tworzy obrazy z opisów tekstowych, podobnie jak DALL-E i Stable Diffusion firmy OpenAI.
Jak właściwie działa MidJourney?
MidJourney jest obecnie dostępny tylko za pośrednictwem bota Discord na ich oficjalnym Discordzie, poprzez bezpośrednie wysłanie wiadomości do bota lub zaproszenie bota na serwer innej firmy.