Dall-E vs Midjourney - مقارنة بين أداتين ثوريتين للذكاء الاصطناعي
نشرت: 2023-01-05لم يعد الذكاء الاصطناعي مفهومًا مستقبليًا ، إنه يحدث الآن. تطورت التكنولوجيا كثيرًا وما زالت تنمو بسرعة. لقد غذى الذكاء الاصطناعي النمو من خلال جعل المهام أسهل وأسرع. Dall-E و MidJourney ، كلاهما مولدات تحويل النص إلى صورة تعتمد على الذكاء الاصطناعي ولديهما القدرة على إنشاء صور رقمية مذهلة بمجرد أخذ المدخلات منك.
أليس من الرائع أنك تكتب شيئًا ما وأن الذكاء الاصطناعي يوفر لك الصور المطلوبة؟ في الواقع ، من الرائع حقًا استكشافها وتعلمها.
يقوم كل من Dall-E و MidJourney بنفس الشيء وهو إنشاء صور من استعلام المستخدم ، ولكن هناك عوامل معينة تفرق بين هذين الأمرين. هنا في هذه المقالة ، سنقارن بين Dall-E و MidJourney ، لذا اقرأ المقالة بأكملها وقم بتحديث معلوماتك بأحدث التقنيات.
مقارنة بين Dall-E و Midjourney
- رحلة التطوير
- الأداء والقدرات
- جودة الفن
- واجهة المستخدم وإمكانية الوصول
- مقارنة الأسعار
- مقارنة الميزات
مقارنة بين Dall-E و MidJourney
أصبحت مولدات الصور بالذكاء الاصطناعي هي الشيء الكبير التالي على الإنترنت. نظرًا لأن كليهما معروفان ويمكن القول أنهما أكثر مولدات الصور تقدمًا ، فإن كلاهما لديه القدرة على تزويدك بنتائج رائعة.
دعونا نلقي نظرة على الجوانب المختلفة مثل تطويرها ، والتسعير ، وجودة الفن وغيرها. من MidJourney و DALL-E للمقارنة وتحديد أيهما هو الأفضل بين هذين.
رحلة التطوير
Dall-E هو نظام ذكاء اصطناعي تم تطويره بواسطة OpenAI ، وهو مختبر أبحاث مقره في سان فرانسيسكو. تم إطلاق OpenAI بواسطة Sam Altman وآخرون في أواخر عام 2015 لتطوير حلول قائمة على الذكاء الاصطناعي والتي تحل المهام المختلفة وتجعل حياة الإنسان أسهل بكثير. Dall-E هو أحد حلول الذكاء الاصطناعي من OpenAI التي تقدم خدمات لإنشاء الصور.
إنه نموذج لغوي كبير تم تدريبه على مجموعة بيانات من النصوص والصور ، والتي يمكن أن تولد صورًا من أوصاف النص ، وهي عملية تُعرف باسم إنشاء الصور أو تركيب الصور. إنها نسخة ذات 12 مليار معلمة تستخدم مجموعات بيانات نصية لتوليد صورة من النص.
من ناحية أخرى ، يعد MidJourney أيضًا حلاً قائمًا على الذكاء الاصطناعي تم تطويره بواسطة مختبر أبحاث مستقل يقدم نفس الخدمات التي يقدمها Dall-E. نظرًا لأن الهدف من تطوير الذكاء الاصطناعي هو نفسه ، وهو تدريب الذكاء الاصطناعي وجعله قادرًا على حل مشاكل الحياة الواقعية المعقدة بسهولة.
ظهرت MidJourney كحل يخلق صورًا واقعية لأي مدخلات تقدمها. إنه في المرحلة التجريبية ويتعلم باستمرار ويرقي بميزات وإمكانيات جديدة. لحفظ اهتمام الفنانين ، قامت MidJourney أيضًا بتضمين سياسة الإزالة وفقًا لقانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية في شروط الخدمة الخاصة بهم. سيمكن هذا الفنانين من طلب إزالة أي قطعة فنية إذا شعروا أنها تنتهك حقوق النشر.
الأداء والقدرات
دال- إي
يخضع الكثير من التدريب باستخدام مجموعات البيانات لتدريب النظام على تحسين الأداء والقدرات باستمرار. يستخدم Dall-E أوصافًا نصية بلغة طبيعية لإنشاء صور عالية الدقة وقطع فنية. يتم خلط السمات والمفاهيم والأنماط المختلفة ومطابقتها لتقديم أفضل النتائج والأداء.

في السادس من أبريل 2022 ، أطلقت شركة OpenAI الشكل المحدث لـ Dall-E باسم Dall-E 2. أصبح مفهوم الصورة الواقعية أكثر تقدمًا وكفاءة مع Dall-E 2 الذي يمكنه إنشاء فن واقعي باستخدام البيانات الموجودة في التسمية التوضيحية. تعد وظيفة إنشاء صورة عامة في Dall-E 2 ، ولكن علاوة على ذلك ، يمكنها أيضًا إضافة بعض المعلومات الإضافية عن الصورة الحالية وأيضًا إنشاء أشكال مختلفة من الصور المعينة على أساس المدخلات التي تقدمها.
يستخدم Dall-E تقنية تسمى Clip (التدريب المسبق على صورة اللغة المتباينة) لعملية التمثيل الضوئي الرقمي ، والتي طورتها شركة OpenAI. يساعد في مطابقة الصور مع التسمية التوضيحية المقابلة لها بأفضل طريقة ممكنة ، وبكلمات بسيطة تعمل على أزواج النص والصورة. تتم عملية تضمين النص ودمج الصور للحصول على أفضل نتيجة من التسمية التوضيحية المحددة.
ميدجورني
من ناحية أخرى ، تقدم MidJourney أيضًا أداءً رائعًا وتوفر فنًا واقعيًا عالي الجودة من أوامر اللغة الطبيعية. من خلال الترقية المستمرة للتكنولوجيا وإزالة العيوب في النظام ، طورت MidJourney قدراتها كثيرًا من الإصدار 1 إلى الإصدار 4.
كل أسبوع وشهر ، يصدر بعض التحديثات في النظام التي تعمل على تحسين كفاءة الذكاء الاصطناعي. إذا قارنت النتائج الناتجة عن الإصدار السابق مع أحدث إصدار ، فستكون تفاصيل الصورة في الإصدار الأخير من الدرجة الأولى مع مزيد من الوضوح.
في الإصدار السابق ، إذا بحثت عن "سفينة الفضاء الغريبة فوق المدينة المستقبلية" ، فستجد الصورة مع سفينة الفضاء ولكن وضع سفينة الفضاء لم يكن جيدًا ، حتى أن المدينة المستقبلية كانت تبدو فوضوية إلى حد ما. أدى الإصدار الأخير إلى تحسين هذه العيوب ، والآن إذا بحثت عن نفس الاستعلام ، فستجد صورة تحوم فيها سفينة الفضاء فوق المدينة وحتى تبدو المدينة أيضًا أكثر واقعية.
ومن ثم ، فإن أداء وإمكانيات كل من الأنظمة القائمة على الذكاء الاصطناعي متشابهة إلى حد كبير وتقدم أفضل نتيجة في إنشاء صور عالية الجودة.
جودة الفن
يصبح إنشاء صورة أمرًا سهلاً بلا شك مع Dall-E و MidJourney ، وكلاهما يوفر جودة استثنائية ولا يزال يتحسن مع التحديثات المختلفة. قمنا هنا بمقارنة جودة الفن الذي تم إنشاؤه بواسطة Dall-E و MidJourney. لقد مررنا نفس المدخلات وهي "السفن التي تبحر في بحر عاصف" وحصلنا على النتيجة التالية.

يتم إنشاء الصورة اليسرى بواسطة MidJourney والتي تبدو واضحة ومفصلة ، وهي تتعرف على الاستعلام جيدًا وتعرض كل كلمة رئيسية بكفاءة لتقديم النتيجة. يبدو البحر العاصف رائعًا في الصورة الأولى مع كل التفاصيل الدقيقة مثل تناغم الغلاف الجوي مع الصورة التي توفر مظهرًا للطقس العاصف.
من ناحية أخرى ، قام Dall-E أيضًا بإنشاء صورة للسفن في طقس عاصف ، لكن الصورة تبدو بسيطة مقارنة بصورة MidJourney. الطقس طبيعي ولا يوجد تأثير كبير للعاصفة مرئي. يبدو مثل السفن في البحر ولا شيء أكثر من ذلك.
ومن ثم ، يمكننا القول أن MidJourney أكثر دقة ودقة في إنشاء الصور مقارنة بـ Dall-E. لكن مع ذلك ، فهي في المرحلة التجريبية وتتطور باستمرار ، لذلك من السابق لأوانه الحكم على الجودة.
واجهة المستخدم وإمكانية الوصول
دال- إي
من أجل استخدام Dall-E ، تحتاج إلى إنشاء حساب مع OpenAI من خلال زيارة موقع الويب الرسمي الخاص بهم والنقر على زر التسجيل. يمكنك اختيار عنوان بريدك الإلكتروني وكلمة المرور لإنشاء حساب أو ببساطة استخدام حساب Gmail الحالي الخاص بك لإنشاء حساب مع OpenAI. بعد ذلك ، تحتاج أيضًا إلى التحقق من رقم هاتفك المحمول للمتابعة.
بمجرد إكمال عملية التسجيل الخاصة بك ، ستحصل على 50 ائتمانًا مجانًا في حسابك في الشهر الأول وستحصل أيضًا على 15 رصيدًا كل شهر ، والتي يمكنك استخدامها لإنشاء صورة في Dall-E. أنت الآن جاهز لإنشاء صور من وصف اللغة الطبيعية.

في شريط البحث ، يمكنك إدخال خيالك عبر الاستعلام وتقوم الخوارزمية تلقائيًا بإنشاء أفضل نتيجة بناءً على استعلام البحث الخاص بك. امزج الصور وطابقها وجرب أشكالًا مختلفة للحصول على أفضل نتيجة من بحثك. يمكنك أيضًا تحميل صورة واقتراح أي تغييرات عليها من خلال أوامرك لإنشاء قطعة فنية فريدة.
ميدجورني
تعمل MidJourney حاليًا على خادم الفتنة فقط ، لذا لاستخدام MidJourney تحتاج إلى حساب على الخلاف. بادئ ذي بدء ، تحتاج إلى زيارة موقع ويب MidJourney والنقر فوق برنامج الانضمام إلى الإصدار التجريبي. بعد ذلك ، تحتاج إلى قبول دعوة إلى خادم الفتنة من MidJourney. افتح الآن تطبيق الفتنة وانقر على أيقونة شكل القارب في MidJourney ، يمكنك الانضمام إلى أي غرفة وافد جديد باسم "مبتدئ".
استخدم موجه / تخيل وابدأ في إنشاء صور من خيالك واحصل على النتيجة من MidJourney. كلما قدمت المدخلات في الأمر بدقة أكبر ، كلما حصلت على نتيجة أكثر دقة. يمكنك أيضًا تحميل صورتك وتطبيق أشكال مختلفة عليها ، وهذا سيغير صورتك الحالية إلى صورة معدلة جديدة بناءً على التغييرات التي تريدها.
مقارنة الأسعار
دال- إي
عند التسجيل في OpenAI ، ستحصل على 50 رصيدًا مجانًا لإنشاء صور في Dall-E وستحصل أيضًا على 15 رصيدًا كل شهر. علاوة على ذلك ، يمكنك شراء 115 ائتمانًا إضافيًا مقابل 15 دولارًا إذا كان رصيدك خارجًا. سيتم الاستفادة من هذا الرصيد في كل مرة تضغط فيها على موجه بحث وتجربة أشكال مختلفة.
لنفترض أنك أدخلت استعلام بحث "فتاة تنظر إلى القمر ليلاً" واضغطت على زر إنشاء. سيؤدي هذا إلى إنشاء بعض الصور لك ، إذا حددت أي صورة وجربت أشكالًا مختلفة من الصورة ، فسيتم أيضًا الاستفادة من رصيدك. في هذا المثال ، يتم استخدام ائتمان واحد عند إنشاء صورة ويتم استخدام رصيد واحد عند تجربة أحد الأشكال ، وبالتالي استهلكت رصيدين من حسابك.
ميدجورني
تعد خطة التسعير الخاصة بـ MidJourney مربكة بعض الشيء للمبتدئين مقارنة بـ Dall-E لأنها تحتوي على العديد من الخطط وتستخدم الخوارزميات. دعنا نقارن كل منها واحدًا تلو الآخر ، ولكن قبل مقارنة الخطة ، يجب أن تكون واضحًا بشأن مصطلحات معينة مثل وقت GPU السريع ، ووقت GPU المريح ، والرؤية الخاصة.
وقت GPU السريع: كلما أدخلت أي مطالبة لإنشاء صورة ، سيستغرق الأمر موارد GPU لعرض الصورة ، والوقت الذي تستغرقه وحدة معالجة الرسومات لعرض الصورة يعتمد على التعقيد والتفاصيل والجودة والمزيد. يقلل وضع GPU السريع من وقت عرض الصور ويعطي الإخراج بأسرع ما يمكن.
وقت مريح لوحدة معالجة الرسومات: في الوضع المريح ، لا تأخذ وحدة معالجة الرسومات عملك كأولوية وتستغرق وقتًا لعرض الصورة.
الرؤية الخاصة: تكون صورك التي تم إنشاؤها مرئية للجمهور ما لم تضعها في مكان خاص. ستكون صورك على الخادم ولكنها مرئية لك فقط.
- نسخة تجريبية مجانية: عند التسجيل في MidJourney لأول مرة ، ستحصل على 25 دقيقة / مدى الحياة بسرعة GPU. إذا استغرق إنشاء صورة واحدة حوالي دقيقة واحدة من الوقت ، فيمكنك إنشاء 25 صورة مجانًا باستخدام هذه الخطة. ضع في اعتبارك أنه في كل مرة تنشئ فيها صورة أو شكلًا مختلفًا ، سيستغرق الأمر GPU ، وبالتالي ستتم محاسبتك على دقائق أثناء إنشاء صورة جديدة وأيضًا أثناء إنشاء شكل مختلف.
لا يتم توفير وقت GPU المريح والرؤية الخاصة في الخطة المجانية.
- أساسي: ستحصل على 10 دولارات شهريًا عند اختيار هذه الخطة. في هذه الخطة ، ستحصل على 200 دقيقة شهريًا من وقت GPU السريع ودردشة روبوت شخصية. لا يزال وقت GPU المريح غير متاح في هذه الخطة ولكن يمكنك اختيار ميزة الرؤية الخاصة عن طريق دفع 20 دولارًا إضافيًا شهريًا.
- قياسي: في هذه الخطة ، ستحصل على 15 ساعة في الشهر بسعر 30 دولارًا في الشهر شاملة وقت GPU المريح. ولكن في هذه الخطة ، تحتاج أيضًا إلى شراء الرؤية الخاصة مقابل 20 دولارًا في الشهر إذا كنت تريد ذلك
أيضًا ، لكل من الخطط الأساسية والقياسية ، يمكنك شراء وقت إضافي إذا كنت خارجًا في الوقت المحدد في خطتك. سيكلف 4 دولارات لمدة 60 دقيقة.
- الشركة: هذه الخطة هي الأنسب لشركات التصميم الكبيرة التي تحتاج إلى إنشاء العديد من القطع الفنية والصور. مقابل 600 دولار في السنة ، ستحصل على 120 ساعة في السنة من وقت GPU السريع ووقت GPU المريح غير المحدود ، بالإضافة إلى ذلك ستحصل على رؤية خاصة وروبوت شخصي دون أي تكلفة إضافية.
مقارنة الميزات
ميزات Dall-E
- تحرير سريع للصورة المحملة بناءً على التغييرات التي تريدها.
- اختلافات مختلفة للاستكشاف والاختيار من بينها.
- مجموعة مخصصة لتخزين الصور المُنشأة في مجلدات عامة أو خاصة.
- حق الاستخدام الكامل لتسويق الصورة التي تم إنشاؤها.
- تم ضمان الأمان بالفعل قبل إطلاق الإصدار التجريبي من Dall-E.
ميزات MidJourney
- يمكن لأي شخص الانضمام إلى برنامج بيتا باستخدام رابط الديسكورد.
- اختلافات مختلفة وصور عالية الجودة.
- خطط تسعير متنوعة.
- توافر الوضع السريع والمريح.
- يمكن تحميل صورة وإجراء التغييرات.
استنتاج
لقد جعل الذكاء الاصطناعي العمل أسهل وأيسر ، ولكن لا تزال هذه التكنولوجيا تتطور وتتطور. يعد كل من Dall-E و MidJourney من أدوات الذكاء الاصطناعي الرائعة التي تساعد على إنشاء صور واقعية من خلال اللغة الطبيعية. لذا ، انضم إلى برنامجهم التجريبي واستكشف الارتفاع الجديد للذكاء الاصطناعي.
التعليمات
أيهما أفضل DALL-E أم MidJourney؟
ينشئ DALL-E صورًا أكثر واقعية بينما تركز MidJourney بشكل أكبر على أنماط فنية مختلفة.
هل يمكنك استخدام صور DALL-E مجانًا؟
DALL-E 2 مجاني للاستخدام حاليًا ، ولكن هناك فائدة. للشهر الأول ، يتم تخصيص 50 رصيدًا مجانيًا لاستخدامها و 15 رصيدًا مجانيًا بعد ذلك.
ما نوع الذكاء الاصطناعي في MidJourney؟
MidJourney هو مختبر أبحاث مستقل ينتج برنامج ذكاء اصطناعي خاص تحت نفس الاسم يقوم بإنشاء صور من أوصاف نصية ، على غرار DALL-E من OpenAI و Stable Diffusion.
كيف يعمل MidJourney في الواقع؟
لا يمكن الوصول إلى MidJourney حاليًا إلا من خلال برنامج Discord bot الموجود على Discord الرسمي ، أو عن طريق المراسلة المباشرة إلى الروبوت ، أو عن طريق دعوة الروبوت إلى خادم جهة خارجية.