Cum poate fi folosită generarea de imagini AI cu DALL·E 2 în marketingul digital?

Publicat: 2022-10-17

„Uau, ai luat asta? Stai puțin – asta a fost făcut de un fotograf profesionist…?”

Aceasta a fost reacția lui Jake, medicul nostru, când i-am arătat imaginea de mai jos: o imagine fotorealistă generată de DALL·E 2 de la OpenAI, creată în câteva secunde, folosind o solicitare pe care am introdus-o pentru „o fotografie macro a unui fluture pe o floarea soarelui” .

Este o fotografie care arată atât de reală și a surprins claritatea și culoarea unui fluture în prim plan și focalizarea fină a floarea-soarelui în fundal. De fapt, atât de mult, încât ți-ar fi greu să găsești mulți oameni care pot găsi semne evidente, artefacte sau un sentiment de greșeală, care pot fi comune în imaginile generate de AI.

Acesta a fost momentul în care mi-am dat seama că am intrat în punctul în care sistemele avansate de inteligență artificială pot înțelege și crea imagini fotorealiste care, în multe cazuri, nu se pot distinge de viața reală. Acest lucru are implicații interesante pentru oricine lucrează în industriile creative și digitale sau, într-adevăr, orice rol care implică aprovizionarea sau manipularea imaginilor.

În acest articol, explorez câteva aplicații practice ale utilizării DALL·E 2 de la OpenAI în lumea creativă și a marketingului digital și modul în care instrumentele de editare recent actualizate ale DALL·E 2 pot fi folosite pentru a sprijini munca creativă.

Imagine fotorealistă generată de inteligență artificială a unui fluture pe o floarea soarelui

Ce este DALL·E 2?

DALL·E 2 de la OpenAI este un generator de imagini bazat pe inteligență artificială care preia un mesaj simplu bazat pe text și generează imagini pe baza înțelegerii de către AI a acelui prompt. În câteva secunde, veți obține patru variante de imagine generate, care pot fi apoi descărcate, partajate sau salvate ca favorite în contul dvs. OpenAI.

DALL·E 2 este acum disponibil pentru toată lumea. Primești 15 credite gratuite pe lună, cu 1 credit necesar pe generație și fiecare 115 credite costând 15 USD. Puteți genera imagini de la zero sau puteți încărca propriile fotografii pentru a le manipula, cu condiția ca acestea să respecte Politica de conținut DALL·E 2 și, conform condițiilor de utilizare, „puteți folosi Generations în orice scop legal, inclusiv pentru uz comercial”.

Acest lucru face ca atribuirea să fie un subiect interesant și cât de mult merit ar trebui acordat persoanei care furnizează solicitările, sursa imaginii la editarea unei imagini sau DALL·E 2. Toate imaginile pe care le-am folosit în această postare de blog, de exemplu, fie generat cu DALL·E 2 sau generat o imagine de bibliotecă de stoc modificată, dar m-aș simți oarecum o fraudă dacă mi-aș atribui aceste generații sau modificări.

Imaginile pot fi generate pe baza:

Subiect: puteți genera imagini cu orice doriți; peisaje, animale, obiecte, concepte abstracte atâta timp cât respectă politica de conținut care, de exemplu, interzice generarea de imagini cu oameni celebri pentru a evita proliferarea deepfake-urilor.
Mediu: de la schițe în creion și picturi în ulei până la pixel art și ilustrații digitale, DALL·E 2 poate genera imagini reprezentând orice tip de mediu.
Setări de mediu: adăugați factori de mediu prompti, cum ar fi „apusul soarelui” sau „ceața” pentru a oferi imaginilor dvs. un pic de atmosferă.
Locație: dacă trebuie să plasați imaginile într-o anumită locație, dați promptului un oraș sau o țară și ar trebui să obțineți repere, stiluri de construcție etc. asociate cu acel loc.
Stil artistic: DALL·E 2 poate genera imagini în stilul diferiților artiști. Doar adăugați „în stilul [artist]” la solicitări.
Setările camerei: deosebit de utile pentru stilurile fotografice, puteți adăuga setări ale camerei la solicitările dvs. pentru a oferi fotografiilor o varietate de fotografii și calități diferite. Exemplele includ „fotografie macro de 35 mm”, „expunere lungă” sau „obiectiv ochi de pește”.

Folosește doar un limbaj natural pentru a combina oricare dintre cele de mai sus pentru a descrie ceea ce vrei, cum ar fi „Homer Simpson într-o cafenea pariziană în stilul lui Picasso” și în câteva secunde vei avea câteva generații.

Exemple de diferite stiluri artistice de la promptul „Homer Simpson într-o cafenea pariziană în stilul lui [Kandinsky][Van Gogh]”

Este ușor să te pierzi într-o groapă de posibilități atunci când explorezi capabilitățile DALL·E 2, dar există și multe aplicații practice ale instrumentului, în special în design și marketing, care sunt explorate mai târziu în acest articol.

Cum funcționează DALL·E 2?

Nu voi pretinde că înțeleg pe deplin sau chiar voi încerca să explic exact cum funcționează generarea de imagini DALL·E 2 AI – există o mulțime de articole care fac acest lucru. Dar ceea ce pot spune este că este mult mai mult decât un algoritm inteligent care folosește un set complex de logică. Este învățarea automată. O inteligență artificială care a fost antrenată, de-a lungul timpului, din miliarde de imagini sursă și limbaj natural și relația dintre ambele.

În centrul său se află un model de difuzie care începe cu zgomot aleatoriu și care este rafinat iterativ pe mai multe cicluri până când apare ceva care seamănă cu înțelegerea de către AI a promptului solicitat.

Instrumentul DALL·E 2 în sine este simplu de utilizat. Odată autentificat, sunteți întâmpinat cu un câmp simplu de introducere în care puteți începe să generați imagini pe baza unui mesaj text sau puteți încărca propria imagine pentru a o edita.
Caseta de dialog DALLE2 Prompt

O serie de instrumente de editare a imaginilor devin disponibile atât pentru imaginile generate, cât și pentru cele încărcate, pe care le vom explora mai târziu în acest articol.

Folosind DALL·E 2 pentru aprovizionarea imaginilor

Una dintre cele mai evidente utilizări ale generării de imagini bazate pe inteligență artificială este aprovizionarea cu fotografii sau alte stiluri de imagine pentru a le folosi pentru postări de blog, prezentări, site-uri web, reclame și diverse alte medii. Bibliotecile de fotografii de stoc, cum ar fi ShutterStock, iStockPhotos sau Unsplash sunt adesea alegeri populare atunci când vine vorba de aprovizionare cu imagini, dar probabil că vom vedea că oamenii apelează din ce în ce mai mult la DALL·E 2 pentru o alternativă mai rapidă și mai ieftină, precum și crearea. de imagini care sunt cu adevărat unice și nu există nicăieri altundeva online.

DALL·E 2 poate fi deosebit de util atunci când se aprovizionează imagini care au un subiect foarte specific, cum ar fi un „Golden Retriever a stat pe o plajă privind spre apus de soare” sau o „Fotografie cu o vulpe sărind printre clopoței într-o pădure cu soare. strălucind printre copaci”. Aprovizionarea de imagini similare din diferite biblioteci de fotografii ar dura probabil mai mult și, în multe cazuri, subiectul este puțin probabil să existe.

Imagini fotografice ale naturii generate cu DALLE 2 — Imagini fotografice generate cu DALLE 2

Ceea ce mi se pare cu adevărat uimitor cu stilul fotografic de generare a imaginii este că DALL·E 2 poate reproduce cu exactitate tot felul de setări de mediu. De la strălucirea luminii soarelui și proiectarea precisă a umbrelor până la claritatea obiectelor apropiate și estomparea treptată a elementelor mai îndepărtate. De asemenea, puteți include solicitări pentru diferite setări bazate pe cameră, cum ar fi „Macro 35 mm”, „Fisheye” sau „Lens Flare”.

Când generez imagini de calitate fotografică, am observat generații mai realiste din subiecte care sunt mai comune. Există mult mai multe fotografii cu câini pe plaje, de exemplu, decât vulpi care sar în clopoței, deci mai mult conținut pentru ca o IA să atragă referințe.

O limitare cheie care merită subliniată este că toate imaginile generate sunt limitate la 1024 x 1024 pixeli, așa că nu vom genera în curând fotografii pentru panouri publicitare...

Extinderea dimensiunilor imaginii

Una dintre cele mai frecvente utilizări pe care le văd pentru DALL·E 2 în lumea creativă și de marketing este îmbunătățirea și editarea imaginilor existente, mai degrabă decât generarea completă de imagini noi. În calitate de dezvoltator web, întâmpin de obicei provocări în care se găsește o imagine decentă, dar raportul și dimensiunile provoacă decupări slabe atunci când imaginea este încărcată, deoarece containerul de imagine este un raport diferit față de imagine.

Iată un exemplu. O imagine de stoc minunată a unui câine aplecat pe geamul unei mașini, care a fost destinată utilizării pe o unitate de erou prezentată, dar raportul peisaj standard al fotografiei sursă nu a jucat bine cu un raport super-larg de 21:9 al unui erou prezentat. banner.

Încărcând imaginea în DALL·E 2 și utilizând instrumentul „Generation Frame”, putem extinde imaginea lăsând AI să umple golurile. Când utilizați Generation Frame, veți dori întotdeauna să mențineți o parte a imaginii originale în cadrul cadru pentru a oferi AI mai multe informații de la care să lucreze.

Textul prompt este de asemenea important aici și, de obicei, veți dori să descrieți ceea ce doriți în cadrul generației, mai degrabă decât întreaga imagine. Pentru această solicitare, am folosit doar „dealuri și cer” și l-am lăsat pe DALL·E 2 să facă restul.

Folosind instrumentul Dalle2 Generated Frame — Folosind instrumentul DALL·E 2 Generation Frame pentru a lărgi o imagine

Pentru fiecare generație, DALL·E 2 vă va oferi patru variante din care să alegeți. Imaginea de mai sus am simțit-o a fost cea mai credibilă; cu o prelungire bună a drumului, o mână de copaci generați, niște nori interesanți fără a fi suprapus dramatici și un pârâu (pe care nu l-am cerut ci un bun plus) care curge în spatele copacilor.

Editarea artefactelor

Editarea părților problematice ale imaginilor se poate face, de asemenea, rapid și eficient folosind DALL·E 2. Exemplul de mai jos a fost o solicitare recentă pe care a trebuit să înlocuim o reflecție care distrag atenția în ochelarii de protecție ai unui director de construcții.

Folosind instrumentul Eraser pentru a edita partea de reflecție a imaginii afișate în stânga sus, împreună cu furnizarea mesajului „Femeie cu ochelari de protecție care se uită la iPad”, DALL·E 2 a generat restul, chiar în jos, până la margine și evidențiază a ochelarilor, umbrire și potrivire exactă a culorilor.

DallE2 editează artefacte — Editarea artefactelor vizuale cu DALL·E 2

Adăugarea de conținut la o imagine existentă

De asemenea, adăugarea de elemente la o imagine poate fi la fel de ușoară ca și eliminarea acestora. Iată un exemplu de fotografie a unei persoane care se uită peste o vale. Nu ar fi frumos dacă cel mai bun prieten al lor ar fi alături de ei? Nicio problemă, doar ștergeți un spațiu de dimensiunea unui câine din imagine folosind instrumentul Eraser și dați un prompt corespunzător; „Un golden retriever care stă lângă femeia care se uită în depărtare” a fost folosit în exemplul de mai jos

Generarea de imagini similare vizual

Poate ați găsit o imagine foarte bună în ceea ce privește compoziția și subiectul, dar din orice motiv nu prea funcționează. Fără a face nicio modificare sau modificări ale textului prompt, puteți utiliza funcția „Generare variații” pentru a crea imagini similare din punct de vedere stilistic și compozițional.

În exemplul de mai jos, iluminarea, umbrirea, unghiurile camerei sunt toate foarte asemănătoare și același tip de câine este re-generat, împreună cu o femeie care poartă o jachetă, privind spre dealuri, cu un drum care trece prin ele, dar elementele au toate schimbat; dealurile și drumul sunt noi, iar femeia și câinele sunt amândoi diferiți.

AI generând o imagine similară — DALL·E 2 imagini folosind instrumentul „Generare variații”.

Crearea Mood Boards

În fazele incipiente ale unui proiect creativ, Mood Boards sunt adesea folosite pentru a stabili stilul vizual, tonul și direcția creativă prin aprovizionarea cu un amestec de capturi de ecran, text și imagini existente. Deoarece puteți solicita DALL·E 2 orice tip de stil vizual, de la desene în creion și pictură până la pixel art și randări 3D, AI generativă poate oferi un bun punct de plecare pentru a seta un ton vizual sau o direcție.

dalle2 generație synthwave futuristă — Generația DALL·E 2 utilizând mesajul „Un oraș futurist cu undă sintetică cu mașini zburătoare”

Generația Dalle2 a unei schițe în creion de cursă de 100 m — DALL·E 2 generație folosind promptul „O schiță în creion de cursă de 100 m”

Sprijinirea lansării mărcii

Când lansați o nouă marcă, este obișnuit să faceți joc de felul în care noile modele vor arăta pe diferite articole staționare sau să vizualizați designul site-ului web in situ pe diferite dispozitive. DALL·E 2 poate susține generarea unui fundal unic care se leagă de afacerea clientului.

De exemplu, generarea unei imagini de cărți de vizită într-un câmp de flori sălbatice pentru un brand orientat spre eco sau ridicarea în joc a unui laptop cu o casă modernă în fundal pentru o afacere din sectorul construcțiilor de case.

Lansarea mărcii generată de AI — DALL·E 2 generații folosind instrucțiunile „O fotografie cu un morman de cărți de vizită într-o pajiște cu flori sălbatice” și „Un prim-plan al unui Macbook Pro cu o casă mare și modernă în fundal, fotografic”

Obține inspirație

Cred că suntem încă departe de a genera imagini gata de tipărire sau complet proiectate pentru lansări creative, dar un domeniu în care DALL·E 2 ar putea fi util pentru a sprijini procesul de proiectare este acela de a oferi o inspirație rapidă pentru a curge sumele creative. .

De exemplu, am generat mai jos în încercarea de a genera un logo pentru o nouă bere cu tematică steampunk folosind promptul „un design de logo pentru o bere steampunk”. În timp ce DALL·E 2 este excelent la înțelegerea solicitărilor de text, generarea de text este un domeniu în care DALL·E 2 se luptă. În toate variantele produse, textul este fie eligibil, fie lipsit de sens. În ciuda acestui fapt, cred că există încă potențialul de inspirație din aceste tipuri de generații, fie că este vorba de culori, compoziție sau elemente folosite în imaginile produse.

Generarea logo-ului DALL·E 2. cu mesajul „A logo design for a steampunk Ale”

Realizarea de machete brute

Un alt domeniu în care DALL·E 2 ar putea fi în măsură să îl susțină este găsirea de machete și compoziții brute care pot fi folosite ca idee sau punct de plecare pentru reclame și design de site-uri web. Exemplele de mai jos pentru un design de site web și o broșură publicitară s-au bazat pe mesajele „Un [website] [broșură] design pentru o companie de energie durabilă”

Cu învățarea automată și înțelegerea miliardelor de imagini sursă, DALL·E 2 va încorpora în mod natural convențiile standard atunci când vine vorba de layout-uri. Cu exemplul de design al site-ului web, navigarea principală este afișată în partea de sus pentru toate variantele, logo-ul mărcii era de obicei în partea stângă sus și aproape întotdeauna exista o unitate mare de eroi și un titlu mare sub antet, urmat de paragrafe de text de mai jos. De asemenea, verdele a fost o temă de culoare comună cu aceste variații, deoarece are în mod natural o asociere puternică cu cuvântul „sustenabilitate”.

Textul este în mod deosebit ilizibil și multe dintre imaginile din cadrul machetelor sunt obscure, dar din punct de vedere compozițional, cred că există suficient potențial aici pentru ca DALL·E 2 să aibă un rol secundar atunci când caută inspirație pentru machete.

Aspecte de site-uri web generate de AI — Design DALL·E 2 folosind promptul „Un design de site web pentru o companie de energie durabilă în modul întunecat”

Broșuri publicitare generate de inteligență artificială — Anunț DALL·E 2 utilizând mesajul „O broșură publicitară pe toată pagina A4 pentru o companie de energie durabilă”

Concluzie

DALL·E 2 de la OpenAI și progresul pe care îl vedem acum cu modelele de generare de imagini bazate pe inteligență artificială, cum ar fi Imagen de la Google (încă nu pentru consumul public) sunt fără îndoială impresionante și văd rolul lor în marketingul digital și spațiul creativ fiind mult mai mult un unul de sprijin, mai degrabă decât o amenințare directă la adresa rolurilor creative și bazate pe marketing. După cum am văzut cu unele dintre exemplele de mai sus, există câteva limitări evidente, în special în ceea ce privește dimensiunea ieșirii și generarea de text. Chiar și cu majoritatea imaginilor bazate pe fotografie utilizate în articol, majoritatea oamenilor ar fi probabil capabili să spună că majoritatea nu sunt fotografii reale, dar acest lucru va deveni din ce în ce mai greu de observat în timp.

Suntem încă în stadiile incipiente ale generării de imagini bazate pe AI, dar văd multe aplicații utile pentru sectorul creativ și de marketing, de la generarea de inspirație și idei, până la aprovizionarea imaginilor și editarea avansată a imaginilor. Nu va trece mult până când API-urile pentru aceste instrumente devin disponibile și încorporate cu instrumente de design populare, cum ar fi PhotoShop sau Figma. Este un domeniu fascinant și îi voi urmări progresul în lunile și anii următori.