Skab fabelagtige billeder med Dall-E 3

november 30, 2023

Lær hvordan du på hurtig og simpel vis kan komme i gang med at lave AI-genererede billeder til virksomhedsbrug, eller bare for sjov.

Der findes en lang række forskellige AI-værktøjer til at generere billeder med. Denne guide fokuserer på Dall-E 3, som er udviklet af OpenAI, der også står bag ChatGPT. Og det er netop gennem ChatGPT, at du som betalende bruger, kan finde billedværktøjet. Det vil sige, at du ikke skal gøre andet end at åbne din sædvanlige chat menu, og så vil ChatGPT selv aktivere Dall-E 3 og begynde at generere billeder ud fra dine ønsker. Prisen for at bruge Dall-E 3 er 20 dollars pr. måned, hvilket også giver dig adgang til ChatGPT-4 og flere andre funktioner.

Tidligere kæmpede systemet med at generere billeder af ordentlig kvalitet, og vi skulle som brugere ofte lave flere forsøg for at opnå acceptable resultater. Dengang var processen ikke blot langsommere, men også begrænset til engelsk. Men som med enhver teknologi, har der været en udvikling. Nu står vi ved indgangen til en ny æra med lanceringen af Dall-E 3. Denne opdaterede version byder på forbedringer i billedkvalitet og effektivitet. En bemærkelsesværdig ændring er introduktionen af flersproglig support, herunder dansk. Dette gør Dall-E 3 mere tilgængelig for et bredere publikum. I dette blogindlæg vil vi udforske, hvordan disse ændringer påvirker brugeroplevelsen og potentialet i AI-drevet billedkunst.

At prompte et billede

Dall-E 3 er baseret på tekst input, et såkaldt prompt. Det vil sige en instruktion, som du giver værktøjet til at generere et billede ud fra. Når du begynder at lege med Dall-E 3, vil du formentligt opleve, at det kan være lidt udfordrende. Måske billederne indeholder fejl, eller ikke ligner det, du havde forestillet dig. Da prompten er dit udgangspunkt for at skabe billeder, der matcher dine ønsker og idéer, er det også det bedste sted at starte i forsøget på at imødekomme et eventuelt problem. Måske den er for ukonkret, måske den ikke indeholder nok beskrivende elementer, som er vigtige for dit ønskede resultat, osv. Eller måske du bare mangler inspiration.

I arbejdet med at få inspiration, kan en prompt database som PromptHero være god at kende. Her kan du browse mellem andres billeder, og se hvordan de har formuleret deres prompts for at skabe de enkelte billeder.

Når du skal lave en prompt i Dall-E 3 fungerer det nøjagtigt som når du prompter ChatGPT. Efter at have beskrevet hvilket billede du ønsker at skabe i chatten, vil Dall-E 3 generere et eller flere billeder med udgangspunkt i din prompt. Du vil dog kunne opleve, at Dall-E 3 selv laver små justeringer i dine prompts, i forsøget på at skabe det bedste resultat for dig.

Efter at have leget lidt med Dall-E 3, vil du formentlig finde det interessant at dykke ned i forskellige måder at justere dit billede på. Der findes et væld af forskellige metoder og tricks til dette. Jeg vil præsentere nogle af dem herunder.

Længden af din prompt

Afvejningen af hvor mange ord din prompt skal bestå af, kan være en svær balancegang. På den ene side gælder det om at inkludere relevante detaljer, som har betydning for dit ønskede billede. På den anden side efterlader brugen af mange ord også en større chance for at AI’en fokuserer på noget forkert. Værktøjerne forstår ikke ord og sætningsopbygninger på samme måde som mennesker. Overvej derfor hvordan du formulerer din prompt, så det bliver nemmest for en AI at afkode.

Et eksempel kan være: “Vis mig et billede af katte, de skal være grå og være i gang med at spise en is, sørg for at billedet er tegnet og illustreret med farveblyanter.”

Denne prompt er unødig lang og indeholder fyldord som kan forvirre billed-værktøjets forståelse for dit ønske. En mere specifik prompt, hvor unødvendige ord er fjernet, kunne lyde: “To grå katte der spiser en is, illustreret med farveblyanter.”

Det betyder dog ikke, at kortere prompts altid er bedre. Det er vigtigt at være bevidst om, at alt det du ikke tydeliggør omkring billedet i din prompt, vil blive randomiseret. En lang og godt skrevet prompt kan derfor godt være værdifuld, da man gennem beskrivelsen af detaljer i højere grad kan styre billedresultatet.

Se f.eks. hvordan følgende prompt sikrer vigtige detaljer i det genererede billede: “Illustration af to grå katte, der sidder på en rød sofa i en hyggelig stue fra 1930’erne, mens de nyder is. Anvend illustreret stil med farveblyanter og fokuser på pastelfarver for at skabe en blød og behagelig atmosfære. Omgivelse og møbler i stuen skal afspejle periodens æstetik. Fang glæden i øjeblikket.”

Inkluder ønskede detaljer i din prompt

Ovenstående eksempel tydeliggør, at korte prompts efterlader mere til tilfældighederne, mens du gennem lange og detaljerede prompts i højere grad kan styre outputtet. Det er en central pointe at være opmærksom på, da det betyder, at du skal huske at inkludere alle de detaljer i din prompt, som er afgørende for at AI’en kan levere et tilfredsstillende resultat. Herunder følger en liste over nogle detaljer som kan være vigtige for dig at inkludere i din prompt:

Subjekt: Vil du skabe et billede af en person, et dyr, et objekt, en lokation osv.?
Stil: Skal dit billede være baseret på impressionisme, futuristisk, fotorealisme osv.? (Se f.eks. Art style gallery for inspiration)
Omgivelser: Er dit subjekt indenfor, udenfor, på månen, under havet osv.?
Lys: Skal dit billede f.eks. have blødt, naturligt, neon, hårdt, omsluttende lys?
Farver: Skal dit billede være sort/hvid, farver, pastel, levende, osv.?
Humør: Skal billedet bære præg af glæde, sorg, overraskelse, entusiasme, osv.?
Sammensætning: Er dit billede et portræt, fuld figur, luftfoto osv.?
Vinkel: Skal dit billede ses fra oven, lige på, nedefra, osv.?
Tidsperiode: Skal dit billede være fra en særlig tidsperiode?

Pas på med at ændre i dine prompts for hurtigt, selvom du ikke opnår det ønskede resultat. Nogle gange kan det være gavnligt blot at bede AI’en om at gentænke/re-roll prompten. Du vil opdage, at der for hver gang du beder om en gentænkning af den samme prompt, vil blive skabt nogle helt nye billeder (nogle med små ændringer, nogle mere dramatiske). Måske opnår du dit ønskede resultat ved at gentænke den samme prompt et par gange.

Arbejd videre med et særligt billede

Måske lykkedes det dig gennem din prompt at generere et billede, som kun lige mangler et par små ændringer, tilføjelser, justeringer el.lign. for at leve op til dit ønske. I så fald har du muligheden for at arbejde videre med et særligt billede, og prompte det med nye ønsker. Dette foregår ved at “chatte” med det, og beskrive hvilke ændringer du ønsker. F.eks. ved at skrive “Behold billede 3, men ændrer farven på sofaen til blå”.

Gennem denne iterative proces hjælper du AI’en med at forstå dine ønsker. Forhåbentlig kan du gennem præcis prompting og små justeringer opnå et tilfredsstillende resultat. En super interessant ting ved Dall-E 3 er samtidig muligheden for at arbejde videre med dit billede i form af tekst, og på den måde f.eks. skabe en historie, hvor tekst og visualiseringer skabes samtidigt, som det er eksemplificeret herunder.

Udfordringer i brugen af værktøjerne

Det er vigtigt at huske på, at billede-værktøjer som Dall-E 3 er baseret på sprogmodeller, trænet på data fra internettet. Det betyder, at du vil opleve at modellerne kan indeholde den samme bias, som kan findes på internettet. Et sjovt eksempel er., at hvis du forsøger at generere et billede af en ‘handsome swedish chef’, vil du formentlig opleve at samtlige af dine billeder indeholder kokke med et kraftigt overskæg.

Hvis du undrer dig over hvordan dette kan være, kan du jo prøve at google ‘swedish chef’. Så vil du opdage, at langt de fleste billeder, der kommer frem, er af en Muppet Show-karakter af samme navn, med et meget stort overskæg. Hvis du oplever gentagne problemer i din prompting, kan det derfor give mening at undersøge centrale dele af din prompt. Måske vil det give dig en forståelse for, at det er nødvendigt at benytte andre ord i din prompt.

I denne guide er vi dykket ned i Dall-E 3’s verden og set på, hvordan du kan bruge dette nye værktøj til at skabe imponerende billeder. Med den nye flersprogede support, herunder dansk, er Dall-E 3 nu mere tilgængelig og kraftfuld end nogensinde. Dette værktøj åbner op for en verden af kreativitet, hvor du kan skabe billeder, som for få år siden ville have været utænkelige.

Det er vigtigt at huske, at nøglen til succes med Dall-E 3 er at eksperimentere og finjustere dine prompts. Løbende, som du bliver mere fortrolig med værktøjet, vil du opdage nye måder at bringe dine visioner til live på. Det er en spændende kreativ og innovativ rejse, hvor kun din fantasi sætter grænser.

Vi håber, du føler dig inspireret og klar til at skabe dine egne fantastiske billeder med AI.

Teksten er skrevet af Magnus Fink Nielsen og Jarle Fink Kondrup samt redigeret med hjælp fra AI.

Senior Lab Agent
+45 22 77 28 08
Demolab by Innovation Lab
Experiences by Innovation Lab

Blog 30 november 2023