Kulturredaktionen har testat gränserna för fyra omtalade AI-modeller genom att låta dem ge sig på en av litteraturhistoriens mest gäckande bildbeskrivningar: Charles Bovarys ökända hatt.
Gustave Flauberts Madame Bovary (1856) beskrivs ofta som ett praktexempel och pionjärverk inom den litterära realismen. Paradoxalt nog är romanen också känd för att inhysa några av litteraturhistoriens mest svårbegripliga objektsbeskrivningar. I en passus beskrivs en bröllopstårta bestående av en ”bas av blå, fyrkantig kartong” under en ”donjon av sockerkaka”, toppat av en ”grön äng med stenblock i floder av sylt med nötskalsbåtar och en liten Amor balanserandes i en chokladgunga”. I en annan – varom de lärda ännu tvistar – finns en noggrann (här i Bodegårds översättning från 2013) beskrivning av huvudkaraktären Charles Bovarys märkliga hatt:
”Det var en huvudbonad av blandsort, med element av husarmössa, tschakå, kubbhatt, utterskinnskaskett och nattmössa, ja ett av dessa arma ting vilkas stumma fulhet har samma djup i uttrycket som ansiktet på en idiot. Äggformig och utspänd med manschetter hade den nertill tre korvlika valkar; ovanpå satt en efter en, åtskilda av röda band, romber av sammet och kaninpäls; upptill en sorts påse som avslutades med en kartonnerad månghörning täckt av en komplicerad snoddgarnering, där det i änden av ett långt och alltför smalt snöre hängde ett litet knutkors i guldtråd i stället för tofs. Den var splitter ny; skärmen blänkte.”
Många har försökt visualisera den absurda hatten. Få har lyckats. Men kanske är tiden nu mogen för ett genombrott. Kanske kan nya, AI-baserade bildgeneratorer som DALL-E och Midjourney äntligen ge liv åt Flauberts vilda fantasier?
Kanske, kanske inte. Kulturredaktionen har låtit fyra AI-modeller ta sig an beskrivningen av Bovarys hatt – med blandad framgång.
DALL-E
När Open AI:s djuplärningsmodell DALL-E tar sig an textutdraget ovan alstras först en generisk trollkarlshatt med en plyschkanin inuti. Triggerorden ”kaninpäls” och ”kubbhatt” måste ha fått algoritmerna att dra förhastade slutsatser.
Först när vi testar att utesluta satsen med kaninpäls- och sammetsromber i andra meningen händer något. Korvlika valkar: check. Långt smalt snöre: check. Stum fulhet med samma djup i uttrycket som ansiktet på en idiot: certainement.
MIDJOURNEY
Midjourneys fotorealistiska bilder har redan lyckats dupera halva internet med deep-fakes på påve Franciskus i pimp-artad puffjacka och Donald Trump i polisgrepp på öppen gata. Litterära hattar tycks desto svårare. Antagligen är referensmaterialet för begrepp som ”tschakå” och ”snoddgarnering” något skralare än för berömda världsledare. Eloge, däremot, till Midjourney för att ha kommit ihåg manschettknapparna. Och syns där inte – med lite god vilja – en sorts sammetsromb mellan de röda banden?
Midjourney–DALL-E, 1–0.
STABLE DIFFUSION
Om någonting positivt ska sägas om outputen från Stability AI:s bildgenerator Stable Diffusion, så tar den åtminstone fasta på konceptet konstnärlig frihet. Vid ett första försök alstrar modellen fyra bilder som närmast kan beskrivas som oljemålningar av packade ryska 1800-talspoeter med pälshatt. Med en något justerad prompt genereras i stället fyra bilder som ser ut att ha skrapats direkt från Östasiatiska museets samlingar. I samtliga fall är hatten ett perifert element i bilden.
I ett fall har hatten i vart fall något slags tofs baktill.
PHOTOSHOP GENERATIVE FILL (FT. KASPER KARLGREN)
I en ny beta-version av Photoshop har de klassiska, manuella bildredigeringsverktygen fått förstärkning i form av Firefly – Adobes egna, generativa AI-teknik. Med funktionen Generative Fill kan bilder och bildkomponenter alstras fram genom textinmatning, på motsvarande sätt som med DALL-E eller Midjourney, fast med större anpassningsbarhet och mer kreativ kontroll.
När vi överlämnar den kreativa kontrollen till Kasper Karlgren, illustratör och doktorand i data- och systemvetenskap vid Stockholms universitet, blir resultatet som till vänster.
Nackdel: lite fuskigt. Fördel: allt annat.
Kulturredaktionen
Gillar du det du läste? Stöd Liberal Debatt genom att teckna en prenumeration!