Därför kan AI inte riktigt återskapa den omöjliga hatten

AI-modeller är bra på att misslyckas på ett övertygande sätt, säger AI-forskaren Kasper Karlgren i en intervju med LD:s Thorslund. De misstolkar så bra att vi nästan inte märker hur fel det blir.

Det går inte att hymla med att de nya AI-modellerna för bildgenerering är bra. I vissa fall skrämmande bra. Samtidigt verkar en del arbete återstå innan AI-genererade alster på allvar kan konkurrera med – eller förväxlas med – mänskligt skapande. Den som synar en modern deep fake i sömmarna kan oftast se klara tecken på att något inte stämmer: bristande ansiktssymmetri, märkliga texturer eller fingrar i strid med mänsklig anatomi. Och när AI-modellerna ställs inför mer komplexa utmaningar – som Flauberts Frankenstein-artade hatt – kan utfallet bli nästintill skrattretande slarvigt.

Kasper Karlgren, som forskar om avancerade adaptiva intelligenta system vid Stockholms universitet, är inte förvånad över utfallet.

Att AI:n misslyckas med det här kan ses lite som en proxy för framtida problem med AI.

– Att AI:n misslyckas med det här kan ses lite som en proxy för framtida problem med AI. De kan misslyckas – men på ett övertygande sätt. De kan skapa välgjorda illustrationer som vi först tycker är vackra eller imponerande. Först när vi går tillbaka till originalet märker vi att den misstolkat och klippt bort nästan allt.

När det gäller Bovarys hatt verkar just sammetsromberna vara en återkommande utmaning. Hur kommer det sig?

– Just det. Det har varit väldigt svårt för AI-modellerna att få ihop relativa positioner överlag. I vart fall under de senaste åren har det varit så – även om det redan har hunnit bli mycket bättre. Jag tror att romberna skapar samma slags svårigheter.

Relativa positioner – som i ”A är under B som är till vänster om C”?

– Yes! Eller bara att en person håller i en banan, för den delen.

Men gäller inte det även för mänskliga illustratörer?

– Jag vet inte hur många människor som hade klarat att av att rita hatten själva – men däremot hade nog alla människor klarat av att få med alla delar som nämns i beskrivningen.

Det här är typ som ett Turingtest för bildgenererande AI-modeller.

– Det här är typ som ett Turingtest för bildgenererande AI-modeller: klarar de det så har vi nått singulariteten.

Kan Flaubert alltså ha råkat utforma ett slags Turingtest för moderna AI-bildmodeller – i mitten av 1800-talet?

– Det vore kul att utnämna det till det!

Fredrik Thorslund

Gillar du det du läste? Stöd Liberal Debatt genom att teckna en prenumeration!

Därför kan AI inte riktigt återskapa den omöjliga hatten – än

AI-modeller är bra på att misslyckas på ett övertygande sätt, säger AI-forskaren Kasper Karlgren i en intervju med LD:s Thorslund. De misstolkar så bra att vi nästan inte märker hur fel det blir.

Relaterat

Vad skiljer egentligen robotkonst från mänsklig konst?

Kan AI återskapa den omöjliga hatten?