Vad visar studien om ChatGPT och kreativitet?

Studien visar att stora språkmodeller som GPT-4 kan nå – och ibland slå – genomsnittliga människors resultat på vissa kreativitetstest, men att de mest kreativa människorna fortfarande ligger före.

Kan ChatGPT skapa kreativa idéer?

ChatGPT kan generera kreativa idéer i form av oväntade associationer och varierade förslag i språk. Men studien visar att toppskiktet av mänsklig kreativitet fortfarande är svårare för AI att matcha.

Hur mäter forskare AI och kreativitet?

Forskarna använder bland annat Divergent Association Task (DAT), där man listar tio ord som ska vara så olika varandra i betydelse som möjligt. Ju mer orden spretar, desto högre poäng.

Vad är kreativitet enligt studien?

I studien avser kreativitet inte “konstnärlig genialitet” i allmänhet, utan mätbara delar som associativ spridning i språket (DAT) och hur olika idéer vävs ihop i texter (DSI).

Kan man påverka hur kreativ AI verkar?

Ja. Studien visar att inställningen temperatur och hur instruktionen formuleras påverkar resultaten. Högre temperatur ger ofta mer variation och högre kreativitetspoäng.

Gäller resultaten på svenska också?

Inte nödvändigtvis. Underlaget är engelskspråkigt och uppgifterna är språkliga, så ordval och associationer kan fungera annorlunda på svenska.

ChatGPT och kreativitet: AI når snittet

Q: Vad är Divergent Association Task (DAT)?

DAT är ett snabbt test som mäter divergent tänkande – förmågan att hitta många och ovanliga associationer. Det går att använda både för människor och språkmodeller.

Senast uppdaterad den 10 februari, 2026 av Mikroskop redaktion

ChatGPT och kreativitet väcker både fascination och oro – men nu finns nya siffror att luta sig mot. Kan en språkmodell verkligen skapa kreativa idéer, eller handlar det mest om smart återbruk? En ny studie i Scientific Reports jämför stora språkmodeller med människor i samma kreativitetstest. Utfallet: AI kan slå snittet i vissa textuppgifter, men de mest kreativa människorna ligger fortfarande före.

ChatGPT och kreativitet – snabb översikt

Vad undersöker studien? Den jämför hur stora språkmodeller (som GPT-4) och människor presterar på samma kreativitetstester, för att mäta AI och kreativitet på lika villkor.
Huvudresultat: AI kan nå – och ibland slå – genomsnittliga människors resultat i vissa språkliga kreativitetstest, men de mest kreativa människorna ligger fortfarande före.
Hur mäts kreativitet? Med Divergent Association Task (DAT): tio ord som ska vara så olika varandra i betydelse som möjligt. Ju mer orden spretar, desto högre poäng.
Varför kan AI ändå kännas repetitiv? Vissa modeller återkommer ofta till samma “favoritord” som ger bra poäng i beräkningen, vilket kan minska variationen i praktiken.
Går AI:s kreativitet att påverka? Ja. Inställningen temperatur och hur instruktionen formuleras kan göra svaren mer förutsägbara eller mer utforskande.
Språk spelar roll: Underlaget är engelskspråkigt, så samma typ av test kan få ett annat utfall i en svensk kontext.

Sedan generativ AI slog igenom har verktyg som ChatGPT blivit vardagsverktyg i allt från skola och kontor till marknadsföring och kreativt skrivande. På några sekunder kan en språkmodell ge förslag på rubriker, rim, upplägg och nya vinklar – och det har gjort frågan om AI och kreativitet till mer än en filosofisk diskussion. Kan en maskin faktiskt bidra med något som liknar genuint nya idéer, eller ser det bara kreativt ut?

Du kanske också gillar

AI, ChatGPT och kreativitet: en vändpunkt – och ett tak

Studien jämför en rad modeller (bland annat olika GPT-varianter, Claude och Gemini) med en stor mänsklig datamängd för att fånga frågan om AI och kreativitet i siffror. På ett centralt test av språklig, divergent kreativitet presterar GPT-4 över människors genomsnitt, medan flera andra modeller ligger nära människosnittet. Men när forskarna tittar på “svansen” – den mer kreativa halvan och särskilt toppskiktet – drar människorna ifrån.

För att kunna jämföra människor och AI på ett rättvist sätt behövde forskarna en uppgift som båda kan göra på samma villkor – och som går att poängsätta utan smakdomare. Därför utgick de från ett snabbt test som bygger på bara tio ord.

Språkmodeller och kreativitet mäts med tio ord

Huvudverktyget heter Divergent Association Task (DAT). Uppgiften är enkel: lista tio substantiv som ska vara så olika varandra i betydelse som möjligt. Därefter räknas en poäng ut genom att man mäter hur stort det genomsnittliga “avståndet” är mellan orden i betydelse. Ju mer orden spretar – som om man hoppar mellan helt olika idévärldar – desto högre poäng.

Styrkan med DAT är att testet går snabbt – under fyra minuter enligt testets egen webbplats – men ändå fångar en del av det psykologer kallar divergent tänkande: förmågan att hitta många och ovanliga associationer. I tidigare forskning har DAT också visat samband med andra etablerade kreativitetsmått.

Fakta: Modellerna som nämns

ChatGPT: chattjänst som kan använda olika språkmodeller (ChatGPT kan alltså syfta på flera versioner).

GPT-3.5: äldre modellgeneration, generellt svagare än GPT-4 i mer krävande uppgifter.

GPT-4: senare och mer kapabel modell; presterar starkast i studiens kreativitetstest.

GPT-4-turbo: GPT-4-variant optimerad för effektivitet; presterar sämre än GPT-4 på DAT och upprepar oftare samma ord.

Claude (Claude 3): språkmodellfamilj från Anthropic.

Gemini (GeminiPro): språkmodellfamilj från Google; ligger nära människors genomsnitt på DAT.

En viktig precisering är att forskarna använder begreppet ”LLM creativity” i en snäv och tydligt definierad mening: divergent, associativ semantisk kreativitet – alltså förmågan att hitta ovanligt spretiga och oväntade ordkombinationer eller att väva ihop många olika kreativa idéer i en text. De betonar också att liknande resultat på ett test inte behöver betyda att AI skapar på samma sätt som en människa.

När AI “vinner” – men ändå fastnar i favoritord

En av studiens mest talande detaljer är att vissa modeller kan få höga DAT-poäng och samtidigt vara förvånansvärt repetitiva mellan körningar. Forskarna visar att GPT-4-turbo ofta återkommer till samma “långdistansord” – ord som råkar ligga långt från många andra i betydelse – till exempel “ocean” i en mycket stor andel av svaren. Även GPT-4 har ord som dyker upp ovanligt ofta, som “microscope” och “elephant”. Människors vanligaste ord förekommer däremot bara i en liten andel av svaren.

Det här är en bra påminnelse om att “hög poäng” inte alltid betyder “större variation i praktiken”. Ibland handlar det mer om att modellen har hittat några ord som ofta ger utdelning i just den här typen av beräkning.

ChatGPT och kreativitet: mänsklig hand som möter en robothand mot rosa bakgrund med kretsmönster.

Vad är kreativitet här, egentligen?

Det är här definitionen blir viktig: vad är kreativitet i forskarnas mening? De syftar inte på konstnärlig originalitet i största allmänhet, utan mäter två avgränsade delar av kreativt tänkande.

Det ena är associativ spridning i språket (DAT) – hur långt ifrån varandra orden hamnar i betydelse när man försöker hitta så olika associationer som möjligt. Det andra är divergent semantisk integration (DSI) i kortare texter – ett mått på hur många olika idéer och betydelsespår som faktiskt vävs ihop till en sammanhängande helhet.

Samtidigt understryker studieförfattarna att kreativitet är mångfacetterat och att deras tester bara fångar en specifik dimension.

Du kanske också gillar

Från ordlistor till haiku, synopsis och korta noveller

Forskarna nöjer sig inte med ordlistor. De testar också mer realistiska skrivuppgifter: att skriva haiku, sammanfatta filmer i filmsynopser och skapa mycket korta noveller, så kallad flash fiction. Texterna analyseras med flera mått – bland annat DSI (hur många olika idéer som vävs ihop) och andra objektiva mått på variation och komplexitet.

Mönstret går igen. GPT-4 presterar tydligt bättre än GPT-3.5 på skrivmåtten, men människoskrivna texter har fortfarande ett signifikant övertag i kreativitet enligt DSI.

Kreativiteten går att skruva på

En praktiskt viktig slutsats är att modellernas kreativitet inte är fastlåst. Forskarna varierar bland annat temperatur – en inställning som styr hur förutsägbart eller utforskande modellen genererar text – och ser tydliga effekter: högre temperatur ger ofta högre kreativitetspoäng. I studien når GPT-4 ett medelvärde på 85,6 i högsta temperaturvillkoret, vilket är högre än 72 procent av människornas poäng i materialet.

De testar också hur mycket själva instruktionen påverkar. En uppmaning som får modellen att tänka i termer av ordens etymologi (ursprung och byggstenar) kan ge mer oväntade associationer och högre poäng. Det understryker en central poäng i studien: det som ser ut som “AI-kreativitet” formas i hög grad av hur vi människor vägleder verktyget.

ChatGPT och kreativitet: person håller upp gul lapp med texten “A.I.” framför suddiga datorskärmar.

Begränsningar som är bra att ha med sig

Samtidigt spelar sammanhanget roll – inte minst språket. Den stora jämförelsegruppen på 100 000 personer är rekryterad via DAT:s webbplats och består av engelskspråkiga deltagare, främst från USA men också från andra engelskspråkiga länder som Storbritannien, Kanada, Australien och Nya Zeeland. Resultaten säger därför främst något om hur människor och språkmodeller presterar på engelska i just den här typen av språkliga uppgifter. På svenska kan både ordval och associationer se annorlunda ut, vilket gör att samma typ av test också kan ge ett annat utfall i en svensk kontext.

Så: hot eller verktyg?

Som en match mellan människa och maskin kan resultatet låta dramatiskt. Men läser man studien noga pekar den mot ett mer vardagsnära scenario: AI blir allt bättre på att snabbt skapa variation och komma med förslag – ett slags råmaterial till kreativa idéer – samtidigt som människor fortfarande har ett tydligt övertag i toppnivåerna och i den bredare, svårare definierade kreativiteten. Kanske är det just där framtiden ligger: inte i att AI ersätter skapandet, utan i att den blir en ny sorts medförfattare – snabb på utkast och infall, men beroende av människan för omdöme, känsla och riktning.

Publikation

Antoine Bellemare-Pepin, François Lespinasse, Philipp Thölke, Yann Harel, Kory Mathewson, Jay A. Olson, Yoshua Bengio, Karim Jerbi. Divergent creativity in humans and large language models. Scientific Reports, 2026; 16 (1) DOI: 10.1038/s41598-025-25157-3

Dela det här:

Observera: Detta är populärvetenskaplig information och ersätter inte medicinsk rådgivning. Kontakta sjukvården vid frågor om din hälsa. Publicerat av Mikroskop Redaktion – läs våra redaktionella principer.

Senaste nyheterna

Category Collection

ChatGPT och kreativitet: när AI slår snittet – men inte toppen

AI, ChatGPT och kreativitet: en vändpunkt – och ett tak

Språkmodeller och kreativitet mäts med tio ord

Fakta: Modellerna som nämns

När AI “vinner” – men ändå fastnar i favoritord

Vad är kreativitet här, egentligen?

Från ordlistor till haiku, synopsis och korta noveller

Kreativiteten går att skruva på

Begränsningar som är bra att ha med sig

Så: hot eller verktyg?

Publikation

Senaste nyheterna

Category Collection

AI, ChatGPT och kreativitet: en vändpunkt – och ett tak

Språkmodeller och kreativitet mäts med tio ord

Fakta: Modellerna som nämns

När AI “vinner” – men ändå fastnar i favoritord

Vad är kreativitet här, egentligen?

Från ordlistor till haiku, synopsis och korta noveller

Kreativiteten går att skruva på

Begränsningar som är bra att ha med sig

Så: hot eller verktyg?

Publikation

Relaterade nyheter

Mörka personlighetsdrag hänger ihop med vilka yrken vi dras till

Tidig stress och magproblem kan hänga ihop

Hundars beteende kan ge ledtrådar om människans psyke

Nya hjärnkartor ritar om hjärnans beslutscentrum

Vill du fördjupa din kunskap om kroppen?

Tack för din anmälan!