Techsplainer

Hvad er generativ AI?

Generativ AI (GenAI) er en særlig type kunstig intelligens, som er kendetegnet ved, at den kan skabe originalt indhold af høj kvalitet, for eksempel tekst, billeder eller lyd. Typisk kræver det blot et simpelt input fra brugeren, et såkaldt ”prompt”, at få en GenAI til at skabe indhold.

Fire almindelige former for GenAI er tekstgeneration, billedgeneration, lydgeneration og videogeneration.

Tekstgeneration betyder, at GenAI skaber tekst. Det kan blandt andet bruges til at søge informationer, til at opsummere pointer i en anden tekst, til at foreslå ideer, til at lave korrekturlæsning, og til at skrive hele tekster i den genre og med det emne, som brugeren ønsker. Nogle kendte eksempler er Anthropics Claude, Googles Gemini, Microsofts CoPilot, og OpenAIs ChatGPT.

”Generativ kunstig intelligens (AI) refererer til en gren af kunstig intelligens, der omhandler design og implementering af algoritmer, som kan generere nyt indhold. Dette indhold kan variere fra tekst, billeder, musik, til video, der ofte er af en sådan kvalitet, at det kunne antages at være skabt af mennesker…”

Definition genereret af ChatGPT 4.0

Hvad er forskellen på generativ AI og andre former for kunstig intelligens?

Generativ AI (GenAI) er en særlig form for kunstig intelligens, men kunstig intelligens kan fungere på andre måder. De fleste af os møder mange forskellige slags kunstig intelligens i vores hverdag. Det kan for eksempel være:

  • En AI-agent, som agerer modspiller i et computerspil, f. eks. skak.
  • Spamfiltre, som sorterer e-mails.
  • Talegenkendelse, som transskriberer tale til tekst, og for eksempel gør det muligt at diktere en besked til sin telefon.
  • Ansigtsgenkendelse, som lader computeren identificere en person, og eksempelvis gør det muligt at låse en mobiltelefon op, ved at holde telefonens kamera foran sit ansigt.
  • Anbefalingsfiltre på medieplatforme, som tilpasser indholdet til den enkelte bruger.
  • Autopilot, som lader en bil køre selv.

Hvad karakteriserer disse forskellige eksempler på kunstig intelligens?  Der er ikke fuldstændig enighed om, hvornår et computersystem bør kaldes for en kunstig intelligens, men en bred og let letforståelig definition af kunstig intelligens er, at et computersystem er en kunstig intelligens, hvis det løser en kompleks opgave, som det ellers ville kræve menneskelig intelligens at løse.

GenAI er ifølge denne definition de særlige former for kunstig intelligens, som løser opgaver med at skabe indhold, som det normalt ville kræve menneskelig intelligens at skabe.

Hvordan virker generativ AI?

En central del af mange former for GenAI er en såkaldt ”stor sprogmodel” (eng. ”large language model”), forkortet LLM. En LLM er en matematisk model, som viser hvordan sproglige udtryk statistisk hænger sammen. Modellen arbejder med et ordforråd, der ikke er hverken hele ord eller individuelle tegn, men sproglige brudstykker, der kan minde om stavelser. De kaldes for ”tokens”. For at generere tekst vurderer en LLM, hvad den mest velfungerende fortsættelse af en given tekst er, og tilføjer en token ad gangen, indtil den har løst den overordnede opgave.

Hallucinationer, temperatur og stokastiske papegøjer

GenAI er blevet så avanceret, at det som bruger nogle gange kan føles som om, at man har med et ægte tænkende væsen at gøre. Men det er vigtigt at holde sig for øje, at en LLM ikke forstår den tekst den skaber. Den skaber tekst ved at gentage mønstre fra de tekster den er trænet på. Skridt for skridt genererer modellen en af de tokens, som den statistisk har lært, vil være velegnede fortsættelser. Fordi en LLM ikke forstår hvad en tekst betyder, kan den heller ikke skelne mellem, om en tekst er faktuelt korrekt eller faktuelt forkert. En LLM kan generere velformuleret og meningsfuld tekst, som er fuld af fejlagtig information. Det kaldes, at GenAI ”hallucinerer”. 

Når en LLM skal vælge hvilken token den skal generere, vil der ofte være flere gode muligheder at vælge mellem, for eksempel fordi teksten kan anvende synonyme ord, fordi teksten kan præsentere pointer i forskellig rækkefølge, eller fordi teksten kan fortsætte i indholdsmæssigt forskellige retninger. I mange tilfælde er det en fordel, at en GenAI genererer tekst med et vist element af tilfældighed, fordi den derved får større sproglig fleksibilitet og variation. I stedet for at modellen altid genererer præcis den token, som er den bedst egnede, kan den vælge tilfældigt mellem de bedste tokens. GenAI-modeller har derfor normalt en indstilling, der styrer hvor meget tilfældighed modellen skal introducere – et såkaldt hyperparameter for ”temperatur”. Hvis temperaturen skrues højt op, kan to indtastninger af det samme prompt føre til skabelse af meget forskelligt indhold. Hvis temperaturen omvendt sættes lavt, så vil det samme prompt altid give indhold som er næsten eller komplet identisk. Kort sagt: jo højere temperaturen er indstillet, jo mere kreativ og varieret er GenAI, når den skaber indhold.

Kombinationen af, at GenAI reproducerer sproglige mønstre, som den ikke forstår, og at GenAI i en vis grad generer indholdet tilfældigt, har fået kritikere til at karakterisere LLM’er som ”stokastiske papegøjer”.7

Fintuning og indholdshegn

En LLM er en statistisk repræsentation af menneskeligt sprog. Det er på engang modellernes styrke og svaghed, at de ikke er designet til at løse bestemte opgaver, men kan være grundlag for løsningen af mange forskellige typer opgaver. Ofte skal modellen justeres, hvis den skal være god til at løse en mere specialiseret opgave. Det kaldes ”fintuning”.

Fintuning foregår normalt ved, at udvikleren træner modellen på et datasæt med eksempler på den type opgave, som modellen skal løse. Hvis eksempelvis en myndighed ønsker at udvikle en chatbot, som skal hjælpe borgere med at finde information, så kunne datasættet indeholde

Hvilke dataetiske udfordringer rejser generativ AI?

GenAI er fleksibelt og nemt at bruge. Mange har nok allerede oplevet, at teknologien kan være nyttig både til privat brug og professionelt. Men teknologien rejser også en række dataetiske udfordringer, som det er vigtigt at forholde sig tilI.

Det er vigtigt at forholde sig til disse dataetiske udfordringer, så vi sikrer, at vores anvendelse af den nye teknologi respekterer menneskers selvbestemmelse, gavner

Læs hele rapporten her