TEMA

Sprog forstået af Maskiner: En Introduktion til Naturligt Sprogforståelse i AI

2024/01/11 at 8:00 am Mark Sinclair Fleeton2024/01/11

Læsetid 21 minut

Array

Dette er første del af serien ”NLP – Sprog forstået af maskiner”, der ser nærmere på Naturlig Sprogforståelse – NLP – som en af de afgørende forudsætninger for den moderne AI-revolution. Artiklen er skrevet i samarbejde med ChatGPT.

TL;DR: Fire hovedpointer:

NLP (Natural Language Processing) er afgørende for moderne teknologier som chatbots, sprogoversættelse og talegenkendelse, og er dybt integreret i udviklingen af AI.
NLP forbedrer brugeroplevelsen ved at gøre enheder i stand til at forstå og reagere på naturligt sprog, hvilket øger tilgængeligheden for personer med forskellige behov.
Selvom NLP har gjort store fremskridt, står det stadig over for udfordringer såsom forståelse af sarkasme, dialekter, flertydighed og integration med andre AI-teknologier.
NLP forventes at fortsætte sin vækst og spille en endnu større rolle i redaktionelle processer og kulturel forståelse, med fokus på biasreduktion og integration med andre AI-teknologier.

Naturligt Sprogforståelse (NLP) er en gren inden for kunstig intelligens (AI), der fokuserer på at gøre computere i stand til at forstå og behandle menneskeligt sprog. Derfor er NLP på mange måder hele grundlaget for den moderne revolution indenfor AI, som vi står midt i for øjeblikket. NLP gør computere i stand til at læse tekster, genkende tale, forstå betydningen og reagere på kommandoer. Virtuelle assistenter, som Siri, Google Assitant og Microsoft Copilot bliver præsenteret fra flere sider, der ikke bare kan læse artikler og opsummere deres indhold, men også forstå og svare på dine spørgsmål. NLP fungerer ved hjælp af forskellige teknikker fra lingvistik og datalogi og kan på den måde afkode sprogets kompleksitet og gør computere i stand til at interagere med mennesker på en mere naturlig og intuitiv måde. Det gør det langt lettere at interagere med computere og programmer og er godt i gang med at revolutionere og demokratisere adgangen til computere, AI og programmering det hele taget til en langt bredere gruppe, når der ikke længere er brug for at kunne kode. Samtidigt bliver AI stadigt mere udbredt og stadigt flere områder og anvendes i alt fra automatiserede kundeservice systemer til sprogundervisningsapps.

Relevansen af Naturligt Sprogforståelse (NLP) i nutidens teknologidrevne samfund er betydelig og stadigt voksende. NLP-teknologier spiller en central rolle i at bygge bro mellem menneskelig kommunikation og computere, hvilket har flere vigtige implikationer. NLP udgør en mærkbar forbedring af brugeroplevelsen ved at gøre enheder og applikationer i stand til at forstå og reager på naturligt sprog, der bliver langt mere brugervenlig. I erhvervslivet bruges NLP i en lang række funktioner og til en række opgaver, som fx kundeservice, hvor chatbots bruges ifm. dataanalyse og dokumenthåndtering, der giver mærkbare besparelser på tid og ressourcer. Samtidigt muliggør NLP en langt større tilgængelighed til teknologi for personer med forskelligartede behov, som fx mennesker med syns- eller hørehandicap. Her giver NLP adgang til stemme-til-tekst og tekst-til-stemme-læsninger.

NLP anvendes til at udtrække værdifuld information fra store mængder tekstdata, hvilket hjælper organisationer med at identificere trends, træffe informerede beslutninger og forbedre vidensstyring. Kommunikation på tværs af landegrænser kan ved hjælp af NLP også gøres meget lettere gennem oversættelse af tekst og tale mellem forskellige sprog. NLP-teknologi bruges til at analysere følelser og meninger i store mængder data fra sociale medier, hvilket giver indsigt i offentlige holdninger og tendenser. Indenfor undervisningsområdet giver NLP adgang til langt mere personaliseret læring med interaktive personlige læringsassistenter og sprogundervisningsapps tilpasset til den enkelte behov.

I takt med at teknologien udvikler sig, vil NLP’s rolle og indflydelse i samfundet sandsynligvis fortsætte med at vokse, hvilket gør det til en central komponent i den fortsatte digitale transformation.

NLP’s historie

NLP er ikke et nyt område. Allerede i det 17. århundrede fremsatte filosoffer som Leibniz og Descartes teoretiske forslag om oversættelsesmaskiner til at forbinde ord mellem sprog. I 1930’erne blev de første patenter på ”oversættelsmaskiner” indgivet. Der var blandt andet tale om en automatisk tosproget ordbog og metoder til håndtering af grammatiske roller mellem sprog. I 1950 offentliggjorde Alan Turing sin berømte afhandling ”Computing Machinery and Intelligence”, hvori han foreslog Turing-testen, der er designet til at afgøre, hvor tæt en computer er på menneskelig intelligens. Nogenlunde samtidigt i 1957 revolutionerede Noam Chomsky’s arbejde med ”universel grammatik” lingvistikken og leverede et vigtigt fundament for NLP. Det såkaldte Georgetown-eksperiment havde i 1954 fremvist automatisk oversættelse fra russisk til engelsk og skabte forventninger om at man snart ville finde metoder til maskinoversætteler. Der skulle dog vise sig, at der skulle gå nogen tid endnu. 1960’erne bød på flere vellykkede NLP-systemer, som fx SHRDLU, der arbejdede indenfor begrænsede sprogområder. I 1969 introducerede Roger Schank konceptuel afhængighedsteori, der en model for NLP og i 1970 udviklede William A. Woods ”augmented transition networks” (ATN) til at håndtere naturligt sproginput. 1980’ernes stigende computerkraft og nye teoretiske tilgange muliggjorde en revolution indenfor NLP med introduktionen af maskinelæringsalgoritmer til sprogbehandling. Senere har især forskning ved IBM i statistiske modeller og maskinoversættelse og stigende anvendelse af usuperviserede og semisupervisede læringsalgoritmer bragt fremskridt indenfor NLP.

NLP og AI

Udviklingen af Naturligt Sprogforståelse (NLP) har været dybt integreret i udviklingen af kunstig intelligens (AI) og har haft en markant indflydelse på dens fremskridt. At computere har fået evner til at forstå og fortolke og generere menneskelignende sprog har været afgørende for interaktionen mellem mennesker og computere. Det har givet anledning til algoritmer og modeller, der er i stand til at bearbejde og analysere tekst- og taledata og det muliggør applikationer som stemmegenkendelse og følelsesanalyse. NLP i AI anvender forskellige algoritmer og analyser til at afkode og forstå menneskeligt sprog. Det betyder brug af maskinlæringsmodeller, deep-learning og sprogmodeller til at uddrage betydning fra tekst. NLP’s fremskridt, især gennem massive datasæt og deep-learning teknikker, har været fundamentale for AI’s evne til at mestre menneskelig kommunikation. Disse fremskridt forbedrer AI’s præstation i Turing-test og er afgørende for AI’s evne til at nå menneskelige intelligensniveauer, som forventet af eksperter.

Grundlæggende Koncepter i NLP

For at komme lidt dybere ned i begrebet NLP, tager vi lige tre hovedbegreber inden for NLP. Tokenisering, syntaksanalyse og semantisk analyse.

Tokenisering: Tokenisering indebærer opdeling af tekst i mindre enheder, kendt som ‘tokens’. Dette kan være opdeling af tekst i ord, sætninger eller karakterer. For eksempel, i en spamdetektor, vil hver besked blive brudt ned i separate ord (ord-tokenisering). Tokenisering er afgørende, da maskinlæring fungerer på numeriske data, og derfor er det nødvendigt at omdanne tekst til en form, der kan behandles af algoritmer【47†kilde】.

Syntaksanalyse: Syntaksanalyse, også kendt som parsing, involverer analysen af den naturlige sprogs grammatik ved hjælp af formelle grammatikregler. Denne proces omhandler ikke kun enkelte ord, men også kategorier og grupper af ord, og tildeler en semantisk struktur til teksten. Syntaksanalyse anvendes i applikationer såsom spørgsmål-svar-systemer, informationsudtrækning, følelsesanalyse, og grammatikkontrol.

Semantisk analyse: Semantisk analyse handler om at forstå betydningen og fortolkningen af ord, tegn og sætningsstruktur. Dette omfatter at forstå konteksten og den hensigtsmæssige betydning af teksten, hvilket er en af de mest udfordrende dele af NLP. Semantisk analyse er vigtig for at kunne tolke tekst på en måde, der ligner menneskelig forståelse, herunder at skelne mellem flere mulige betydninger af ord og sætninger.

Samlet set er disse koncepter afgørende for at skabe avancerede NLP-applikationer, som effektivt kan behandle og forstå menneskeligt sprog, hvilket er grundlaget for mange moderne teknologier som chatbots, sprogoversættelse, og talegenkendelse. Tokenisering, syntaksanalyse og semantisk analyse anvendes bredt i AI-applikationer. Når du indtaster en forespørgsel i en søgemaskine som Google, bruger den tokenisering til at opdele din input. Dette hjælper motoren med at gennemsøge milliarder af dokumenter for at præsentere dig for de mest relevante resultater. Værktøjer som Google Translate anvender tokenisering til at segmentere sætninger i kildesproget. Efter tokenisering kan disse segmenter oversættes og genopbygges i målsproget for at sikre, at oversættelsen bevarer den oprindelige kontekst. Stemmeaktiverede assistenter som Siri eller Alexa er stærkt afhængige af tokenisering. Når du stiller et spørgsmål eller giver en kommando, konverteres dine talte ord først til tekst, som derefter tokeniseres, så systemet kan behandle og reagere på din anmodning.

Moderne SEO-strategier kræver en semantisk tilgang gennem syntaksanalyse. Indhold analyseres semantisk af søgemaskiner og rangeres derefter. Dette har forbedret den generelle kvalitet af internettets indhold. Virksomheder kan skalere deres kundekommunikation ved hjælp af værktøjer baseret på semantisk analyse. Det kan være bots, der fungerer som portvagter, eller on-site semantiske søgemaskiner, der giver kunderne mulighed for at “tale frit” uden at være bundet af et format. Dette kan hjælpe en virksomhed med at indsamle betydelige mængder af kvalitetsdata.

Formålet med sentimentanalyse er at opdage følelser som positive, negative eller neutrale i en tekst for at angive presserende behov. For eksempel kan Twitter-omtaler mærkes efter sentiment for at få en fornemmelse af, hvordan kunderne føler sig om dit produkt og identificere utilfredse kunder i realtid. Tekster kan klassificeres baseret på brugerens nye krav. Sådanne modeller kan bruges til at mærke salgsmails som enten “Interesseret” eller “Ikke interesseret” for proaktivt at nå ud til brugere, der muligvis ønsker at prøve dit produkt.

NLP og Maskinlæring

Maskinlæring (ML) og NLP kædes sammen inden for kunstig intelligens (AI) for at skabe systemer, der kan forstå og interagere med menneskeligt sprog. ML giver værktøjer, der forstår syntaks, semantik og kontekst af en samtale, der er afgørende for NLP-applikationer. Ved at bruge ML kan systemer trænes på indgående data og det gør dem i stand til at forstå og reagere på både standard- og mere usædvanlige forespørgsler. Evnen til kontinuerligt at forbedre sig fra erfaring gør ML værdifuld for NLP, da det kan håndtere randtilfælde uden at skulle omprogrammeres.

Til mere komplicerede anvendelser af NLP, såsom forståelse af naturlig tale, bruges ML-modeller til at forbedre forståelsen af det talte sprog. Disse modeller kan også tilpasse sig ændringer i menneskelig sprog over tid. NLP bruger både superviseret og usuperviseret maskinlæring (eller en kombination af begge) for at styrke sine applikationer. ML i NLP kan identificere mønstre i menneskelig tale, forstå sentiment, opfange kontekstuelle ledetråde og lære andre komponenter i tekst- eller stemmeinput. Komplekse applikationer, der kræver højniveau forståelse for at have en meningsfuld samtale med mennesker, kræver ML for at gøre det muligt.

ML til NLP omfatter en række matematiske systemer til at identificere forskellige aspekter af tale, følelser, enheder og andre tekstelementer. Det kan være i form af en model, der kan anvendes på andre tekstgrupper i det, der er kendt som superviseret maskinlæring. Derudover kan systemerne også være en række algoritmer, der fungerer på tværs af store datasæt for at udtrække mening i det, der kaldes usuperviseret maskinlæring.

Sammenkædningen af ML og NLP har ført til betydelige fremskridt i teknologier, vi bruger i hverdagen, såsom taleassistenter, maskinoversættelse og sentimentanalyse. Denne synergi har været afgørende for at skabe intelligente systemer, der kan forstå og interagere med mennesker på en mere naturlig og intuitiv måde.

ML’s rolle i udviklingen af NLP-applikationer

Lyder det som volapyk? Så lad os tage et par eksempler. Særligt indenfor udviklingen af de store sprogmodeller, der ligger til grund for chatbotter som fx ChatGPT har samspillet mellem ML og NLP betydet en forrygende udvikling. Her er en række eksempler på store sprogmodeller baseret på NLP-applikationer udviklet på baggrund af maskinlæringsmodeller. De bygger alle i et eller andet omfang på den såkaldte transformer-arkitektur, der fx er kendt fra OpenAIs GPT-modeller. Transformer-arkitekturen gør det muligt for modellerne både, at uddrage betydning af teksten før og teksten efter, for at få en mere nuanceret forståelse af sprog.

BERT (Bidirectional Encoder Representations from Transformers): BERT bruger både venstre og højre side af et ord til at bestemme dets kontekst. Den trænes i to trin: først med uannoterede data gennem opgaver som masked ML og næste sætningsforudsigelse, og derefter med fintuning ved hjælp af annoterede data.

GPT-3 (Generative Pre-trained Transformer 3): En transformerbaseret model kendt for sin evne til at oversætte, besvare spørgsmål, skrive poesi og udføre opgaver, der kræver ad hoc ræsonnement. GPT-3 er unik, idet den ikke kræver finjustering til downstream-opgaver og er trænet på over 175 milliarder parametre.

XLNet: Kombinerer det bedste fra Transformer-XL og BERT. XLNet anvender Transformer-XLs autoregressive sprogmodel og BERTs autoenkodning. Dens kernefunktionalitet omfatter tovejs kontekstanalyse, hvor den overvejer ordene før og efter det token, der analyseres.

RoBERTa (Robustly Optimized BERT Approach): Bygger på BERT for at forbedre ydeevnen og afhjælpe nogle af dens mangler. Den bruger en større træningsdatasæt og har fjernet BERTs næste sætningsforudsigelsesdel.

ALBERT (A Lite BERT): En lettere version af BERT, udviklet for at tackle BERTs hukommelses- og timingproblemer. ALBERT anvender faktoriseret indlejret parametrisering og deler den på tværs af lag.

Anvendelser af NLP i Hverdagen

Du bruger allerede en række applikationer, der anvender NLP. Online oversættere som Google Translate er kraftfulde værktøjer takket være NLP og dyblæring. I dag kan de oversætte grammatisk komplekse sætninger uden problemer, hvilket markant forbedrer fra tidligere begrænsede ord-til-ord-oversættelser. Moderne søgemaskiner bruger NLP til at analysere brugernes søgeintentioner og kontekst, hvilket forbedrer resultaterne, de viser. Funktioner som søge-autofuldførelse og smart søgning i e-handelssystemer er eksempler på NLP’s anvendelse i søgemaskiner. Smarte assistenter som Siri og Alexa bruger stemmegenkendelse til at forstå almindelige spørgsmål og anvender naturlig sproggenerering, en undergren af NLP, til at besvare disse spørgsmål. De lærer fra brugerens erfaringer for at tilbyde bedre og mere skræddersyet assistance. Chatbots effektiviserer kundeservice ved at være tilgængelige 24/7 og reducere belastningen på menneskelige medarbejdere. De bruger NLP til at lytte til, hvad kunderne siger, og giver passende svar, ofte forbedret med sentimentanalyse og intention klassificering.

I en dansk kontekst er anvendelsen af NLP i populære applikationer særligt relevant af flere grunde. Danmark er et flersproget samfund med stærke internationale forbindelser. Effektive sprogoversættelsesværktøjer er derfor afgørende for både personlig og erhvervsmæssig kommunikation, især i forbindelse med engelsk og andre europæiske sprog. Med mange der bruger internettet og digitalt kompetente borgere er forbedrede og mere intuitive søgemaskineresultater gennem NLP værdifulde for at sikre hurtig og relevant adgang til information. I et teknologisk avanceret land som Danmark er smarte assistenter som Siri og Alexa vigtige for at fremme anvendelsen af smart hjemme-teknologi og personlige enheder, hvilket understøtter den digitale livsstil. Med en voksende e-handelssektor i Danmark kan chatbots i kundeservice bidrage til at forbedre kundeoplevelsen og effektiviteten for danske virksomheder, både lokalt og i international handel.

Udfordringer og begrænsninger

Selvom NLP har gjort store fremskridt i de seneste år, er der stadig mange udfordringer, der skal overvindes. Sætninger, der bruger sarkasme og ironi, kan nogle gange forstås i modsat retning af mennesker, og det er derfor en udfordring at designe modeller, der kan håndtere sådanne sætninger i NLP. Dialekter kan variere meget fra region til region og endda fra person til person. Det er en udfordring at træne modeller, der kan forstå og generere dialektale sætninger. Sætninger i sproget, der har enhver form for flertydighed i betydningen af at fortolke på mere end én måde, er også et område at arbejde på, hvor NLP kan hjælpe. At forstå kontekst og håndtere tvetydige sætninger, parsing og sætningsstruktur og grammatikregler og undtagelser er betydelige udfordringer i NLP ligesom semantisk tvetydighed og opbygge ontologier og viden grafer kan være udfordrende. Kontekstbaserede udfordringer i NLP som sarkasme, domænespecifikke sprog, flertydighed og aspektbaseret følelsesanalyse kan overvindes ved hjælp af eksisterende metoder.

I forhold til specifikt det danske sprog opstår der også en række udfordringer. Der er ikke så meget træningsdata tilgængeligt for det danske sprog sammenlignet med andre sprog som engelsk, fransk og spansk. Dette kan gøre det vanskeligt at træne modeller, der kan forstå og generere dansk tekst. Der er mange forskellige dialekter og regionale variationer i det danske sprog, og der er ikke en standardiseret version af sproget. Dette kan gøre det vanskeligt at træne modeller, der kan forstå og generere dialektale sætninger. Det danske sprog har en høj grad af morfologisk kompleksitet, hvilket betyder, at der er mange forskellige måder at bøje ord på. Dette kan gøre det vanskeligt at træne modeller, der kan forstå og generere semantisk korrekte sætninger.

Fremtiden for NLP

Hvis vi skal se på udviklingen indenfor NLP-modeller, så er der en række tendenser. NLP-modeller som GPT-3 (og dens efterfølgere) bliver stadig bedre til at forstå og generere menneskeligt sprog. Dette inkluderer forbedringer i forståelse af kontekst, ironi, og kulturelle nuancer Flersprogethed er en vigtig tendens, hvor modeller bliver trænet til at understøtte flere sprog, herunder mindre udbredte sprog. Dette er særligt relevant i et dansk kontekst, hvor der ofte er behov for at arbejde på både dansk og engelsk. Moderne NLP-systemer bliver bedre til at opfange subtile følelsesmæssige nuancer og kontekstuelle hentydninger i tekster, hvilket er afgørende i redaktionelle processer. På den kreative front bliver NLP-værktøjer bliver stadig mere integrerede i redaktionelle workflows, hjælper med at generere ideer, forbedre tekstkvalitet og tilbyde automatiseret redigering. Bias i træningsdata og modeller er noget, der vækker bekymringer og det er aspekter, der er vigtige at indtænke i udviklingen af modeller, specielt når man arbejder med kulturelt og sprogligt mangfoldigt indhold. Vi ser også i stigende grad en tendens til at NLP integreres med andre AI-teknologier, såsom computer vision og anbefalingssystemer, for at skabe mere holistiske og avancerede applikationer. Alt sammen trends, der tyder på, at NLP vil spille en endnu større rolle i redaktionelle processer, og hvor forståelsen af sprog og kultur vil være centralt i udviklingen af nye AI-værktøjer.