Baggrund

Tendenser indenfor Machine Learning i 2023


Mark Sinclair Fleeton

Journalist

   Læsetid 10 minutter
Array

AI som er hovedfokus for AI-Portalen er et fællesbegreb, der dækker over mange forskellige statistiske processer, som fx natural language processing, computer vision og tale behandling.  Machine learning eller maskinlæring på dansk er den proces, der lærer computerne at arbejde med de processer, der hver især udgør forskellige elementer i det vi øjeblikket kalder en AI-sommer eller et AI-boom.

Her på AI-Portalen vil vi gerne være med til at præcisere formidlingen omkring AI og derfor vil vi i denne artikel gå lidt mere i dybden med begrebet machine learning og de muligheder, som machine learning giver.

Machine learning

Når vi nu vælger at gå så specifikt til værks, så lad os lige starte med en kort beskrivelse af machine learning eller maskinlæring på dansk (ML). ML bruges til at træne computere til på egen hånd at analysere og træffe beslutning på baggrund af analysen. ML-algoritmer lærer, tilpasser, anbefaler og tolker data. I modsætning til tidligere tiders regel-baserede eller ekspert-systemer lærer ML algoritmer over tid. 

De fleste har efterhånden hørt om ChatGPT, der er baseret på det vi kalder en stor sprogmodel, det vil sige en ML der arbejder med sprog. Det vil mere præcist sige, at en omsætter menneskeligt sprog til dens programmeringssprog (oftest Python) og tilbage igen, så den kan svare på de spørgsmål brugerne stiller den. Den er trænet på baggrund af store mængder tekstdata og er trænet til at forstå og generere tekst baseret på de mønstre den har lært. Grundlæggende kan man sige, at den på baggrund af al den tekst, den er blevet fodret med, svarer på dit spørgsmål med det mest sandsynlige svar ud fra de mønstre i sprog, den har lært. Svaret består derfor af den mest sandsynlige sekvens af ord, den finder på baggrund af dit spørgsmål.

Det er den mest fremtrædende model indenfor ML i vores bevidsthed i denne tid, men det er langt fra den eneste.

Tendenser indenfor ML

Sikkerhed 

ML arbejder med at sikre vores systemer mod indtrængen og misbrug. Den trænes til at genkende usædvanlige mønstre i netværkstrafik eller systemaktivitet og kan derfor være med til at sikre mod truslersom phishing-angreb, malware – altså cybersikkerhed. Omvendt kan den også lære at opdage og beskytte mod specifikke angreb på ML-systemer og fx sikre mod, at fx en sprogmodel kommer til at afsløre personfølsom information, der var en del af dens træningsdata. Vi ser også direkte angreb på ML-systemer i form af modelforgiftning, hvor indtrængende forsøger at manipulere træningsdata eller adverserial attacks hvor angribere forsøger at ændre inputdata for at få modellen til at afgive forkerte svar.

Tilpasning

En anden vigtig udvikling indenfor ML-systemer er adaptive learning eller ML-systemer, der løbende kan tilpasse sig til ændringer i data, erfaringer eller deres miljø. ML-systemer, der kan tilpasse sig er mere robuste og har flere anvendelsesmuligheder end traditionelle ”frosne” modeller. Ikke mindst indenfor erhvervslivet kan adaptiv ML-systemer hjælpe med personaliserede marketing tiltag, forbedre kunde interaktivitet og optimere organisations effektivitet. 

Virtuelle assistenter

Eksempler på virtuelle AI-drevne systemer, som du måske har hørt om er Apples Siri, Google Assistant og Amazons Alexa. Denne type assistenter kombinerer teknikker fra ML, natural language processing (den forstår hvad du siger) og i nogen tilfælde talegenkendelse. Avancerede udgaver kan lære over tid og forudsige brugerens behov og interagere med andre apps eller tjenester ved fx at sætte alarmer, afspille musik, tænde lys eller tilføje aftaler til kalenderen.

Chatbots

Som et eksempel på ML-applikationer startede jeg med eksemplet ChatGPT, der netop er en chatbot bygget på en stor sprogmodel. ChatGPT er kun en version og du har måske også hørt om modellerne Bard, der er Googles chatbot og Microsofts Bing-AI, der i højere grad end de andre virker som en søgemaskine. Chatbots kan bruges til at yde kundeservice, besvare spørgsmål og give informationer. 

Demokratisering af AI

Vi taler om AI’s demokratiserende funktion og det handler om, at gøre teknologien mere tilgængelig for alle og ikke bare dem, der arbejder indenfor tech-sektoren. OpenSource-modeller giver alle adgang til ML-algoritmer, så vi i princippet kan bygge vores egen personlige ML-modeller, men det betyder også, at vi alle kan få adgang til teknologien uden nødvendigvis at være teknisk uddannet.

Generativ dataskabelse

Generative AI eller ML-systemer, der skaber mønstre på baggrund af det, de i forvejen er gode til at finde mønstre. Det betyder, at disse systemer pludseligt kan begynde at skabe data selvom man kan diskutere de kreative elementer i de skabte data, fordi er baseret på de mønstre i data, som modellen er trænet på. Eksempler på generative systemer ChatGPT, der producerer tekst, Midjourney, DaVinci og flere andre, der producerer billeder, Stable Diffusion, der både kan producere video og billeder og 3D-modeller. Der er systemer, der kan producere musik og generere stemmer – fx din egen til indtaling af din egen lydbog.

Ansvarlig 

Med kraftige systemer følger også visse risici og derfor er det vigtigt at have den etiske side med og bygge ansvarlighed ind i systemet fra starten. Det handler om at sikre personoplysninger, men også at systemerne ikke diskriminerer eller giver ukorrekte oplysninger på baggrund af skævheder eller mangler i træningsdata. Brugerne skal have fuld kontrol over egne data og systemerne skal gemme så få af brugernes og træningsdataenes personoplysninger. Det handler også om at systemenerne skal være til at forstå. Det skal være tydeligt hvorfor systemerne træffer de beslutninger, de træffer og kommer med de svar, de kommer med.

Edge AI og bæredygtighed

Traditionelle AI og ML-systemer har brug for store dataparker både til træningsdata og for at give den nødvendige datakraft til at køre algoritmerne. Et af problemerne ved det er, at disse datacentre bruger mange ressourcer og derfor udgør en klimabelastningEdge AI kører, som navnet antyder, i kanten af netværket eller mere præcist på den enkelte bruger eller organisations maskine. Algoritmerne kører direkte på den enhed, hvor dataene bliver samlet. Det betyder for det første et meget mindre strømforbrug og for det andet giver det brugerne en langt højere grad af muligheder for at bygge deres egne systemer til lige præcis deres behov.

Quantum

Quantum computere forudses at blive det næste store indenfor computere og det har allerede været undervejs i nogle år. Grundlæggende er der tale om en computer, der baserer sig på kvantemekanik og det betyder i praksis en computer, der kan fungere og problemløse på mange planer samtidigt og meget hurtigere set i forhold til de computere, vi kender i dag. Tre områder, hvor det giver muligheder, er inden udviklingen af nye lægemidler. Her vil kvantecomputere kunne simulere naturens egne processer. Optimering af komplekse systemer, som trafikstyring i storbyer eller eldistribution. Sidst men ikke mindst vil quantum computing betyde store gennembrud indenfor kryptering af data – altså datasikkerhed.

Ingen kode

En relativt ny tendens indenfor ML var vi inde på under punktet om demokratisering af ML-systemer, nemlig det man kalder no-coding eller no-code development platforms. Tanken er, at alle uanset teknisk baggrund skal have mulighede for at opbygge og træne ML-systemer også uden en højere teknisk uddannelse. Her klares tingene gennem grafiske bruger-interfavces.

Konklusion

Listen over tendenser indenfor ML er naturligvis meget længere, men her har vi uddraget nogle af hovedpunkterne og nogen af de punkter, der har størst og bredest relevans.

Overordnet set er brugervenlighed og ansvarlighed (eller demokratisering og sikkerhed) en rød tråd gennem punkterne. Tendenserne går i retning af, at alle kan få adgang til at bruge og faktisk også udvikle ML-systemer. Det kræver også en høj grad af sikkerhed, men her kan ML-systemerne heldigvis også hjælpe til.

Det betyder at uddannelse – både i systemer, men også i digital dannelse bliver nøglen til succes i fremtiden. Bare en lille smule viden og særligt viden om brugen af ML-systemer vil du kunne komme langt med og det vil formodentligt også blive et krav på de fleste arbejdspladser. Samtidigt er vores hverdag i dag allerede præget af ML- systemer. Google-søgninger, ansigtsgenkendelse og voice-assistenter på mobilen, anbefalingerne på Netflix osv. Fremtiden er her allerede og der skal i virkeligheden ikke så meget til for at følge med.

86 views