Fra chatbot til agent: Hvad virker i produktion i 2025–26?

Skrevet af Kåre Bjørn Jensen assisteret af AI
De fleste organisationer er ved at være færdige med “chatbotten som demo”. Næste skridt er agenter: systemer der ikke bare svarer, men løser en opgave ved at planlægge trin, bruge værktøjer (API’er, databaser, sags-/journalsystemer) og føre arbejdet i mål. OpenAIs lancering af AgentKit i oktober 2025 var et tydeligt signal om, at fokus flytter fra modelvalg til driftssikre arbejdsgange, evals og deployment. [1] (OpenAI)
1) Agent ≠ chatbot (og derfor går det galt uden struktur)
En agent skal kunne: (a) forstå en opgave, (b) vælge næste handling, (c) kalde værktøjer sikkert, (d) håndtere fejl og (e) dokumentere hvad der skete. Microsofts “Agent Factory”-serie beskriver netop skiftet fra “Q&A over viden” til handlingsorienterede flows med mønstre og governance. [2] (azure.microsoft.com)
2) Minimal produktionsarkitektur: 6 byggesten
Tænk agenten som et lille system:
- Orkestrering (workflow/graph/state) – gør adfærden deterministisk nok til drift (fx state machines/graphs).
- Værktøjer (tool-calls) – klart definerede funktioner fremfor “fri handling”.
- State & memory – hvad må gemmes, hvor længe, og hvad er “session” vs. “langtidshukommelse”.
- Policy/permissions – hvilke systemer må agenten røre, og under hvilke betingelser. AWS’ AgentCore har i 2025 bevæget sig fra preview til enterprise-setup med bl.a. VPC/PrivateLink og driftsegenskaber, og i december kom der Policy-funktioner til at sætte grænser for agenters handlinger. [4][5][6] (Amazon Web Services, Inc.)
- Observability – traces, fejlårsager, cost/latency og “hvilket trin gik galt?”. Langfuse gjorde i november 2025 “agent graphs” generelt tilgængelige, netop for at kunne navigere i loops og komplekse forløb. [10] (langfuse.com)
- Evals & kvalitetskontrol – løbende tests, regression og “stop the line” ved kvalitetssvigt (AgentKit lægger eksplicit vægt på at bygge, deploye og optimere agenter som et samlet workflow). [1] (OpenAI)
3) Framework-valg i praksis (kort og brutalt)
- LangGraph: stærkt når du vil have kontrol og state (langvarige, forgrenede flows). Aktiv udvikling og hyppige releases ind i slutningen af 2025. [7] (PyPI)
- AutoGen: godt til multi-agent samarbejde og patterns; GitHub-releases i H2 2025 viser modenhed og løbende udbygning. [8] (GitHub)
- CrewAI (platformisering): fokus på “agent operations” – observability/governance som produkt; i nov. 2025 blev AOP/AMP positioneret som enterprise-infrastruktur. [9] (FinancialContent)
4) “Small loop, big loop”: sådan undgår du løbske agenter
Den sikre produktionsmodel er: små automatiske loops (forsøg→valider→ret) og et stort loop hvor mennesket godkender, når risikoen stiger. Microsoft beskriver human-in-the-loop workflows i Agent Framework som en måde at kombinere deterministisk orkestrering med autonome dele. [3] (Techcommunity.Microsoft.com)
Og husk: agenter åbner nye angrebsflader. Microsoft advarer direkte om cross-prompt injection (XPIA), hvor ondsindet indhold i fx dokumenter/UI kan “overtage” agentens instruktioner. [11] (Windows Blog)
5) KPI’er der faktisk hjælper (start her)
Mål på opgave – ikke på “gode svar”:
- Task success rate (løst uden menneske / løst med menneske / ikke løst)
- Escalation rate (hvor ofte big loop trigges)
- Fejltyper pr. værktøj (API, datakvalitet, permissions, model)
- Cost per task + p95 latency
- Audit-spor-dækning (kan vi rekonstruere forløbet?) – især vigtigt ved compliance. [2][10] (azure.microsoft.com)
6) Case-skabelon (kopiér ind i dit projekt)
Opgave: (fx “håndtér kundeopsigelser”)
Værktøjer: CRM, mail, faktura, vidensbase
Regler/policy: hvad må agenten ændre – og hvornår kræves godkendelse?
Validering: hvad tjekkes før næste trin? (data, beløb, rettigheder)
Observability: hvilke events logges + alarmer ved afvigelser
Evals: 20–50 realistiske cases som regression-suite
Kilder
[1] OpenAI – “Introducing AgentKit” (6. okt. 2025). (OpenAI)
[2] Microsoft Azure Blog – “Agent Factory: Designing the open agentic web stack” (24. sep. 2025). (azure.microsoft.com)
[3] Microsoft TechCommunity – “Building Human-in-the-loop AI workflows with Microsoft Agent Framework” (2025). (Techcommunity.Microsoft.com)
[4] AWS – “Introducing Amazon Bedrock AgentCore (preview)” (16. jul. 2025). (Amazon Web Services, Inc.)
[5] AWS What’s New – “Amazon Bedrock AgentCore is now generally available” (okt. 2025). (Amazon Web Services, Inc.)
[6] AboutAmazon/AWS – “Policy in Amazon Bedrock AgentCore” (2. dec. 2025). (About Amazon)
[7] LangGraph (PyPI) – release 1.0.5 (12. dec. 2025). (PyPI)
[8] Microsoft AutoGen – GitHub Releases (jul–sep 2025). (GitHub)
[9] CrewAI – lancering/udvidelse af Agent Operations Platform (19. nov. 2025) + AMP (2025). (FinancialContent)
[10] Langfuse – “Langfuse for Agents” (5. nov. 2025). (langfuse.com)
[11] Windows Experience Blog – “Securing AI agents on Windows” (16. okt. 2025). (Windows Blog)
Medlem
80 kr./måned
Bliv medlem på PatreonStøt AI-Portalens uafhængige journalistik om AI, magt og samfund.
Inkluderet i medlemskabet:
- Månedligt nyhedsbrev
- Invitationer til online og fysiske events om AI
- Adgang til optagelser og opsamlinger fra møder og foredrag
- Rabat på events
- Invitation til månedligt online redaktionsmøde
Medlemskab administreres via Patreon.
Vi laver journalistik om AI, fordi udviklingen går hurtigere end den offentlige samtale.
På AI Portalen forsøger vi at skabe overblik, perspektiv og kritisk indsigt i en teknologi, der allerede former alt fra arbejdsmarkedet til demokratiet — ofte uden at nogen bremser op og forklarer, hvad der foregår.
Hvis vores artikler hjælper dig med at forstå AI lidt bedre, så overvej at støtte arbejdet.
Et medlemskab gør én ting mulig: at vi kan blive ved med at undersøge, dokumentere og forklare, hvordan AI påvirker Danmark — uden investorer, uden PR-interesser og uden at jage hype.
Bliv medlem og vær med til at styrke uafhængig journalistik om AI.
Follow Me