Maandagochtend, klantenservice van een Nederlands familiebedrijf in de installatietechniek. Een klant belt voor de derde keer in twee weken over hetzelfde probleem met zijn warmtepomp. De chat-agent op de website — sinds een paar maanden in productie — groet hem opgewekt als nieuwe klant. Vraagt naar zijn naam, zijn postcode, het type apparaat. De klant tikt het in voor de derde keer. Bij vraag vier — “kunt u uw probleem omschrijven?” — hangt hij op en pakt de telefoon. Aan de andere kant van de lijn een servicemedewerker die het dossier wél vindt, en die in stilte denkt: dit had de agent moeten weten.
Dit is niet een randgeval. Dit is wat er gebeurt op het moment dat een agent geen geheugen heeft buiten de huidige conversatie. En dat is bij verreweg de meeste agents die het MKB in 2026 in productie heeft staan, nog steeds het geval.
Wat “geheugen” voor een agent eigenlijk is
Geheugen is geen vinkje in een instellingenscherm. Het is een ontwerpkeuze, en voor de meeste MKB-toepassingen zijn er vier soorten die u uit elkaar moet houden:
- Conversatie-geheugen. Wat binnen één gesprek beschikbaar blijft. Hier draaien de bekende getallen om: Anthropic levert Claude inmiddels met een contextvenster van één miljoen tokens, Google’s Gemini 2.5 idem. Voldoende voor een lang gesprek, ruim onvoldoende voor de hele klantrelatie.
- Klant- of account-geheugen. Wat de agent over een specifieke klant onthoudt over sessies heen — historie van zaken, voorkeuren, eerdere oplossingen. Dit is wat in het voorbeeld hierboven ontbrak.
- Werk-geheugen of “scratchpad”. Wat de agent voor zichzelf bijhoudt tijdens een meerstaps taak — tussenresultaten, plannen, ongedaan-gemaakte stappen. Belangrijk voor agents die autonoom werk doen, niet alleen praten.
- Organisatie-geheugen. Wat het bedrijf zelf in kennis heeft staan — handleidingen, eerdere zaken, kennisbank — en wat de agent op het juiste moment ophaalt. Dit overlapt met retrieval, maar het is geheugen op organisatieniveau.
Een goed ontworpen MKB-agent gebruikt alle vier, maar voor elk type maakt u expliciete keuzes: wat slaat u op, hoe lang, waar, en wie kan erin kijken.

Waarom dit nu trending is
Drie ontwikkelingen vallen samen.
- De modellen kunnen meer onthouden binnen een gesprek. Een contextvenster van één miljoen tokens betekent in de praktijk: een hele productcatalogus, een dik dossier, of een lange klantgeschiedenis past in één keer mee. Het verandert wat technisch haalbaar is — en daarmee wat klanten gaan verwachten.
- Geheugen-architecturen worden volwassen. Frameworks als LangGraph van LangChain, Mem0 en Letta (voortgekomen uit het MemGPT-onderzoek) leveren patronen voor opslag, samenvatting en terughalen van geheugen. Het is niet meer alleen “alles in een vector-database gooien”. Er zijn weloverwogen keuzes te maken.
- De grote chatproducten doen het voor. ChatGPT en Claude geven gewone gebruikers sinds 2024 en 2025 een “memory”-functie die over gesprekken heen werkt. Daardoor merkt elk directielid op het eigen privé-account hoe dat aanvoelt — en vraagt zich af waarom de klant-agent op het werk dat niet doet.
Tegelijk komt de AVG/GDPR-kant scherper in beeld. Wat een agent over een klant onthoudt is persoonsgegeven, valt onder de gebruikelijke grondslagen, en kent bewaartermijnen. Zonder ontwerpkeuzes vooraf bouwt u een schaduw-dossier waar de klant en de Autoriteit Persoonsgegevens vragen over kunnen stellen.
Wat het niet is
Een paar veelvoorkomende misverstanden:
- Het is niet hetzelfde als “een groter contextvenster”. Een miljoen tokens helpt binnen één gesprek. Tussen gesprekken is dat geheugen weg, tenzij u zelf opslag inricht.
- Het is niet “alles bewaren in een vector-database”. Een vector-store is een gereedschap, geen ontwerp. Zonder samenvatten, opruimen en typeren komt u in een toestand waarin de agent telkens irrelevante fragmenten ophaalt en in een nieuw gesprek het verkeerde besluit neemt.
- Het is geen vrijbrief om persoonsgegevens onbeperkt te bewaren. Wat de agent onthoudt over een klant is data, valt onder uw verwerkersbeleid, en hoort thuis in uw register van verwerkingen.
- Het is geen pure techniek-discussie. Welke voorkeuren mag de agent zonder klanttoestemming bijhouden? Wat schoont u na een afgesloten zaak op? Dat zijn keuzes voor de directie en de operationele leiding, niet alleen voor de bouwer.
Drie signalen dat u dit nu moet regelen
In gesprekken met MKB-directies komen drie signalen telkens terug:
- Klanten moeten zichzelf herhalen. Of dat nu in chat, op de telefoon, of in een terugbel-flow gebeurt — als de agent steeds opnieuw begint, lekt er vertrouwen weg dat u niet terugkrijgt.
- De agent geeft tegenstrijdige antwoorden bij vervolgvragen. Hij weet niet meer wat hij in het vorige gesprek aan dezelfde klant heeft gezegd. Voor een serviceomgeving is dat een directe oorzaak van klachten.
- Niemand kan zeggen wat de agent over een klant in zijn geheugen heeft. Geen overzicht, geen exportknop, geen opruimregel. Dat is niet alleen onhandig — dat is een AVG-risico.
Komt één van de drie u bekend voor, dan zit u op het punt waarop dit een echte ontwerpvraag wordt.
Wat dit voor het MKB praktisch betekent
Goed nieuws: u hoeft geen onderzoeksafdeling te zijn om dit goed in te richten. Een werkbaar startpunt voor een MKB-agent met geheugen ziet er meestal zo uit:
- Een conversatie-laag met een ruim modelcontextvenster, voor diepgang binnen het gesprek.
- Een klant-geheugen dat aanhaakt op uw bestaande CRM, helpdesk of ticketsysteem — niet als nieuw eilandje, maar als afgeleide van wat daar al staat.
- Een scratchpad voor agents die meerstaps werk doen — bijvoorbeeld een offerte-agent die meerdere prijscomponenten verzamelt.
- Een opruimregel: wat verloopt na een afgesloten zaak, wat vatten we samen, wat gooien we weg.
- Een inzage- en wisbaarheid-route: hoe levert u, op verzoek van een klant of toezichthouder, een overzicht of een verwijdering.
Wij hebben de essentiële vragen samengevat in een korte checklist: “Wat onthoudt uw AI-agent eigenlijk?”. Eén A4’tje, geen verkooppraatje. Wilt u er na het invullen over doorpraten, dan plannen we een uur. Geen verkopers-script — een gesprek tussen ondernemer en ontwikkelaar.
Voor wie is dit niet?
Eerlijk afgebakend: dit artikel is niet voor u als u nog helemaal geen agent in productie heeft. Begin dan eerst met een eenvoudige tool-use case binnen één gesprek. De vraagstukken hierboven worden pas urgent op het moment dat klanten u meerdere keren raken — via verschillende kanalen, of opnieuw na verloop van tijd. Heeft u al een agent live, of staat er een live-gang op de planning, dan is dit precies het gesprek dat u nu wilt voorbereiden.
Wat onthoudt uw AI-agent eigenlijk?
Eén A4’tje, geen verkooppraatje. Vijf secties met checkboxes, een zelf-scoring op het einde. Voor directie, IT-manager of bouwer die wil weten waar de agent vandaag aan toe is — en wat er voor de volgende stap geregeld moet worden.
📥 Download de checklist (PDF, A4) Of plan een uur met Sam Spies — geen verkopers-script
Verder lezen op spiescreations.nl
- Wie tekent voor wat de agent doet? Agent-governance voor het MKB — over autonomie, audit trail en kill-switch.
- Agentic RAG: van zoekbalk in SharePoint naar een collega die antwoord geeft — over hoe een agent uw eigen bedrijfskennis terughaalt.
Bronnen
- Anthropic — Claude met 1M tokens context.
- Google DeepMind — Gemini 2.5 long context.
- LangChain — LangGraph: memory concepts.
- Mem0 — Mem0 — persistent memory layer voor LLM apps.
- Letta / MemGPT — Letta (MemGPT).
- OpenAI — Memory in ChatGPT.
- Anthropic — Memory in Claude.
- Autoriteit Persoonsgegevens — Algoritmes en AI.



