LLMs en Overheidsjargon: Evaluatie & Besliskader
Onderzoek naar lexicale vereenvoudiging van jargon door Claude 4.5 en Llama 3.1. Inclusief foutenanalyse, hallucinaties en een praktisch besliskader.
Voorbij de Zinslengte
Lexicale Vereenvoudiging van Overheidsjargon door LLMs: Een systematische evaluatie van Claude 4.5 en Llama 3.1
Nick Bergmans | Master Applied AI - HvA | 16 januari 2026
KINDEROPVANGTOESLAG
Geld van de overheid voor opvang
Het Probleem: Semantiek β Lengte
TRANSPARANT: Zonnebril (Zon + Bril = ππ)
ONDOORZICHTIG: Zwartwerker (Zwart + Werker β β«π·)
HYPOTHESE: AI struikelt niet over lengte, maar over verborgen betekenis (opaciteit).
Data & Sampling: Real-world Sources
BRONNEN: Gemeente Amsterdam β’ Belastingdienst (Γchte stukken, geen lab-data)
STRATEGIE: Maximum Variation Sampling (Uitersten kiezen: Frequent vs Zeldzaam, Transparant vs Opaak)
N=30 (Pilot) β N=80 (Final Paper)
De Meetlat: SUBTLEX-NL
Modelvergelijking: David vs Goliath
Llama 3.1: Lokaal (Privacy-first), Gratis, Beperkte rekenkracht.<br><br>Claude 4.5: Cloud (Anthropic), SOTA-benchmark, $0.04/token.
De Lengteparadox: Methodologische Lessen
Resultaten: Kwantitatief vs Kwaliteit
Automated Metrics (Flesch-Douma) lijken vergelijkbaar, maar het aantal fouten verschilt met factor 9!
Het Gevaar: Hallucinaties
INPUT: ZWARTWERKER
LLAMA 3.1: 'Iemand met zwarte werkkleding in een fabriek.'<br>β Flesch-Douma: 75 (Voldoende) <br>β Betekenis: FOUT
Foutenanalyse Llama 3.1
β’ Zorgtoeslag β 'Geld voor school' (Feitelijk onjuist)<br>β’ Energietoeslag β 'Beloning voor besparen' (Omgekeerde betekenis)<br>β’ Terugvorderen β 'Je krijgt geld' (Omgekeerde betekenis)
Conclusie & Impact: Safe-to-Automate Matrix
BESLISREGEL: Gebruik Llama voor transparante, algemene termen (kostenbesparing). Gebruik Claude of Mens voor opake jargontermen (veiligheid).
Referenties
β’ Keuleers, E., et al. (2010). 'SUBTLEX-NL: A new frequency measure for Dutch'.<br>β’ Gemeente Amsterdam Datasets (2024-2025).<br>β’ Flesch-Douma Leesbaarheidsformule.<br>β’ Anthropic System Card (Claude 4.5).<br>β’ Meta Llama 3.1 Technical Report.
- ai
- llm
- overheid
- jargon
- claude-4-5
- llama-3-1
- tekstvereenvoudiging
- nederlands





