Kritische succesfactoren en risico’s bij AI-gedreven omzetting van ongestructureerde EPD-historiek (vrije tekst) naar SNOMED CT
Inleiding
Het automatisch omzetten van ongestructureerde historische gegevens uit elektronische patiëntendossiers (EPD’s) naar gestructureerde SNOMED CT-codes belooft beter hergebruik van gegevens voor zorgverlening, onderzoek, kwaliteitsindicatoren en interoperabiliteit. Maar de stap van vrije tekst naar formele terminologie is kwetsbaar: context (wie, wat, wanneer), negatie en temporale status moeten correct worden geïnterpreteerd, en het eindresultaat moet blijvend herleidbaar zijn.
Hieronder bespreek ik de kritische succesfactoren die m.i. belangrijk zijn voor een kwaliteitsvolle implementatie en de gevolgen voor zorgverleners, patiënten en zorgkwaliteit wanneer deze omzetting onzorgvuldig gebeurt.
Kritische succesfactoren
1) Duidelijke klinische doelstelling en scope
Vertrekken van concreet afgebakende use-cases (bv. probleemlijst, allergieën, voorgeschiedenis, familieanamnese). SNOMED CT is ontworpen voor klinische documentatie en semantische interoperabiliteit; de keuze van concepten of expressies verschilt per gebruiksdoel (zorgproces, rapportering, mapping naar classificaties zoals ICD-10-BE, WHO ICD-10, WHO ICD-O, ORPHAcode, ...).
2) Robuuste terminologieservices en interoperabiliteit
Gebruik een terminologieserver die SNOMED CT-edities/-extensies, ValueSets en ConceptMaps kan beheren, bij voorkeur via HL7 FHIR Terminology Services (CodeSystem/ValueSet/ConceptMap en hun operaties). Dit voorkomt ad-hoc implementaties, ondersteunt updates en maakt uitwisselbaarheid haalbaar (vb. Ontoserver, IHTSDO/Snowstorm, ...).
HL7 FHIR Terminology Services zijn de gestandaardiseerde API-functies binnen FHIR waarmee je codeersystemen en waardelijsten bevraagt, valideert en vertaalt - zonder dat je applicatie de interne details van SNOMED CT, LOINC, e.d. hoeft te kennen. Ze draaien rond drie kernresources (CodeSystem, ValueSet, ConceptMap) en een set operations (o.a. $expand, $validate-code, $lookup, $subsumes, $translate, $closure). HL7 FHIR Terminology Services geven je een robuuste, gestandaardiseerde manier om SNOMED CT (en andere stelsels) te zoeken, te valideren, te relateren en te mappen - cruciaal voor veilige, herleidbare en interoperabele EPD-codering.
3) Beheersing van postcoördinatie en contextmodellering
SNOMED CT laat complexe klinische betekenissen toe via Compositional Grammar (postcoördinatie). Implementaties moeten bepalen wanneer precoördinatie volstaat en wanneer postcoördinatie nodig is, én beschikken over kwalitatieve tooling die expressies kan opslaan, valideren en normaliseren. Voor context (bv. “verleden”, “niet-aanwezig”, “familielid”) bestaat specifieke modellering (Situation with Explicit Context). Onjuiste of inconsistente toepassing schaadt interoperabiliteit en klinische bruikbaarheid van de data.
4) Datakwaliteit en governance vóór modellering
De kwaliteit van de brontekst bepaalt het plafond van elke NLP- of mapping-prestatie (GIGO). Hanteer een datakwaliteitskader (compleetheid, plausibiliteit, consistentie, uniciteit) en leg de verantwoordelijkheden vast van bron tot resultaat van de omzetting (data stewardship, versiebeheer, incidentbeheer).
Wat zijn compleetheid, plausibiliteit, consistentie, uniciteit:
- Compleetheid is de mate waarin vereiste gegevens aanwezig zijn: zijn alle records er (record-/populatie-compleetheid) en zijn verplichte velden gevuld (element-compleetheid). Compleetheid bepaalt het plafond van hergebruik (CDS, onderzoek).
- Plausibiliteit is de geloofwaardigheid van waarden gelet op medische logica - zowel atemporale (range/biologie) als temporale (volgorde) plausibiliteit. Plausibiliteit beschermt patiëntveiligheid (biologisch/temporale onmogelijkheid).
- Consistentie (concordantie) is de overeenstemming binnen en tussen bronnen: vertellen probleemlijst, medicatielijst, laboresultaten en (ontslag-)brieven hetzelfde verhaal? (In EHR-literatuur vaak “concordance”). Consistentie voorkomt tegenstrijdige waarheden binnen het EPD.
- Uniciteit is de afwezigheid van dubbels: elk reëel object/gebeurtenis hoort één keer voor te komen. Uniciteit voorkomt ruis, dubbel tellen en foutieve alerts/indicatoren.
- Data stewardship is de bedrijfsmatige zorg voor je gegevens over hun hele levenscyclus: definiëren → vastleggen → gebruiken → delen → archiveren. Data stewardship borgt wie beslist (verantwoordelijkheid/aansprakelijkheid) en hoe er te werk wordt gegaan (RACI).
- Versiebeheer is het systematisch vastleggen, labelen, testen en uitrollen van wijzigingen in data, modellen en terminologie - met mogelijkheid tot rollback. Versiebeheer borgt wat precies draait en hoe de verandering (klinisch) veilig gebeurt.
- Incidentbeheer is het gestructureerd afhandelen van afwijkingen die veiligheid, privacy of datakwaliteit raken. Incidentbeheer borgt hoe fouten snel en aantoonbaar goed worden opgelost.
5) NLP die context, negatie en temporale status correct herkent
Historische informatie vereist expliciete detectie van negatie (“geen diabetes”), temporale status (verleden vs. actueel) en "experiencer" (patiënt vs. familielid). Regelgebaseerde en hybride methoden (NegEx/ConText, ContextD) tonen dat juistheid voor historisch/hypothetisch vaak moeilijker is dan voor negatie, wat extra (menselijke) validatie vereist.
NegEx, ConText en ContextD zijn regelgebaseerde algoritmen uit de klinische NLP die de context rond een genoemd klinisch concept bepalen - bv. of het ontkend is, historisch/hypothetisch is, en of het de patiënt of iemand anders betreft (experiencer).
- NegEx is het “klassieke” algoritme voor negatie-detectie: zoekt naar triggers zoals “geen/zonder/ontkent” en bepaalt de scope (welk concept door die trigger wordt beïnvloed). Het is lichtgewicht (regexp-regels) en veel gebruikt als basislijn.
- ConText breidt NegEx uit en annoteert naast negatie ook temporale status (historisch, hypothetisch/review of systems, recent) én experiencer (patiënt vs. familielid). Werkt eveneens met lijsten van triggers (en “pseudo-triggers”) en eenvoudige scope-regels.
- ContextD is een Nederlandstalige adaptatie van ConText voor klinische teksten in het EPD. In evaluaties presteerde het goed voor negatie en experiencer, terwijl temporalisering (historisch/hypothetisch) lastiger bleek.
6) Klinisch geannoteerde “gold standards” en mens-in-de-lus
Bouwen en onderhouden van taak-specifieke, door clinici geannoteerde datasets met duidelijke richtlijnen tijdens het conversieproject en voor go-live i.g.v. historische data met de gestructureerde data; meet inter-annotator agreement en evalueer modellen met precision/recall/F1 op conceptherkenning én normalisatie. Systematische reviews benadrukken het belang van zorgvuldige annotatie, representatieve corpora en transparante evaluatie. Hou (altijd) de mens-in-de-lus voor risicovolle of ambiguë gevallen (HITL, Human In The Loop).
Precision, recall en F1 zijn standaardmaten om te evalueren hoe goed een AI-systeem relevante dingen vindt (bv. klinische concepten) en hoe weinig het zich vergist:
- Precision (positieve voorspellingswaarde): Hoeveel van wat je hebt gevonden is echt correct?
- Recall (sensitiviteit/volledigheid): Hoeveel van wat er te vinden was heb je ook daadwerkelijk gevonden?
- F1-score: Het harmonisch gemiddelde van precision en recall; één getal dat beide in balans weegt.
7) Terminologiemapping en downstream-consistentie (ICD, kwaliteitsindicatoren)
Wanneer SNOMED CT wordt hergebruikt voor rapportering of vergoedingen, is een kwaliteitsvolle map (bv. SNOMED CT→ICD-10-BE) cruciaal. Officiële, regel-gebaseerde mappen van NLM/SNOMED CT ondersteunen semi-automatische omzetting, maar verschillen in granulariteit en regels vergen context en menselijke controle (HITL).
8) Modellering in het EPD volgens informatiemodellen
Koppel SNOMED CT-codes aan passende EPD-structuren (bv. FHIR Condition met clinicalStatus, verificationStatus, onset/abatement; FamilyMemberHistory voor familie-anamnese) zodat betekenis (actueel, in remissie, verleden, familielid) bewaard blijft.
9) Herleidbaarheid, provenance en audittrail
Leg herkomst, agents, tijdstip en activiteit vast bij elke automatische codering (bv. FHIR Provenance en AuditEvent). Dit ondersteunt verantwoording, foutenanalyse en modelmonitoring (audit-trail).
Bij elke automatisch toegekende SNOMED CT-codering dient expliciet vastgelegd waar de codering vandaan komt (inhoudelijke herkomst), wie of wat ze uitvoerde (agents), wanneer (tijdstip) en welke bewerking het precies was (activiteit) - en dat je dit opslaat als FHIR Provenance (en voor systeemacties ook als FHIR AuditEvent). FHIR definieert Provenance (inhoudelijke herkomst) expliciet als de beschrijving van entiteiten en processen die een resource beïnvloeden. Het maakt authenticiteit, vertrouwen en reproduceerbaarheid mogelijk. Zo blijft de betekenis herleidbaar, controleerbaar en reproduceerbaar.
10) Versiebeheer en onderhoud van terminologie
SNOMED CT wordt maandelijks internationaal vrijgegeven; nationale extensies volgen hun eigen cadans. Een productie-terminologieserver en continu update-beheer zijn noodzakelijk om concept drift en semantische regressies te beperken.
Concept drift betekent dat de relatie tussen de input (bv. zinsdelen in EPD-teksten) en de output (de juiste SNOMED-CT-codes) geleidelijk of plots verandert. Oorzaken zijn o.a. nieuwe documentatie-sjablonen, veranderende patiëntpopulaties (bv. COVID-19), introductie van nieuwe geneesmiddelen/termen of taalgebruik.
Met semantische regressie wordt een regressiebug in betekenis bedoel: na een update (terminologie, reasoner, mapping of implementatielogica) wordt de vastgelegde klinische betekenis objectief minder juist, minder specifiek of minder consistent dan vóór de update - ook al draait alles technisch zoals het hoort.
Concept drift gaat over data/model-stabiliteit in de tijd en semantische regressie over betekenisstabiliteit na updates in terminologie, reasoning of tooling. Beide vragen om structurele monitoring en regressietesten om klinische kwaliteit te borgen.
11) Regelgeving, veiligheid en ethiek (GDPR, EU AI-Act, medische dossiervorming)
Gezondheidsgegevens zijn bijzonder gevoelig onder de GDPR; geautomatiseerde besluitvorming vereist zorgvuldige rechtsgrond, transparantie en waar passend menselijke tussenkomst (Art. 22). De EU AI-Act classificeert veel zorg-AI als hoog-risico met eisen rond risicobeheer, datakwaliteit, logging en menselijke oversight.
Voor een arts in een Belgisch ziekenhuis wordt de medische dossiervorming gedragen door drie pijlers: (1) het Koninklijk Besluit betreffende het Algemeen Medisch Dossier (AMD), dat vooral de continuïteit met de (huis)arts regelt; (2) het Koninklijk Besluit dat de algemene minimumvoorwaarden voor het ziekenhuis-medisch dossier vastlegt; en (3) de Wet inzake de kwaliteitsvolle praktijkvoering in de gezondheidszorg (2019), die dossierinhoud, toegang en gegevensverwerking in brede zin harmoniseert. Samen bakenen ze af wat in het dossier moet staan, hoe het wordt bijgehouden en bewaard, wie er toegang heeft en welke informatie-uitwisseling nodig is voor goede zorg.
Medicolegale aansprakelijkheid speelt een cruciale rol in een medische context door zorgverleners verantwoordelijk te houden voor hun professionele handelingen en te zorgen voor rechtvaardigheid voor patiënten in gevallen van schade. Het systeem is een belangrijke waarborg voor zowel de patiëntveiligheid als het behoud van professionele standaarden in de gezondheidszorg.
Gevolgen van onzorgvuldige omzetting
Voor zorgverleners - primair gebruik
- Verkeerde of ruisende alerts/Clinical Decision Support (CDS): fout gecodeerde problemen of anamnese kunnen foutieve beslisondersteuning activeren en alert fatigue versterken, met negatieve impact op workflow en veiligheid.
- Verlies van context: als historisch, negatief of familie niet goed wordt gemodelleerd, verschijnt “diabetes” als actief probleem; dit schaadt klinisch redeneren, zorgkwaliteit en overdracht.
Voor patiënten - primair gebruik
- Patiëntveiligheid: onterechte contra-indicaties, gemiste risico’s of onjuiste contra-indicaties door fout gecodeerde voorgeschiedenis kunnen leiden tot verkeerd beleid of gemiste zorg in een zorgproces.
- Oneerlijke zorg: bias in trainingsdata of proxies kan ongelijkheid vergroten (bv. bekende casus waarbij een zorg-algoritme systematisch minder intensieve zorg toekende aan patiënten met kenmerken van buiten de training set).
- Privacy en rechten: onvoldoende transparantie of onrechtmatige geautomatiseerde besluitvorming kan in strijd zijn met GDPR-vereisten.
Voor zorgkwaliteit en systeemfunctie
- Defecte kwaliteitsmetingen en onderzoek: fouten in concept-normalisatie vervuilen registraties, kwaliteitsindicatoren en epidemiologie; datakwaliteit-defecten werken door in secundair gebruik. Met fouten in concept-normalisatie worden vergissingen bedoeld die ontstaan wanneer een herkende tekstvermelding (mention) uit het EPD wordt genormaliseerd (gekanoniseerd) naar één of meer SNOMED CT-concepten en bijbehorende kenmerken (zoals lateralisatie, ernst, temporaliteit). Het herkenningsprobleem (“staat er diabetes in de tekst?”) is dus al voorbij; het gaat hier om het koppelen aan de juiste, geldige en voldoende specifieke code(s) en het correct vastleggen van betekenis-dragende attributen. Fouten in normalisatie veranderen de betekenis van de klinische gegevens: probleemlijsten worden vervuild, beslisondersteuning (CDS) geeft verkeerde alerts, kwaliteitsindicatoren en onderzoek raken vertekend, en interoperabiliteit lijdt omdat andere systemen “iets anders” lezen dan bedoeld.
- Foutieve vergoeding/rapportering: bij afgeleide ICD-10-BE-codering uit SNOMED CT kunnen foutieve mappen leiden tot verkeerde classificatie en financiële/rapporteringsfouten met o.a. impact op MZG en BFM.
- Interoperabiliteitsschade: inconsistente postcoördinatie of lokale extensies zonder governance breken uitwisseling tussen instellingen en systemen.
Tot slot
Een kwaliteitsvolle AI-gedreven omzetting van ongestructureerde EPD-historiek/vrije tekst naar SNOMED CT vraagt meer dan een accuraat NLP-model. Succes vergt samenhang tussen terminologieservices, contextbewuste NLP, klinische annotatie en validatie (HITL), provenance/audit, doelgerichte informatiemodellering, versiebeheer en compliance. Wie deze randvoorwaarden niet respecteert, loopt reëel risico op klinische fouten, bias, verlies van vertrouwen, verkeerde rapportering en schade aan patiëntveiligheid.
- Validatie is het systematisch aantonen dat de oplossing doet wat ze moet doen - technisch én klinisch.
- Provenance is herkomst- en afleidingsinformatie: wie heeft wat met welk hulpmiddel wanneer en waarom gedaan, en uit welke bron is een resultaat voortgekomen. Het is cruciaal voor reproduceerbaarheid, vertrouwen en bewijsvoering.
- Audit gaat over veiligheids- en toegangslogs: een onweerlegbare tijdlijn van wie welke actie op welke resource uitvoerde (lezen, creëren, wijzigen, verwijderen), inclusief context (locatie, client, reden). Dit is essentieel voor compliance, incidentonderzoek, security-monitoring en accountability.
Bronnen
- NHS Digital - SNOMED CT overview (UK).
- HL7 FHIR - Terminology Service & SNOMED CT in FHIR.
- SNOMED International - Terminology Services Guide; Implementation guides.
- SNOMED International - Compositional Grammar & Postcoordination Practical Guide (voordelen/uitdagingen).
- SNOMED International - Context Representation Implementation Guide (Situation with Explicit Context).
- Kahn, M. G., Callahan, T. J., Barnard, J., Bauck, A. E., Brown, J., Davidson, B. N., ... & Schilling, L. (2016). A harmonized data quality assessment terminology and framework for the secondary use of electronic health record data. Egems, 4(1), 1244.
- Harkema, H., Dowling, J. N., Thornblade, T., & Chapman, W. W. (2009). ConText: an algorithm for determining negation, experiencer, and temporal status from clinical reports. Journal of biomedical informatics, 42(5), 839-851
- Mehrabi, S., Krishnan, A., Sohn, S., Roch, A. M., Schmidt, H., Kesterson, J., ... & Palakal, M. (2015). DEEPEN: A negation detection system for clinical text incorporating dependency relation into NegEx. Journal of biomedical informatics, 54, 213-219.
- Kersloot, M. G., van Putten, F. J., Abu-Hanna, A., Cornet, R., & Arts, D. L. (2020). Natural language processing algorithms for mapping clinical text fragments onto ontology concepts: a systematic review and recommendations for future studies. Journal of biomedical semantics, 11(1), 14.
- Moreno-Torres, J. G., Raeder, T., Alaiz-Rodríguez, R., Chawla, N. V., & Herrera, F. (2012). A unifying view on dataset shift in classification. Pattern recognition, 45(1), 521-530.
- Gama, J., Žliobaitė, I., Bifet, A., Pechenizkiy, M., & Bouchachia, A. (2014). A survey on concept drift adaptation. ACM computing surveys (CSUR), 46(4), 1-37.
- NLM/SNOMED - SNOMED CT → ICD-10-CM map (USA, technische gids & doel).
- NLM/SNOMED - I-MAGIC (Interactive Map-Assisted Generation of ICD Codes)
- NLM/SNOMED - MAGPIE (Map Assisted Generation of Procedure and Intervention Encoding)
- SNOMED International - SNOMED CT maps
- HL7 FHIR - Condition en FamilyMemberHistory resources (status/temporale elementen).
- HL7 FHIR - Provenance en AuditEvent (herleidbaarheid/audit)
- Ash, J. S., Sittig, D. F., Campbell, E. M., Guappone, K. P., & Dykstra, R. H. (2007). Some unintended consequences of clinical decision support systems. In Amia annual Symposium proceedings (Vol. 2007, p. 26)
- GDPR - Art. 22 (geautomatiseerde besluitvorming); EU AI-Act (hoog-risico AI in zorg).
- SNOMED International - Releasecyclus (maandelijkse internationale release).
- FOD Volksgezondheid - Terminologiecentrum.
- HL7 FHIR - Release 5
- Koninklijk besluit betreffende het Algemeen Medisch Dossier (AMD), 3 mei 1999, BS 17/07/1999. Officiële tekst en context (incl. art. 1–5; uitwisseling huisarts-specialist; één AMD per patiënt).
- Koninklijk besluit houdende bepaling van de algemene minimumvoorwaarden waarvan het medisch dossier, bedoeld in art. 15 van de wet op de ziekenhuizen, gecoördineerd op 7 augustus 1987, moet voldoen, 3 mei 1999, BS 30/07/1999. (Inhoud, ondertekening, ontslagverslag, archief, bewaartermijn ≥30 jaar, inzage via gekozen arts, link met MKG).
- Wet van 22 april 2019 inzake de kwaliteitsvolle praktijkvoering in de gezondheidszorg, BS 14/05/2019; inwerkingtreding 1 juli 2021 (o.a. art. 17–20 continuïteit; art. 33 minimuminhoud patiëntendossier; art. 34 elektronisch; art. 35 bewaring 30–50 jaar; art. 36–39 gegevensdeling; art. 40 logging).