Waarom “human in the loop” onmisbaar is bij de conversie van vrije-tekst antecedenten naar SNOMED CT in een EPD-migratie (Belgische context)

 Inleiding

Het omzetten van jaren aan medische en chirurgische antecedenten in vrije tekst uit een EPD naar gestructureerde data (zoals SNOMED CT) is geen louter technisch klusje. Het raakt de continuïteit en veiligheid van de zorgverlening, de medisch-inhoudelijke betrouwbaarheid van het dossier, én het medicolegale en aansprakelijkheidskader waarin Belgische zorginstellingen opereren. Juist daarom zijn menselijke validatie en voldoende tijd/budget (human-in-the-loop, HITL) essentieel.

Hieronder probeer ik een en ander op een rij te zetten. Uiteraard is dit slechts een klein onderdeel van een complex onderwerp.

1) Klinisch en inhoudelijk: waarom artsen en terminologen mee aan het roer moeten tijdens de conversie

Context en nuance gaan vaak verloren zonder menselijk oordeel. Vrije tekst bevat temporele context (“vroeger”, “gepland”), subject-context (familie versus patiënt), en ontkenningen (“géén penicilline-allergie”). SNOMED CT heeft hiervoor expliciete modelleerelementen (o.a. de hiërarchie Situation with explicit context en attributen zoals temporal context en finding context), maar het correct herkennen en toepassen daarvan vergt klinisch inzicht. Een automatische pipeline mist juist hier relatief vaak de plank, wat leidt tot verkeerde “history of…” of ontbrekende negaties - met direct veiligheidsrisico tijdens de klinische praktijkvoering en medische dossiervoering. 

Foutieve of te grove mappings zijn klinisch onveilig. Een verkeerd geconverteerd antecedent (bv. “heup-prothese” als “heupoperatie”, CVA als TIA, STEMI als angor, ...) of het verliezen van postcoördinatie-details kan downstream klinisch beleid, beslisondersteuning, interactiewaarschuwingen en risicostratificatie ondermijnen. SNOMED-implementatie- en mapping-gidsen adviseren daarom expliciet (klinische) review- en validatiestappen, zeker wanneer de mapping voor klinisch gebruik is.

Natural Language Processing (NLP) is nuttig, maar niet foutloos. Recente overzichten van klinische concept-extractie en automatische codering tonen dat prestaties variëren per domein en dat menselijk toezicht nodig blijft voor kwaliteit en uitlegbaarheid, mét correctieslagen op negatie, temporalisering en zeldzame termen. HITL-opzet verkleint die kloof.

Tweetalige realiteit in België. De Belgische SNOMED-CT-terminologiestructuur bestaat in het NL en FR en groeit, maar lokale synoniemen/afkortingen verschillen per taal en instelling. Menselijke validators (tweetalig, domeinexpert) zijn cruciaal om zo nodig semantische equivalentie te bewaken en vertaalvalkuilen te vermijden.

2) Continuïteit van zorg en dossiervorming

Zorgcontinuïteit vraagt correcte voorgeschiedenis (antecedenten). Nationale kwaliteitskaders benadrukken dat continuïteit van informatie (o.m. voorgeschiedenis, chronische aandoeningen, allergieën) essentieel is om dubbele onderzoeken, tegenstrijdige behandelingen en bijwerkingen te voorkomen (vb. contrast-allergie). Een goed gestructureerde en uitgevoerde HITL-migratie voorkomt dat kritieke antecedenten wegvallen of verkeerd worden geïnterpreteerd. 

Bewaarplicht en volledigheid. De kwaliteitswet verplicht lange bewaartermijnen (minimaal 30, maximaal 50 jaar vanaf het laatste contact). Migraties zonder grondige kwaliteitscontrole zetten dit op het spel (verlies of vervorming van oude data). Het rechtmatig voldoen aan die bewaarplicht vergt dus niet alleen export/import, maar ook structurele en inhoudelijke verificatie. 

3) Medicolegaal en aansprakelijkheid in België: waarom HITL risicobeperkend is

Patiëntenrechten en dossierrechten. De Wet Patiëntenrechten geeft patiënten recht op inzage en afschrift (binnen 15 dagen) én impliciet op een getrouw, begrijpelijk dossier. Als een migratie door automatische conversiefouten een verkeerde voorgeschiedenis toont, kan de instelling in de problemen komen - bij klachten, rechtzettingen of betwistingen. HITL-controles verkleinen dat risico aanzienlijk. 

GDPR-beginsel van juistheid. Onder de GDPR moeten persoonsgegevens “juist en zo nodig geactualiseerd” zijn; onjuiste gegevens moeten “onverwijld” worden gewist of rechtgezet (art. 5(1)(d) en art. 16). Voor gezondheidsgegevens (bijzondere categorie) geldt bovendien een strikt regime (art. 9). Een gecontroleerde, gedocumenteerde validatie-workflow is daarom niet alleen ‘goed’, maar juridisch noodzakelijk.

Nieuw aansprakelijkheidsrecht (Boek 6 BW, in werking 1 jan 2025). Met Boek 6 is het buitencontractuele aansprakelijkheidsrecht hervormd. De lat voor fout-, schade- en causaliteitsanalyse blijft, maar de context rond samenloop en aanspreekbaarheid wijzigde, wat ook relevant kan zijn bij fouten door (sub)verwerkers en leveranciers tijdens migraties. Goede HITL-processen, logging en validatie helpen aantonen dat “redelijke zorg” is betracht.

Verwerkers/contractuele borging (art. 28 GDPR). Ziekenhuizen (verwerkingsverantwoordelijken) moeten met IT-leveranciers (verwerkers) sluitende verwerkersovereenkomsten hebben, inclusief kwaliteits- en validatieafspraken voor datamigratie. HITL-acceptatiecriteria, steekproef-audits en herstelprocedures horen daarin thuis.

Deontologie en zorgvuldigheidsnorm. De Belgische deontologische en KCE-kaders maken duidelijk dat de zorgverlener aan een zorgvuldigheidsmaatstaf wordt gehouden; een (inhoudelijk) onzorgvuldige data-migratie die tot klinische schade leidt, kan tuchtrechtelijk en burgerrechtelijk gevolgen hebben. HITL is een praktisch instrument om die norm te borgen.

4) Wat HITL in de praktijk betekent (en waarom tijd/budget nodig zijn)

  1. Dubbele codering & steekproeven. Trek representatieve samples (met zeldzame en risicovolle antecedenten), voer automatische mapping (NLP) + menselijke review uit, en bereken kwaliteitsmetrics (Positive Predictive Value (PPV)/sensitiviteit). Herhaal iteratief tot drempels gehaald zijn. (Aanbevolen in SNOMED-mapping-documentatie.)
  2. Context-regels afdwingen. Maak expliciet gebruik van history/negation/family-constructen in SNOMED CT (bijv. History of surgery als situation, niet enkel als procedure), en laat clinici die betrokken zijn bij de conversie controleren of die context klopt.
  3. Tweetalige validatie. Betrek zo nodig NL- en FR-validators en gebruik de gevalideerde Belgische taal-refsets, zodat semantiek behouden blijft bij termen en synoniemen.
  4. Medicolegaal spoor. Leg beslissingen/richtlijnen vast (mapping-keuzes, afwijzingen, correcties) en borg dit contractueel (art. 28 GDPR) en deontologisch (traceerbaarheid, rectificatieproces). 
  5. Realistische planning. Tijd en budget moeten expliciet voldoende ruimte bieden voor iteraties, klinische reviewsessies, re-runs, en nazorg (rectificaties na go-live). Zonder die buffer is kwaliteitsverlies, non-conformiteit aan GDPR-juistheid, en patiëntenrechten vrijwel zeker. 

Specificiteit (ook: true negative rate, hoe goed je negatieven uitsluit) is het vermogen van een model om negatieve gevallen correct te identificeren. Bijvoorbeeld bij een systeem dat termen gerelateerd aan (antecedenten van) CVA's in het medisch dossier moet herkennen, betekent een hoge specificiteit dat niet-CVA's bijna nooit foutief als positief worden gelabeld. Het nadeel is dat een model met te hoge specificiteit juist de echte positieve gevallen kan missen.

Sensitiviteit (ook: recall, true positive rate, hoe goed je positieven vangt) is het het vermogen van een model om alle relevante (positieve) gevallen correct te vinden. Stel je hebt bijvoorbeeld een systeem dat termen gerelateerd aan (antecedenten van) CVA's in het medisch dossier moet herkennen. Een hoge sensitiviteit betekent dat bijna alle termen gerelateerd aan CVA's ook als positief worden herkend. Het nadeel is dat je mogelijk ook meer vals-positieven meekrijgt. Aangezien het in de geneeskunde (vaak) belangrijk is om niets te missen, corrigeer je hierop door menselijke revisie van het resultaat (HITL).

De Positive Predictive Value (PPV) wordt in machine learning (ML) en ook in NLP meestal “precision” genoemd. Het verschil met sensitiviteit (recall) is dat sensitiviteit gaat over hoeveel van de echte positieven je hebt gevonden? PPV (precision) gaat erom hoe betrouwbaar zijn de positieven die je gevonden hebt? Vaak bestaat er een trade-off tussen sensitiviteit en PPV, namelijk een hoge sensitiviteit betekent dat je veel vindt , maar soms ook te veel (vals-positieven). Hoge PPV betekent dat wat je vindt meestal juist is, maar je mist misschien een aantal echte gevallen.

 5) Tot slot

  • Klinisch/in­houdelijk: Alleen met HITL worden context (historisch/actueel, negatie, familie) en nuances correct vastgelegd - randvoorwaarde voor veilige zorg en bruikbare data.
  • Medicolegaal/GDPR: Juistheid (art. 5(1)(d)) en rectificatie (art. 16), plus de striktere regels voor gezondheidsgegevens (art. 9), maken kwaliteitsborging en herstelprocessen verplicht; HITL is de praktische vertaling daarvan.
  • Aansprakelijkheid: Met Boek 6 (vanaf 01-01-2025) en de deontologische zorgvuldigheidsnorm vergroot een aantoonbare HITL-aanpak de juridische verdedigbaarheid en verlaagt ze het risico op schadeclaims bij migratiefouten.

 Bronnen (selectie)

 Wet en beleid (België/EU):

  • Wet van 22 augustus 2002 betreffende de rechten van de patiënt (inzage/afschrift; 15-dagen-termijn). 
  • Wet inzake de kwaliteitsvolle praktijkvoering in de gezondheidszorg (bewaarplicht 30–50 jaar) (Orde der Artsen-duiding).
  • GDPR – officiële tekst (art. 5 juistheid; art. 9 gezondheidsgegevens; art. 16 rectificatie).
  • Boek 6 “Buitencontractuele aansprakelijkheid” – in werking 1 januari 2025 (FOD Justitie).
  • GDPR art. 28 (verwerkersovereenkomst) en Vlaamse toelichting.

SNOMED CT (implementatie/mapping):

  • SNOMED International – Mapping Guide / validatieadvies.
  • Context-representatie (Situation with explicit context, history/negation/subject). 
  • Nationaal Release Centrum (NRC) België / tweetalige SNOMED CT refsets en distributie.

 Klinische kwaliteit/continuïteit & NLP:

  • Continuïteit van zorg – Naar een gezond België (FOD Volksgezondheid).
  • Overzichten klinische concept-extractie/automatische codering (HITL-noodzaak). 
  • KCE-duiding zorgvuldigheidsmaatstaf (medico-legaal).

Verdere informatie:

UZA trekt twee jaar uit migratie van de medische en chirurgische antecedenten van het huidige medische dossier naar het toekomstige elektronische patiëntendossier.

SNOMED CT and Context

Clinical Finding and Disorder - SNOMED Confluence

SNOMED CT Mapping Guide

Clinical Concept Extraction: a Methodology Review - PMC

Belgium NRC (Katrien Scheerlinck & David Op De Beeck)

 Continuïteit van zorg (België)

3.3. Bewaring van patiëntendossiers

Wet van 22 augustus 2002 betreffende de rechten van de patiënt, gewijzigd door de wet van 6 februari (B.S.23-02-2024)

GDPR/AVG - Regulation (EU) 2016/679 of the European Parliament and of the Council of 27 April 2016 on the protection of natural persons with regard to the processing of personal data and on the free movement of such data, and repealing Directive 95/46/EC (General Data Protection Regulation) (Text with EEA relevance)

Art. 9 GDPR Processing of special categories of personal data

Art. 28 GDPR Processor

Hervorming Burgerlijk Wetboek

Verwerkersovereenkomst - Verplichtingen bij het verwerken van persoonsgegevens (Vlaanderen)

Medico–legale aspecten van klinische praktijkrichtlijnen (KCE Rapport 26A, 2006)

Support EHR Data Entry



Popular posts from this blog

Het Budget Financiële Middelen (BFM) budgettair type A (Acuut)

Belgische S2-centra voor acute beroertezorg met invasieve procedures

Hervorming van de Belgische ziekenhuisfinanciering - struikelblokken & mogelijke hervormingsscenario's en hun voor- en nadelen