Open internationale standaarden als motor voor reproduceerbare fenotypes en cohorten in studies voor Belgische ziekenhuizen

Inleiding

Klinische studies, epidemiologie en Real World Evidence (RWE) staan of vallen met eenduidige, "computeerbare" definities van fenotypes en cohorten. Open internationale terminologie- en datastandaarden - met name SNOMED CT (klinische begrippen) en LOINC (testen, metingen en observaties) - maken zulke definities herbruikbaar, uitwisselbaar en schaalbaar, over afdelingen, instellingen (ziekenhuizen) en landen heen.

In wat volgt wil ik de rol schetsen van open internationale terminologie- en datastandaarden én de concrete meerwaarde voor een Belgisch ziekenhuis.

Wat brengen SNOMED CT en LOINC precies?

SNOMED CT is ’s werelds meest uitgebreide, meertalige klinische terminologie die klinische inhoud consequent en machine-leesbaar vastlegt in EPD’s. Concepten zijn logisch gedefinieerd en hiërarchisch geordend, wat geautomatiseerde redenering en aggregatie mogelijk maakt. 

LOINC biedt een universele codetaal voor laboratoriumtesten, metingen en klinische observaties (bv. vitale parameters, vragenlijsten), en fungeert zo als gemeenschappelijke sleutel voor resultaatuitwisseling en -bundeling. 

België beschikt bovendien over een nationaal release- en vertaalecosysteem: het Belgische Terminologiecentrum (FOD Volksgezondheid) beheert SNOMED CT met Nederlandstalige en Franstalige vertalingen; de eerste Belgische release dateert van maart 2018 en de taalrefsets tellen intussen honderdduizenden gevalideerde termen. 

Fenotypes en cohorten: van “lijstjes” naar "computeerbare" logica

Traditioneel worden fenotypes samengesteld als extensieve lijsten van codes. Met SNOMED CT kan men daarentegen intentioneel definiëren - via hiërarchieën en Expression Constraint Language (ECL) expressies - zodat een fenotype automatisch alle (nieuwe) relevante subtypes erft. HL7 FHIR ondersteunt dit met ValueSets die SNOMED CT- en LOINC-codes bevatten; LOINC publiceert zelf FHIR-ValueSets en “Groups”. Zo worden fenotypes machine-toepasbaar in queries, beslisregels en cohortselectie. 

Voorbeeld: “Type-2-diabetes” als descendant van een SNOMED CT -ouderconcept, gecombineerd met LOINC-metingen (bv. HbA1c) in een FHIR-Observatie, levert een robuuste, portable definitie die actueel blijft wanneer termen evolueren.

Extensionele SNOMED CT refset:

  • Je somt expliciet alle leden op (lijst met concept-id’s).
  • Wordt meestal opgeslagen als een Simple Reference Set (RF2), desnoods Ordered/Annotation als je extra info per lid nodig hebt. 

Intentio­nele SNOMED CT refset:

  • Je definieert een regel/criterium en laat het systeem daaruit de leden afleiden (bijv. “alle afstammelingen van Astma”).
  • Formeel vastgelegd met een SNOMED CT query specification refset en bijna altijd geschreven in ECL - Expression Constraint Language. 

Schakel naar RWE: de rol van OMOP en gestandaardiseerde vocabularia

In internationale RWE-netwerken wordt data vaak naar het Observational Health Data Sciences and Informatics (OHDSI) OMOP Common Data Model (CDM) getransformeerd. Observational Medical Outcomes Partnership (OMOP) steunt op gestandaardiseerde vocabularia (waaronder SNOMED CT en LOINC) zodat blootstelling- en uitkomstfenotypes uniform te definiëren en te analyseren zijn, ongeacht de brondatabase. Dit opent de deur naar grootschalige, reproduceerbare analyses (karakterisering, effect schatting, voorspelling). 

Europa bouwt hierop voort via EHDEN, een gefedereerd netwerk dat de OMOP-CDM omarmt voor GDPR-conforme, gestandaardiseerde analyses over Europese landen heen - een directe versneller voor RWE-studies (DARWIN EU). 

Belangrijkste voordelen voor een Belgisch ziekenhuis

1. Semantische interoperabiliteit, ook meertalig

Dankzij SNOMED CT- en LOINC-codering kunnen datasets over Nederlandstalige en Franstalige contexten heen betekenis-equivalent worden uitgewisseld. De Belgische NRC-infrastructuur (Terminologiecentrum) waarborgt lokale distributie en vertaling, wat zowel klinische zorg als onderzoek faciliteert.

2. Snellere, reproduceerbare fenotypering en cohortselectie

Intentionele SNOMED CT-definities + LOINC-metingen in FHIR-ValueSets maken cohortcriteria transparant, versieerbaar en automatisch herbruikbaar in datamarts, registers en studies. Dit reduceert handwerk en heronderhandeling bij elke nieuwe studie.

N.B.: Een datamart is een afgeslankte, gespecialiseerde versie van een datawarehouse, bvb. voor een bepaald doel (zoals rapportering of data-analyse). 

3. Naadloze aansluiting op Europese RWE-netwerken

Met SNOMED CT/LOINC als semantische laag is de ETL (Extract, Transform, Load) naar een OHDSI OMOP CDM systeem voorspelbaarder, en kan het ziekenhuis (real world) evidence co-produceren via (inter-)nationale EHDEN/OHDSI-studies - zonder ruwe data te delen (federated analytics). Dit vergroot zichtbaarheid, versnelt publicaties en ondersteunt Health Technology Assessment (HTA)-vragen. 

Federated analytics is data-analyse over meerdere databanken/organisaties zonder dat de ruwe medische data centraal wordt verzameld. Je stuurt de code voor de analyse naar waar de data staat (“code-to-data”), voert daar de analyse uit, en stuurt alleen geaggregeerde of geanonimiseerde resultaten terug. Zo behoud je privacy en voldoe je makkelijker aan regels m.b.t data-privacy. Pluspunten zijn privacy by design, minder datatransport/risico, samenwerken over datasilo’s. Aandachtspunten zijn meer decentrale coördinatie/infrastructuur nodig, sommige analyses zijn lastiger of trager, en je moet goed waken over bias en datakwaliteit aan de bron (Garbage in, Garbage out, GIGO). 

Federated analytics is geen “juridische vrijbrief”, maar helpt om aan de kernvereisten van de GDPR en de Belgische wet te voldoen: dataminimalisatie, privacy by design, beperkte doorgifte en sterke beveiliging - én sluit aan bij de Belgische eHealth-architectuur en de komende European Health Data Space (EHDS)-praktijk. Combineer dit altijd met een goed onderbouwde rechtsgrond, Data Protection Impact Assessment (DPIA), goede contracten en state-of-the-art beveiliging.

N.B.: DPIA staat voor Data Protection Impact Assessment (Gegevensbeschermingseffectbeoordeling). Het is een instrument dat de GDPR (art. 35) verplicht maakt wanneer een type verwerking waarschijnlijk een hoog risico inhoudt voor de rechten en vrijheden van personen.

N.B.: Anonimisatie blijft tricky. Ook geaggregeerde uitkomsten kunnen herleidbaar zijn als segmenten klein zijn of modellen lekken (bijv. via “small cell disclosure”, zeldzame ziekten). Gebruik k-anonimiteit-achtige drempels, rapporteringsregels en toets aan EDPB/WP29-guidance. K-anonimiteit is een privacy-beschermingstechniek waarbij je ervoor zorgt dat elke persoon in een dataset niet te onderscheiden is van minstens k-1 andere personen op basis van de quasi-identificerende kenmerken (zoals leeftijd, postcode, geslacht). Je stelt dan in de rapportering een drempel van bvb. k=5 in, waarbij geen aantallen kleiner dan 5 worden gerapporteerd (o.a. van belang voor zeldzame ziekten).

N.B.: Federated analytics focust op statistiek/metrics (tellingen, gemiddelden, features, QA-analyses). Federated learning traint AI-modellen (bijv. een neural net) zonder de ruwe data te centraliseren.

4. Betere datakwaliteit en traceerbaarheid

Gestandaardiseerde codes maken valideerbare datakwaliteitscontroles mogelijk (denk aan ontbrekende of onmogelijke waarden per code), en verbeteren audit-trails voor inspecties (Good Clinical Practice/Good Pharmacovigilance Practices, GCP/GVP). In OHDSI-/OMOP-omgevingen zijn hiervoor  tools en methoden beschikbaar.

Hanteer ALCOA+ als een kwaliteitsprincipe voor dataintegriteit in GxP-omgevingen (zoals GCP/GVP). Het zegt waaraan onderzoeks- en zorgdata moeten voldoen om betrouwbaar te zijn (Attributable, Legible, Contemporaneous, Original, Accurate, Complete, Consistent, Enduring, and Available).  

5. Vendor-neutrale toekomstbestendigheid

Open internationale standaarden verminderen vendor lock-in: terminologie-services (SNOMED CT, LOINC via FHIR) en OHDSI OMOP-artefacten (conceptsets, cohortdefinities) zijn systeem-agnostisch en blijven bruikbaar wanneer EPD’s of analyse-platformen wijzigen. 

6. Meerdere use-cases met één semantische laag

Eénmalig kwalitatief, efficiënt en effectief coderen aan de bron (SNOMED CT/LOINC) rendeert in operationele klinische zorgprocessen (beslisondersteuning), kwaliteit/registratie, Minimale Ziekenhuis Gegevens (MZG)  en onderzoek (cohort discovery, uitkomstenanalyse). Dezelfde conceptsets voeden zowel realtime (klinische, operationele) dashboards als retrospectieve studies (primair en secundair gebruik van klinische data). 

Praktische implementatie-tips

  • Zet een terminologieserver op in het ziekenhuis (FHIR Terminology Services) met toegang tot de Belgische SNOMED CT-release en LOINC-ValueSets; beheer ValueSets/ConceptMaps als broncode-artefacten. 
  • Definieer fenotypes centraal (intentioneel waar mogelijk) en publiceer ze als FHIR ValueSets/CodeSystem-filters; gebruik LOINC-“Groups” voor lab-panels. 
  • Plan voor OHDSI OMOP-compatibiliteit: map zo nodig lokale terminologieën naar SNOMED CT/LOINC of gebruik SNOMED CT en LOINC in het EPD en LIMS. Onderhoud OMOP-conceptsets voor reproduceerbare analyses en deelname aan (inter-)nationale EHDEN/OHDSI-studies. 

Tot slot

Door SNOMED CT en LOINC systematisch te gebruiken als semantische ruggengraat, kunnen Belgische ziekenhuizen fenotypes en cohorten eenduidig, herbruikbaar en internationaal vergelijkbaar definiëren. Dat levert sneller onderzoek, betere datakwaliteit, en een directe aansluiting op Europese RWE-netwerken - met behoud van meertaligheid en nationale context. Het resultaat: snellere wetenschap, robuustere zorgbeslissingen en een lagere kost per studie.

Bronnen:

WHO Family of International Classifications (WHO-FIC)

SNOMED International

SNOMED CT  Expression Constraint Language (ECL)

SNOMED CT België (FOD VVVL)

Community Support for Clinical Terminologies (CSCT)

LOINC (Regenstrief)

HL7 FHIR

Terminologie centrum (FOD VVVL)

Observational Health Data Sciences and Informatics (OHDSI)

OHDSI OMOP Common Data Model

European Health Data Evidence Network – ehden.eu (EHDEN)

Federated Health Innovation Network (FHIN)

Health Technology Assessment (KCE)

Good Clinical Practice (GCP) (KCE)

Wet van 30 juli 2018 (België)

EDPB Document on response to the request from the European Commission for clarifications on the consistent application of the GDPR, focusing on health research (Adopted on 2 February 2021).

Securing Machine Learning Algorithms (ENISA)

Multilayer framework for good cybersecurity practices for AI (juni 2023, ENISA)

Accessible Ecosystem for Clinical Research (Federated Learning for Everyone): Development and Usability Study

WHO Guidance Document on Good Data and Record Management Practices

FAIR and ALCOA+ – data management principles

The FAIR Guiding Principles for scientific data management and stewardship (Nature, 2016)

Measure Methodology (CMS)



Popular posts from this blog

Het Budget Financiële Middelen (BFM) budgettair type A (Acuut)

Belgische S2-centra voor acute beroertezorg met invasieve procedures

Hervorming van de Belgische ziekenhuisfinanciering - struikelblokken & mogelijke hervormingsscenario's en hun voor- en nadelen