Terminologie, ontologie en classificatie in de geneeskunde: conceptuele verschillen en complementaire rollen in data-gedreven zorg
1. Inleiding
De transitie naar data-gedreven geneeskunde veronderstelt dat klinische gegevens niet alleen digitaal beschikbaar zijn, maar ook eenduidig interpreteerbaar en herbruikbaar over tijd, instellingen en systemen heen. Dat vraagt om afspraken over betekenis (semantiek). In de medische informatica worden daarvoor doorgaans drie soorten kennisartefacten onderscheiden: terminologieën, ontologieën en classificaties. Hoewel deze begrippen in de praktijk soms door elkaar worden gebruikt, dienen ze verschillende doelen en hebben ze andere ontwerpprincipes. Het onderscheid is cruciaal voor het ontwikkelen van efficiënte, effectieve en kwalitatieve data-gedreven zorg.
2. Terminologie: gestandaardiseerde klinische uitdrukkingen voor registratie en uitwisseling
Een terminologie is in essentie een systematische verzameling van concepten en hun benamingen/termen, inclusief definities en (vaak) relaties tussen concepten. In de terminologieleer wordt terminologiewerk omschreven als het expliciteren van de verbanden tussen objecten, concepten, definities en benamingen; de “terminologie” van een domein bestaat uit de set van concepten en designaties die bij dat domein horen.
In de gezondheidszorg betekent dit in de regel: een terminologie biedt een klinisch bruikbare woordenschat om gegevens in het EPD op een gestandaardiseerde manier vast te leggen (bijvoorbeeld klachten, bevindingen, diagnoses, procedures, allergieën), zodanig dat computers deze eenduidig kunnen opslaan en uitwisselen. SNOMED International beschrijft SNOMED CT bijvoorbeeld als een set van klinische betekenissen (“concepts”) met unieke, machine-leesbare identifiers.
Kenmerkend voor terminologieën in de gezondheidszorg
- Primair doel: klinische registratie en semantische interoperabiliteit (zelfde code = zelfde bedoelde klinische betekenis).
- Vaak hoge granulariteit en rijk aan synoniemen/taalvarianten (bruikbaar in het zorgproces).
- Relaties kunnen aanwezig zijn, maar zijn doorgaans gericht op klinische bruikbaarheid en consistente codering.
3. Ontologie: formele domeinmodellering voor logische consistentie en inferentie
Een ontologie is klassiek gedefinieerd als een “formal, explicit specification of a conceptualization”: een expliciete en formele specificatie van de relevante concepten en relaties in een domein. In de informatica en biomedische kennisrepresentatie impliceert “formeel” doorgaans dat de inhoud in een logische taal kan worden uitgedrukt, zodat automatische redenering (reasoning) mogelijk is (bijv. classificatie, consistentiechecks, inferenties). In een NCBI-publicatie wordt dezelfde kerndefinitie aangehaald in de context van classificaties/kennisstructuren.
Kenmerkend voor ontologieën
- Primair doel: computationale semantiek (formeel gedefinieerde relaties, axioma’s, beperkingen).
- Ondersteunt: consistentiecontrole, automatische subsumptie, inferentie (bijv. afleiden dat “bacteriële pneumonie” een “infectieuze longziekte” is op basis van definities).
- Ontwerpprincipes richten zich op logische helderheid en herleidbare definities, niet enkel op registratiegemak.
4. Classificatie: aggregatie-instrument voor statistiek, beleid en bekostiging
Een classificatie groepeert medische fenomenen in categorieën met het oog op rapportering, statistiek, planning en vergelijkbaarheid. De WHO beschrijft ICD als een systeem dat wereldwijd breed wordt gebruikt en “kritische kennis” levert over omvang, oorzaken en consequenties van ziekte en sterfte, via data die met WHO ICD wordt gecodeerd. Voor WHO ICD-11 wordt bovendien expliciet gesteld dat het “de globale standaard” is voor diagnostische gezondheidsinformatie.
In de praktijk streven classificaties naar categorieën die geschikt zijn voor tellingen en vergelijkingen (mortaliteit/morbiditeit, kwaliteitsindicatoren, financiering). Een nationale beheerorganisatie (NHS England) vat het praktisch samen door te stellen dat terminologieën en classificaties beide codestelsels zijn, maar met verschillende gebruiksdoelen, waaronder zorgverlening, statistische analyse, onderzoek en vergoeding.
Kenmerkend voor classificaties
- Primair doel: statistische en bestuurlijke bruikbaarheid (trends, benchmarking, bekostiging).
- Minder granulariteit dan klinische terminologieën; categorieën zijn vaak “samenvattend”.
- Ontwerp bevat vaak residuele rubrieken (“other/unspecified”) om exhaustieve telling mogelijk te maken.
5. Samenvattend onderscheid (conceptueel)
Hoewel alle drie “over begrippen gaan”, verschillen ze in kernfunctie:
- Terminologie: klinische vastlegging en eenduidige communicatie (wat is er precies bij deze patiënt genoteerd?).
- Ontologie: formeel kennismodel (wat betekenen begrippen precies en welke logische gevolgen heeft dat?).
- Classificatie: aggregatie en verantwoording (hoe tellen, vergelijken en rapporteren we consequent?).
Het is nuttig ze te zien als complementair: terminologieën maximaliseren klinische expressiviteit; classificaties maximaliseren vergelijkbaarheid; ontologieën maximaliseren formele controleerbaarheid en redeneercapaciteit.
6. Is SNOMED CT een terminologie of een ontologie?
SNOMED CT is primair een klinische terminologie, zoals SNOMED International het positioneert (“clinical terminology”) met unieke conceptidentifiers.
Tegelijkertijd heeft SNOMED CT duidelijke ontologische kenmerken. In de SNOMED CT documentatie wordt gesteld dat het conceptmodel definieert hoe concepten worden gespecificeerd met een combinatie van formele logica en redactionele regels, inclusief toegestane relatie-typen per hiërarchietak. Bovendien bestaan er representaties waarin SNOMED CT als ontologie wordt aangeboden/benut (bijv. via BioPortal, waar expliciet wordt aangegeven dat het conceptmodel met axioma’s is geïmplementeerd).
Concluderend: SNOMED CT is het best te beschrijven als een klinische terminologie met een ontologische (formeel-logische) fundering. In implementaties kan het ook als ontologie worden ingezet, maar het primaire ontwerpdoel blijft grootschalige klinische codering en interoperabiliteit.
7. Rol in efficiënte, effectieve en kwalitatieve data-gedreven geneeskunde
7.1 Terminologie: “registreren wat er werkelijk gebeurt op de werkvloer”
Een terminologie levert de basis voor gestructureerde klinische documentatie: uniforme codes voor klinische betekenissen reduceren ambiguïteit en maken gegevens herbruikbaar voor:
- interoperabiliteit tussen EPD’s en ketens (zelfde betekenis overdraagbaar),
- primaire ondersteuning van het zorgproces op de werkvloer met klinische decision support (regels op codes i.p.v. vrije tekst),
- secundair gebruik (cohorten, uitkomstmeting, AI-feature engineering) mits (primair) consistent gecodeerd.
Dat vertaalt zich direct in efficiëntie (minder hercodering/vertaling), effectiviteit (betere informatiecontinuïteit) en kwaliteit (minder interpretatieverschil).
7.2 Ontologie: “begrijpen, controleren en afleiden”
Ontologieën dragen vooral bij waar data-gedreven geneeskunde verder gaat dan registreren en tellen, namelijk naar kennis-gedreven integratie en redenering:
- Datakwaliteit en consistentie: logische constraints kunnen inconsequente combinaties detecteren.
- Semantische integratie: verschillende databronnen (lab, beeldvorming, kliniek) kunnen via gedeelde relaties/axioma’s coherenter worden gekoppeld.
- Inferentie en fenotypering: afleiden van hogere-orde categorieën uit fijnmazige gegevens (bijv. alle patiënten met concepten die subsumeren onder “chronische nierziekte”).
De “formeel-logische” component die SNOMED CT in zijn conceptmodel beschrijft, is precies het soort mechanisme dat deze functies ondersteunt.
7.3 Classificatie: “vergelijken, sturen en verantwoorden”
Classificaties zoals WHO ICD (ICD-10-CM/ICD-10-PCS) ondersteunen data-gedreven geneeskunde vooral op populatie- en systeemniveau:
- epidemiologie en surveillance (trends in ziekte en sterfte),
- benchmarking en kwaliteitsindicatoren,
- beleid en resource-allocatie,
- vaak ook bekostiging en contractering (afhankelijk van het gezondheidszorgstelsel).
Dat sluit aan bij de WHO-positionering van WHO ICD als basis voor wereldwijde gezondheidsinformatie en statistiek.
7.4 Waarom je doorgaans alle drie nodig hebt
In volwassen data-ecosystemen worden terminologie en classificatie vaak gekoppeld via mappings: klinische registratie in een terminologie (rijk en precies) en rapportering/financiering via classificaties (stabiel en vergelijkbaar). De ontologische laag (soms ingebed in de terminologie, soms apart) ondersteunt daarbij consistentie en geavanceerde analyse.
8. Tot slot
Terminologie, ontologie en classificatie zijn geen concurrerende, maar aanvullende bouwstenen voor data-gedreven geneeskunde. Terminologieën maken klinische data eenduidig vastlegbaar en uitwisselbaar; ontologieën maken die betekenissen formeel hanteerbaar voor kwaliteitscontrole en inferentie; classificaties maken data bestuurbaar en vergelijkbaar op populatieniveau. SNOMED CT is primair een klinische terminologie, maar door zijn conceptmodel en formeel-logische representatie bezit het een duidelijke ontologische dimensie.
Bronnen (selectie)
ISO. ISO 704:2022 - Terminology work - Principles and methods (ISO-catalogus).
Gruber, T. Definition of Ontology.
FOD Volksgezondheid, Terminologie & standaarden, de weg naar informatiegestuurde zorg
SNOMED International. What is SNOMED CT.
SNOMED International (docs). SNOMED CT Concept Model (Practical Guides).
WHO. International Classification of Diseases (ICD): Classification of Diseases (toepassing en doel).
WHO. ICD-11 home (positionering als globale standaard voor diagnostische informatie).
NHS England. Terminology and Classifications (praktisch onderscheid en toepassingen).
NCBO BioPortal. SNOMED CT ontology entry (ontologische implementatie/axiomatisering).