Enkele aspecten van logica bij de ontwikkeling van klinische richtlijnen

Inleiding

Klinische richtlijnen zijn een van de belangrijkste vehikels waarmee evidence-based medicine (EBM) wordt vertaald naar de dagelijkse praktijk. Tegelijkertijd laten evaluaties van richtlijnen zien dat de kwaliteit van het onderliggende redeneren en de logica waarmee van bewijs naar aanbeveling wordt gegaan, sterk kan variëren. Hier wil ik onder andere enkele mogelijke logische fouten in klinische richtlijnen bekijken, de onderliggende oorzaken daarvan en aandachtspunten om zulke fouten systematisch te voorkomen.

Met dank aan de lessen filosofie aan de Universiteit Antwerpen (UA).

1. Enkele mogelijke logische fouten in klinische richtlijnen

1.1 Fouten in de omgang met empirisch bewijs

a. Afwezigheid van bewijs verwarren met bewijs van afwezigheid

Een terugkerende fout is de redenering dat, omdat er geen (of weinig) gerandomiseerde trials bestaan, een interventie dus niet effectief is, of omgekeerd: dat het uitblijven van bewijs voor schade gelijkstaat aan veiligheid. Methodologische handboeken benadrukken dat “no evidence of effect” niet mag worden gelijkgesteld aan “evidence of no effect”; onzekerheid vereist een expliciete, voorzichtige formulering van aanbevelingen.

b. Niet-systematisch selecteren van literatuur (cherry picking)

Lunny et al. toonden in een methodestudie van vijftig recente richtlijnen aan dat slechts 34% systematische methoden gebruikte om bewijs te verzamelen en te synthetiseren; de meerderheid baseerde aanbevelingen op niet-systematische reviews of narratieve overzichten. Niet-systematisch zoeken en selecteren maakt de redenering inherent kwetsbaar voor selectiebias: studies met gunstige uitkomsten worden oververtegenwoordigd, terwijl ongunstige of neutrale studies verdwijnen uit het bewijskader. Dat leidt tot een impliciete, maar logische fout: de representativiteit van de geselecteerde literatuur wordt stilzwijgend verondersteld, terwijl ze die vaak niet heeft.

c. Surrogaatuitkomsten gelijkstellen aan patiëntrelevante uitkomsten

Een tweede denkfout is de impliciete aanname dat verbetering van een surrogaat (bijvoorbeeld bloeddruk, tumorrespons, biomarkers) automatisch leidt tot betere klinische uitkomsten (mortaliteit, kwaliteit van leven). Systematische methodologische analyses beschrijven dit expliciet als een “pitfall”: het causale pad tussen surrogaat en harde uitkomst is vaak onzeker en contextafhankelijk. Richtlijnen die sterke aanbevelingen baseren op surrogaten zonder deze onzekerheid te benoemen, plegen feitelijk een vorm van non sequitur: de conclusie (klinisch voordeel) volgt logisch niet noodzakelijk uit de premisse (verbeterd surrogaat).

Een non sequitur is een Latijnse uitdrukking die "het volgt er niet uit" betekent. Het wordt gebruikt om een onlogische conclusie te beschrijven die niet logisch volgt uit de voorafgaande uitspraken of argumenten.

d. Associatie verwarren met causaliteit

Observational studies worden in richtlijnen soms behandeld alsof ze causale zekerheid bieden, zonder adequate discussie van confounding en bias. Het GRADE-handboek benadrukt juist dat indirectheid, confounding en andere beperkingen tot downgraden van de bewijskwaliteit moeten leiden. Waar richtlijnen deze stap overslaan en associaties uit cohort- of case-controlstudies presenteren als hard bewijs voor effectiviteit of schade, is sprake van een causale denkfout: post hoc ergo propter hoc of cum hoc ergo propter hoc.

Observationele studies zijn een type onderzoek dat gebruikt wordt om real-world evidence (RWE) te genereren, wat bewijs is dat voortkomt uit de analyse van real-world data (RWD) buiten gecontroleerde klinische trials. Het fundamentele verschil is dat bij observationeel onderzoek de behandelingen worden voorgeschreven volgens de normale klinische praktijk en niet volgens een specifiek protocol; de onderzoeker observeert in plaats van in te grijpen. 

Post hoc ergo propter hoc is een Latijnse uitdrukking die "na dit, dus vanwege dit" betekent, en het beschrijft een drogreden waarbij ten onrechte wordt aangenomen dat een gebeurtenis de oorzaak is van een andere gebeurtenis, simpelweg omdat deze daar tijdelijk op volgde.

Cum hoc ergo propter hoc is een drogreden waarbij wordt aangenomen dat als twee gebeurtenissen tegelijkertijd optreden, de ene gebeurtenis de oorzaak is van de andere. Dit Latijnse gezegde betekent "met dit, dus vanwege dit".

e. Onterechte sterkte van aanbevelingen bij lage bewijskwaliteit

Grading of Recommendations, Assessment, Development and Evaluation (GRADE) maakt een strikt onderscheid tussen zekerheid van bewijs en sterkte van aanbevelingen. Desondanks tonen evaluaties dat richtlijnen regelmatig sterke aanbevelingen doen op basis van laag of zeer laag zekerheidsniveau, zónder duidelijke rechtvaardiging (bijv. overweldigende klinische urgentie). Dat is een logische incongruentie: het redeneren van “we weten weinig” naar “dus we zijn sterk overtuigd wat te doen is” vereist extra, expliciet gemaakte premissen; blijven die impliciet, dan is de argumentatie inconsistent.

1.2 Fouten rond waarden, voorkeuren en context

a. Veronderstelde uniformiteit van patiëntvoorkeuren

Veel richtlijnen formuleren generieke aanbevelingen zonder systematisch uiteen te zetten hoe patiënten de relevante uitkomsten (bijvoorbeeld overleving vs. bijwerkingen, autonomie vs. veiligheid) waarderen. GRADE benadrukt dat variatie in waarden en voorkeuren juist een kerncriterium is bij de sterkte van aanbevelingen. Wanneer richtlijncommissies impliciet aannemen dat “de gemiddelde patiënt” een bepaalde trade-off prefereert, terwijl empirische gegevens het tegendeel laten zien, ontstaat een vorm van overgeneralisatie: uit een beperkt of anekdotisch perspectief wordt een veralgemeende norm afgeleid.

b. Negeren van context en middelen

Aanbevelingen worden soms gepresenteerd alsof ze contextloos geldig zijn, terwijl kosten, beschikbaarheid, implementatiebarrières en gezondheidsongelijkheid cruciale rol spelen. Studies over richtlijnontwikkeling tonen dat het betrekken van gezondheids-economen en beleidsmakers vaak tekortschiet, ondanks consensus dat dit essentieel is. Hierdoor ontstaat een impliciete ceteris paribus-aanname (“alles is verder gelijk”), die in de praktijk niet houdbaar is.

De ceteris paribus-aanname is een Latijnse uitdrukking die "onder overigens gelijke omstandigheden" betekent. Het wordt gebruikt om te analyseren wat het effect is van één factor op een ander, door alle andere invloeden constant te houden. 

1.3 Autoriteitsdenken, consensusbias en expert opinion

a. Argumentum ad verecundiam (beroep op autoriteit)

Schünemann et al. laten zien dat experts tijdens richtlijnvergaderingen vaak opinies inbrengen die niet duidelijk zijn onderbouwd met systematisch verzamelde gegevens; men verwart dan expert opinion met expert evidence. Wanneer panelleden aanbevelingen accepteren omdat een “autoriteit” ze uitspreekt, zonder de onderliggende gegevens expliciet te maken, is sprake van een klassiek argument-van-autoriteit.

Argumentum ad verecundiam is een drogreden waarbij een bewering wordt ondersteund door te verwijzen naar een autoriteit of expert, in plaats van de argumenten zelf te onderzoeken. Dit wordt ook wel 'onjuist beroep op autoriteit' genoemd en kan onjuist zijn omdat de autoriteit niet relevant is voor het onderwerp, of omdat er wordt gedaan alsof de uitspraak van de autoriteit automatisch juist is

b. Groepsdenken en sociale conformiteit

Scoping reviews van richtlijnprocessen beschrijven de besluitvorming uitdrukkelijk als een sociaal proces, waarin hiërarchie, dominantie van bepaalde disciplines en groepsnormen een rol spelen. Panelleden passen hun oordeel soms aan de groepsconsensus aan, ook wanneer het empirische bewijs dat niet rechtvaardigt. Dit leidt tot groupthink: kritische tegenargumenten verdwijnen uit de discussie, waardoor de logische toetsing van de argumentatie verarmt.

1.4 Belangenverstrengeling en rationalisatie

Systematische reviews tonen een hoge prevalentie van financiële relaties tussen richtlijnauteurs en de (farmaceutische) industrie: in diverse cohorten had 56–87% van de auteurs ten minste één financieel conflict of interest (COI), terwijl richtlijnen dit vaak niet of onvolledig rapporteerden. Belangenverstrengeling is op zichzelf geen logische fout, maar creëert een krachtige motivated reasoning: men is wel eens geneigd bewijs te interpreteren in de richting van het eigen secundaire belang. Dat uit zich onder meer in:

  • een selectieve weging van studies (gunstige data worden zwaarder geteld dan ongunstige);
  • het systematisch onderschatten van schadelijke effecten;
  • het formuleren van sterkere aanbevelingen dan de bewijskracht rechtvaardigt.

Deze patronen weerspiegelen cognitieve biases zoals confirmation bias en overconfidence, die tot systematische redeneringsfouten leiden.

2. Onderliggende oorzaken van logische fouten

2.1 Cognitieve biases van individuele experts

Literatuur over klinische besluitvorming laat zien dat tot een aanzienlijk deel van medische fouten terug te voeren is op cognitief bepaalde denkfouten: availability bias, anchoring, confirmation bias, overconfidence, base-rate neglect, enzovoort. Richtlijnauteurs en panelleden zijn niet immuun voor deze mechanismen; integendeel, hun expertise en ervaring kunnen een vals gevoel van zekerheid creëren.

Enkele relevante biases in de context van richtlijnontwikkeling zijn:

  • Confirmation bias: men zoekt en interpreteert bewijs dat bestaande overtuigingen ondersteunt (bijvoorbeeld de vermeende superioriteit van een vertrouwd geneesmiddel).
  • Anchoring: men laat zich te sterk beïnvloeden door de eerste informatie die men ontvangt (het "anker") bij het nemen van beslissingen. 
  • Overconfidence bias: overschatting van eigen beoordelingsvermogen, waardoor men systematische methoden (risk-of-bias-beoordeling, GRADE-tabellen) als overbodig ervaart.
  • Status-quo- en actie-bias: de neiging om bestaande praktijk of actieve interventie te prefereren (“liever iets doen dan niets”), wat leidt tot aanbevelingen die niet proportioneel zijn aan de bewijskracht.

2.2 Methodologische en structurele tekortkomingen

Lunny et al. tonen dat een meerderheid van onderzochte richtlijnen geen volwaardige systematische review als basis gebruikte. Andere analyses met het Appraisal of Guidelines for Research and Evaluation (AGREE) II-instrument laten zien dat ongeveer een derde van honderden richtlijnen laag scoort op de domeinen “rigor of development” en “editorial independence”. Dit wijst op structurele tekortkomingen:

  • gebrek aan methodologische ondersteuning;
  • beperkte middelen of tijd voor systematische reviews;
  • afwezigheid van expliciete procedures voor evidence-to-decision.

Deze tekortkomingen creëren een context waarin intuïtief redeneren en pragmatiek de systematische, logische analyse van bewijs vervangen.

2.3 Institutionele belangen en governance

De systematische review van Norris et al. laat zien dat richtlijnen vaak worden gefinancierd door beroepsverenigingen of andere belanghebbende organisaties, en dat COI-beleid onvolledig is of ontbreekt. Dit vergroot de kans dat:

  •  de keuze van onderwerpen en vragen al gestuurd is door belangen;
  •  panelleden met sterke intellectuele of financiële belangen dominante posities innemen;
  •  kritische geluiden minder ruimte krijgen.

De resulterende redeneringen zijn dan niet primair logisch-wetenschappelijk, maar (mede) strategisch: men zoekt rationele rechtvaardigingen voor vooraf impliciet gewenste uitkomsten.

2.4 Sociale dynamiek van richtlijnpanels

Scoping reviews over richtlijnontwikkeling beschrijven hoe richtlijnprocessen zowel technisch (systematische review, GRADE) als sociaal (vergaderen, onderhandelen, consensus) zijn. In groepsdiscussies spelen statushiërarchieën, beroepsidentiteit en interpersoonlijke verhoudingen een rol. Experts kunnen geneigd zijn om hun standpunt niet bij te stellen, zelfs wanneer het bewijs anders suggereert (anchoring), en minder ervaren leden kunnen zich conformeren aan de dominante mening (conformity bias). Dit alles vergroot de kans dat logische tegenargumenten niet volledig worden uitgewerkt of serieus gewogen.

3. Aandachtspunten om logische fouten te voorkomen

Het voorkomen van logische fouten in richtlijnen vraagt om een combinatie van methodologische waarborgen, goed ontworpen processen en expliciete aandacht voor cognitieve en institutionele bias.

3.1 Gebruik van robuuste kwaliteitskaders (AGREE II)

Het AGREE II-instrument biedt een gestructureerd kader om de methodologische kwaliteit van richtlijnen te beoordelen, met specifieke items over systematische zoekstrategieën, transparante selectiecriteria, expliciete koppeling tussen aanbevelingen en bewijs, en editorial independence (inclusief COI-beheer). Integratie van AGREE II-principes in het ontwikkelproces zelf – niet alleen achteraf bij beoordeling – dwingt richtlijncommissies om hun redenering expliciet te maken:

  • elke aanbeveling moet herleidbaar zijn tot gespecificeerd bewijs;
  • de sterkte van aanbevelingen moet consistent zijn met de gerapporteerde bewijskwaliteit;
  • COI moeten worden vastgelegd en zichtbaar gemanaged.

Door deze transparantie wordt het lastiger om logisch incoherente of door belangen gekleurde conclusies te verbergen in impliciete redeneringsstappen.

3.2 Systematische omgang met bewijs (GRADE en systematische reviews)

Het GRADE-systeem biedt een expliciete structuur voor het beoordelen van de kwaliteit van bewijs (risk of bias, inconsistentie, indirectheid, imprecisie, publicatiebias) en voor het vertalen van bewijs naar aanbevelingen, inclusief waarden en voorkeuren, middelen, haalbaarheid en acceptatie. Belangrijke aandachtspunten zijn:

  • Verplichte systematische reviews als basis voor belangrijke aanbevelingen, conform internationale standaarden.
  • Strikte scheiding tussen zekerheid van bewijs en sterkte van aanbeveling; sterke aanbevelingen bij lage zekerheid moeten expliciet en overtuigend worden gemotiveerd.
  • Kritische beoordeling van surrogaatuitkomsten en indirect bewijs; onzekerheid over de vertaling naar patiëntrelevante uitkomsten moet duidelijk worden benoemd.

Door GRADE strikt toe te passen, worden redeneringsstappen die anders impliciet blijven (bijvoorbeeld over waarden, onzekerheid, causaliteit) expliciet gemaakt en vatbaar voor logische toetsing.

3.3 Samenstelling en werkwijze van richtlijnpanels

De scoping review van De Leo et al. laat zien dat internationale consensus bestaat over het belang van multidisciplinaire, gebalanceerde werkgroepen met vertegenwoordiging van klinische disciplines, methodologen, patiënten en relevante stakeholders. Cruciale aandachtspunten zijn:

  • Diversiteit van perspectieven om groepsdenken en disciplinaire tunnelvisie te beperken.
  • Formele besluitvormingsprocedures (bijv. gestructureerde consensusmethoden) die ruimte geven aan afwijkende meningen en expliciete documentatie van minderheidsstandpunten.
  • Vroegtijdige betrokkenheid van patiënten om impliciete aannames over waarden en voorkeuren te corrigeren.

Door het deliberatieproces te structureren, wordt de kans kleiner dat autoriteit, hiërarchie of sociale druk de logica van de argumentatie overschaduwt.

3.4 Strikt beleid voor belangenconflicten

Op basis van de bevindingen van Norris et al. en andere analyses is een proactief COI-beleid essentieel. Belangrijke elementen zijn:

  • systematische inventarisatie en openbaarmaking van zowel financiële als intellectuele COI;
  • beperking van dominante rollen (voorzitter, penvoerder) voor leden met relevante COI;
  • documentatie van beslissingen over hoe COI zijn meegewogen bij de interpretatie van bewijs.

Transparant COI-beheer vermindert de kans dat belangenverstrengeling via subtiele, niet-herkende redeneringsfouten (motivated reasoning) doorwerkt in aanbevelingen.

Motivated reasoning is een cognitief proces waarbij iemands verlangens en overtuigingen de manier waarop hij of zij informatie interpreteert, beïnvloeden, waardoor informatie wordt gebruikt om een bestaande conclusie te ondersteunen in plaats van de waarheid te ontdekken.

3.5 Scholing in logisch en kritisch redeneren

De literatuur over cognitieve bias benadrukt dat louter “bewustwording” van bias onvoldoende is; debiasing vraagt oefening in gestructureerd, langzaam denken (type-2 denken), het gebruik van checklists en het expliciet doorlopen van alternatieve hypothesen. Voor richtlijnontwikkeling betekent dit onder meer:

  • training van panelleden in basisprincipes van logica, argumentatieleer en "evidentiële" redenering (Evidence-Based Practice (EBP));
  • gebruik van gestandaardiseerde evidence-to-decision-formulieren, waarin premissen, inferentiestappen en conclusies expliciet worden genoteerd;
  • stimulering van een cultuur waarin het normaal is om redeneringen van collega’s expliciet te bevragen en tegenvoorbeelden aan te dragen.

Door zulke meta-cognitieve vaardigheden te verankeren in het richtlijnproces wordt de kans kleiner dat impliciete logische fouten onopgemerkt blijven.

Tot slot

Logische fouten in klinische richtlijnen ontstaan zelden door pure onkunde in formele logica; ze zijn meestal het product van een samenspel van cognitieve bias, methodologische tekortkomingen, institutionele belangen en sociale dynamiek. Deze factoren leiden tot denkfouten in de omgang met bewijs (associatie vs. causaliteit, surrogaten, selectieve literatuur), in de veronderstelling van waarden en context, en in de manier waarop autoriteit en consensus het oordeel van richtlijnpanels sturen.

Preventie van dergelijke fouten vergt een geïntegreerde aanpak: robuuste methodologische kaders (AGREE II, GRADE), verplichte systematische reviews, zorgvuldig samengestelde en transparant opererende panels, streng COI-beleid en expliciete scholing in kritisch en logisch redeneren. Waar deze voorwaarden vervuld zijn, wordt de redenering achter aanbevelingen zichtbaar, toetsbaar en corrigeerbaar – en neemt de kans toe dat klinische richtlijnen werkelijk de best mogelijke, rationeel verantwoorde basis voor kwalitatieve patiëntenzorg door zorgverleners vormen.

Gebruikte bronnen (selectie)

  1. Lunny C, et al. Over half of clinical practice guidelines use non-systematic methods to inform recommendations: A methods study. PLoS One. 2021;16(4):e0250356.
  2. Norris SL, et al. Conflict of interest in clinical practice guideline development: A systematic review. PLoS One. 2011;6(10):e25153.
  3. Brouwers MC, et al. AGREE II: Advancing guideline development, reporting and evaluation in healthcare. CMAJ. 2010;182(18):E839-E842; zie ook AGREE II-instrument.
  4. Schünemann H, et al. GRADE handbook for grading the quality of evidence and the strength of recommendations using the GRADE approach. 2013.
  5. Guyatt GH, et al. GRADE guidelines: A new series of articles in the Journal of Clinical Epidemiology. J Clin Epidemiol. 2011;64:380-382.
  6. Leonardi-Bee J. Common methodological pitfalls and new developments in systematic review and meta-analyses. Br J Dermatol. 2019.
  7. De Leo A, et al. Approaches to clinical guideline development in healthcare: a scoping review and document analysis. BMC Health Serv Res. 2022;22:1439.
  8. Schünemann HJ, et al. Distinguishing opinion from evidence in guidelines. BMJ. 2019;366:l4606.
  9. O’Sullivan ED, Schofield SJ. Cognitive bias in clinical medicine. J R Coll Physicians Edinb. 2018;48(3):225-232.
  10. Bowes SM, Ammirati R. Cognitive biases, heuristics, and logical fallacies in clinical practice. Med Sci Educ. 2020
  11. Rosenfeld RM, et al. Clinical Practice Guideline Development Manual, Third Edition: A quality-driven approach for translating evidence into action. Otolaryngol Head Neck Surg. 2013;148(1 Suppl):S1-55.
  12. Granholm A, et al. GRADE pearls and pitfalls – Part 2: Clinical practice guidelines. Acta Anaesthesiol Scand. 2024.


Popular posts from this blog

Het Budget Financiële Middelen (BFM) budgettair type A (Acuut)

Belgische S2-centra voor acute beroertezorg met invasieve procedures

Hervorming van de Belgische ziekenhuisfinanciering - struikelblokken & mogelijke hervormingsscenario's en hun voor- en nadelen