In de jaren 70 van de vorige eeuw ergerden de arts-epidemiologen Sackett en Fletcher zich aan het gedrag van hun collegae in de Canadian Task Force For The Periodic Health Examination. Die breed samengestelde werkgroep moest voor 128 aandoeningen aangeven hoe die effectief voorkómen konden worden, en dat op basis van de stand van wetenschap.1 Tot irritatie van Sackett deden sommigen van de deelnemers voornamelijk een beroep op de eigen ervaring, terwijl anderen de noodzaak voelden tot het plaatsen van kritische kanttekeningen bij onderzoek met minder welgevallige resultaten. Om de discussies te structureren stelden Sackett en Fletcher daarom voor om het uitgevoerde onderzoek te ordenen volgens bepaalde niveaus, op basis van het type onderzoeksopzet. Daarbij kwam goed uitgevoerd, gerandomiseerd vergelijkend onderzoek (‘randomized clinical trial’ (RCT)) bovenaan te staan, boven een kleine RCT met niet-significante resultaten, en dat weer boven niet-gerandomiseerd vergelijkend onderzoek en beschrijvingen van individuele gevallen.2 ‘Als…
Bestaat ‘passend’ bewijs?
The ‘levels of evidence’ system, which dates back to the 1980s, ranks studies based on the strength of the corresponding study design. Level sets have been developed for studies of interventions, for test accuracy research, and many other forms of clinical research. For some authors, practicing evidence-based medicine has become identical to assigning levels of evidence. This is unfortunate, because more modern systems to come out of the evidence-based medicine movement, such as GRADE, distinguish between the credibility of evidence (which is not just affected by the selected design), the magnitude of the effect, and the applicability of the findings to the clinical question at hand.
A new system – “fitting evidence” – has recently been developed by the Dutch Health Care Insurance Board, to evaluate evidence for reimbursement decisions. That system, with an 18-item checklist, looks at threats to the internal validity of studies as well as to the feasibility of randomized comparisons, to see whether it is “fitting” to design a randomized trial. It is unclear yet how these evaluations can and should be combined in the appraisal of the strength of the existing evidence.
Conflict of interest: none declared. Financial support: none declared.
Bestaat passend bewijs?
Het CEG; “Over het ontbreken van bewijsmateriaal kan (…) gedifferentieerd worden gedacht. Soms moet onderzoek naar ‘hard’ bewijsmateriaal worden gestimuleerd, soms moet minder hard bewijsmateriaal geaccepteerd worden als het best haalbare, en soms moeten andere criteria geaccepteerd worden dan bewijsbare effectiviteit. Een oplossing is dan om na te gaan wat voor verschillende zorgvormen en –activiteiten een passende vorm van bewijs zou zijn”.[1] Wij lezen hierin wel degelijk een pleidooi voor nuancering bij effectiviteitsbeoordelingen en een passendbewijs-instrument.
Er zijn in principe twee mogelijke verklaringen wanneer het vigerende bewijs voor een interventie niet het ‘hardste’ bewijs omvat; óf de bewijsvoering is onvolgroeid en hardere vormen van bewijs zijn nog mogelijk, óf de bewijsvoering is wél volgroeid maar om redenen omvat het geen harde(re) vormen van bewijs.
Dit onderscheid is voor de besluitvorming van het CVZ cruciaal. De passendbewijs-vragenlijst stelt a.h.w. een maximaal groeiprofiel op waartegen vervolgens het vigerende bewijs wordt gehouden. Wanneer onvolgroeidheid blijkt (RCT’s zijn bijvoorbeeld nog mogelijk), dan neemt het CVZ dit als contra-argument mee bij zijn besluit. Wanneer het vigerende bewijs daarentegen wél volgroeid is maar slechts ‘zacht’ bewijs omvat, dan accepteert het CVZ deze 'zachtheid' en besluit op grond hiervan. De onderzoeksresultaten veranderen hierdoor niet noch hun geloofwaardigheid, dit wordt ook niet be(t)oogd.
Waar de passend-bewijsvragenlijst zich richt op wenselijk en haalbaar bewijs en de contouren hiervan schetst voorafgaand aan de beoordeling van het vigerende bewijs, richt GRADE zich direct op het vigerend bewijs. Het CVZ bevindt zich in de overgangsfase naar GRADE en ziet de argumenten die naar voren komen uit de passend-bewijsvragenlijst vooralsnog als een aanvulling op de argumenten die meespelen in de aanbevelingsfase van GRADE.
We delen Bossuyt & Besselink’s zorgen dat EBM tegenwoordig vaak gelijkgesteld wordt aan niveaus van onderbouwing. Onze passend-bewijsvragenlijst toont op zichzelf al aan dat wij EBM niet gelijkstellen aan niveaus van onderbouwing alleen. Ook ons beoordelingskader (CVZ, 2007) geeft expliciet aan dat wij bij het beoordelen van de literatuur ook andere argumenten meewegen zoals de grootte van een effect.
De passendbewijs-vragenlijst is het resultaat van onze leerervaring met een weerbarstige praktijk. Mogelijk is deze leerervaring er ook debet aan dat wij andere punten opmaken uit het rapport van het CEG over passend bewijs dan Bossuyt en Besselink. We zien daarom uit naar de discussies met de heer Bossuyt nu hij recentelijk is aangesteld als voorzitter van onze wetenschappelijke adviesraad.
Juanita M. Heymans, Sarah Kleijnen en Ilse M. Verstijnen
[1] Raad voor de Volksgezondheid en Zorg. Passend bewijs. Ethische vragen
bij het gebruik van evidence in het zorgbeleid. Signalering ethiek en
gezondheid 2007/4. Den Haag: Centrum voor Ethiek en Gezondheid (CEG);
2007