De meest gebruikte methode om patiëntveiligheid te kwantificeren is dossieronderzoek. Hierbij worden patiëntendossiers retrospectief beoordeeld op aanwijzingen voor vermijdbare schade. Onderzoek suggereert dat deze ‘gouden standaard’ – mits aan bepaalde voorwaarden wordt voldaan – matig tot redelijk betrouwbaar is in het identificeren van zorggerelateerde schade (‘adverse events’).
Elders in dit tijdschrift beschrijven Hanskamp-Sebregts et al. de resultaten van hun systematische literatuuronderzoek naar de betrouwbaarheid en validiteit van deze methode.1 Zij vonden een kappawaarde voor de interbeoordelaarsbetrouwbaarheid van ongeveer 0,6. Maar, stellen de auteurs, zelfs als de interbeoordelaarsvariatie acceptabel zou zijn, blijkt uit geen enkel onderzoek dat de uitkomsten van dossieronderzoek een realistisch beeld geven van het optreden van zorggerelateerde schade. De auteurs noemen dit ‘zorgwekkend’ en roepen op tot meer onderzoek om de betrouwbaarheid van dossieronderzoek te vergroten.1
Deze conclusies – ja, zelfs de hele opzet van het reviewonderzoek – tonen mijns inziens een diepgewortelde misvatting. Ten onrechte…
De onderzoeksvraag bepaalt de te gebruiken methode
Graag geven wij puntsgewijs commentaar op het commentaar van Leistikow bij ions artikel over dossieronderzoek.
1) De onderliggende wetenschappelijke filosofie is logisch positivisme.
Inderdaad berust dossieronderzoek op premissen van het logisch positivisme: een diagnostische methode om patiëntveiligheid te kwantificeren. Immers zo worden landen op veiligheidsgebied vergeleken (Vincent, 2010) en zo is gekeken of interventies de zorggerelateerde schade deed afnemen (de Bruijne, 2004). Een nadeel dat Leistikow beschrijft (beoordeling is geen wiskunde, er is geen reproduceerbare werkelijkheid) is gekwantificeerd in de inter-beoordelaars variabiliteit.
Dit 'meten is weten' -principe is inderdaad iets anders dan het in constructivistische dialoog begrijpen van onveiligheid ('heeft zijn fundamenten in het sociaal constructivisme'): de analyse naar oorzaken en hiervan leren en streven naar preventie. Natuurlijk is dit zinvol. Getallen krijgen pas betekenis na kwalitatieve analyses. Nog sterker: beide vormen hebben elkaar nodig, anders dreigt 'fact-fucking Trumpism' (Williams C, 2017).
2) Dat bewijs alleen geldt binnen het paradigma van de RCT is kortzichtig.
De auteurs maken geen enkele suggestie in de richting van RCT. Er is wel een probleem: wanneer is er voldoende bewijs (en hoe verkregen?) om een interventie verplicht op te leggen (Marshall, 2013) en frustreert onvoldoende onderbouwing kwaliteitsverbetering niet (Wachter, 2013)?
3) Moedig besluit van de Vereniging voor Heelkunde omtrent volume normen.
In het artikel over dossieronderzoek worden kwantitatieve volumenormen nul maal genoemd. De constatering van Leistikow dat de mortaliteitscijfers na pancreaticoduodenectomie halveerden klopt. Of dit een gevolg is van de volumenorm is een kwalitatieve duiding waarvan de analyse ontbreekt.
4) Welke zijn beter: traditionele geneeskunde wetenschapsmethoden of andere vormen zoals gedragswetenschappen?
Beter is het te concluderen dat de vraagstelling van een onderzoek de gebruikte methode bepaald. Wil je de diagnostische waarde van een instrument weten, is een positivistisch kwantitatieve aanpak prima. Wil je het gevondene verklaren, zijn kwalitatieve methoden aangewezen. Deze discussie speelt reeds langer. Zo ontstond rond 1995 de 'Science War' (Nelkin, 1996) tussen natuurwetenschappers en sociale wetenschappers. Laat Comte (1848) en Flyvbjerg (2001) zich met elkaar verzoenen. Het synthetische artikel van Barbara Hanson (2008) is hierbij onze 'mixed method' leidraad. En tot verbazing van velen (Het is alsof je de kwaliteit van de relatie met jou partner wil kwantificeren) kan de relatie met je partner verbeteren door deze 'mixed methods' aanpak te gebruiken (Jain M, 2008): Meet hoe vaak je wat voor elkaar doet en praat daarover...
Huub Wollersheim, Petra J van Gurp, Mirelle Hanskamp-Sebregts