Interpretatie van onderzoek naar volumenormen

Poppetje zit op een rood kruis wat ook een liniaal is en kijkt in het water naar het spiegelbeeld.
Rolf H.H. Groenwold
Arno A.W. Roest
Frits R. Rosendaal
Citeer dit artikel als
Ned Tijdschr Geneeskd. 2024;168:D8275
Abstract
Download PDF

In discussies over centralisatie van zorg staan volumenormen centraal. Wees je bewust van de betekenis van dit begrip en de methodologische onvolkomenheden van onderzoek ernaar. Dat moet de basis zijn voor een bredere discussie.

Samenvatting

Onderzoek naar volumenormen en volume-uitkomstrelaties in de zorg kunnen verstrekkende gevolgen hebben. Aan de hand van een gedachte-experiment worden vijf kernelementen van gedegen onderzoek naar volumenormen geïdentificeerd: variatie in patiëntenaantallen, schaalbaarheid van capaciteit, vergelijkbaarheid in zorgkwaliteit, vergelijkbaarheid van patiëntengroepen en statistische precisie. Voor elk van deze aspecten worden praktische uitdagingen beschreven en hun invloed op de kwaliteit van het onderzoek. Dit wordt geïllustreerd aan de hand van onderzoek naar volume-uitkomstrelaties in de kinderhartchirurgie.

artikel

In discussies over de kwaliteit van specifieke ziekenhuiszorg wordt regelmatig gesproken over volumenormen: het minimale aantal patiënten met een bepaalde aandoening dat in een ziekenhuis behandeld moet worden om ervoor te zorgen dat zorgprofessionals deze patiënten vaak genoeg zien, zodat de kwaliteit van zorg gegarandeerd blijft. Over dit algemene principe bestaat weinig discussie. Het antwoord op de vervolgvraag is echter minder duidelijk. Over wat de volumenorm moet zijn en hoe die bepaald moet worden, zijn de meningen verdeeld. Dat zagen we onlangs tijdens de discussie over de concentratie van de kinderhartchirurgie en bij de lopende gesprekken aan de ‘tafels’ van het Integraal Zorgakkoord over concentratie van oncologische en vaatchirurgische patiëntenzorg.

Aan de hand van een gedachte-experiment identificeren wij vijf kernelementen van gedegen onderzoek naar volumenormen. We illustreren deze elementen aan de hand van onderzoek uit de kinderhartchirurgie.

Onderzoek naar volumenormen: de theorie

De methodologische uitdagingen van een niet-gerandomiseerd onderzoek naar volumenormen, zoals dat in de praktijk wordt uitgevoerd, kent methodologische uitdagingen. Deze worden inzichtelijk als we eerst in gedachten een ideaal onderzoek opzetten naar volumenormen, een onderzoek dat veel weg heeft van een veelarmig gerandomiseerd onderzoek.

In het gedachte-experiment doet een groot aantal vergelijkbare ziekenhuizen mee. Een computeralgoritme bepaalt op basis van toeval hoeveel ingrepen er in elk ziekenhuis zullen worden uitgevoerd in het komende jaar. Op landelijk niveau worden alle patiënten die een bepaalde ingreep moeten ondergaan willekeurig verdeeld over de verschillende ziekenhuizen, zodanig dat elk ziekenhuis het aantal ingrepen krijgt dat door het algoritme is bepaald. In een paar ziekenhuizen worden 50 ingrepen uitgevoerd, in een paar andere ziekenhuizen 60 ingrepen en in weer andere 70. Vervolgens kunnen we de uitkomsten op patiëntniveau afzetten tegen patiëntenaantallen in een ziekenhuis. Idealiter zijn deze ziekenhuizen in alle andere opzichten hetzelfde, zoals apparatuur en kundigheid van het personeel.

Om de uitkomsten van ziekenhuizen met verschillende patiëntenaantallen direct met elkaar te kunnen vergelijken, moet aan de volgende voorwaarden worden voldaan: (a) variatie in patiëntenaantallen; (b) schaalbaarheid van capaciteit; (c) vergelijkbaarheid in zorgkwaliteit; (d) vergelijkbaarheid van patiënten; en (e) statistische precisie.

Variatie in patiëntenaantallen Er kunnen verschillende volumes met elkaar worden vergeleken: 50 ingrepen, 60 ingrepen, 70 ingrepen, etc.

Schaalbaarheid van capaciteit We nemen aan dat elk ziekenhuis ook in staat is om dat aantal ingrepen uit te voeren.

Vergelijkbaarheid in zorgkwaliteit De toewijzing van de patiëntenaantallen aan de verschillende ziekenhuizen wordt bepaald door toeval.

Vergelijkbaarheid van patiënten De toewijzing van de individuele patiënten aan ziekenhuizen wordt bepaald door toeval.

Statistische precisie Er doen voldoende patiënten en ziekenhuizen mee in het onderzoek om nauwkeurige uitspraken te kunnen doen over verschillen in uitkomsten.

We beschouwen deze vijf voorwaarden als de kernelementen van gedegen onderzoek naar volumenormen.

Onderzoek naar volumenormen: de praktijk

In de praktijk wordt noch het aantal ingrepen per ziekenhuis, noch de verdeling van patiënten over ziekenhuizen bepaald door toeval. Dit leidt tot de volgende methodologische uitdagingen.

De bestaande praktijkvariatie in patiëntenaantallen bepaalt welke volumes kunnen worden onderzocht. Wanneer bijvoorbeeld alle ziekenhuizen tussen de 30 en 40 ingrepen per jaar doen, is het niet mogelijk uitspraken te doen over de uitkomsten bij 50, 60 of 70 ingrepen per jaar.

Een ziekenhuis waar relatief weinig ingrepen worden uitgevoerd, zal niet – of nog niet – zijn ingericht om veel meer ingrepen uit te voeren. Hoewel de focus van het onderzoek ligt op het aantal ingrepen, betreft het in feite een vergelijking van organisaties, waarbij het aantal ingrepen slechts één meetbaar onderdeel is van die organisatie.

Welke patiënten in welke ziekenhuizen worden behandeld is niet een kwestie van toeval, waardoor de kenmerken van de patiënten die er worden behandeld kunnen verschillen tussen ziekenhuizen.1 De ziekenhuisspecifieke samenstelling van de patiëntenpopulatie wordt vaak aangeduid met ‘case-mix’. Voor perfect gemeten verschillen in case-mix kan worden gecorrigeerd in een statistische analyse, maar voor niet gemeten verschillen is dat niet mogelijk.

Doordat er in de praktijk sprake is van een beperkt aantal ziekenhuizen met een beperkte variatie in patiëntenaantallen, kan alleen een statistisch model antwoord geven op de vraag wat het ‘optimale’ volume is. In zo’n model zitten echter verschillende aannames, en een verkeerd model kan tot onjuiste conclusies leiden.

Wanneer een beperkt aantal ziekenhuizen en patiënten wordt onderzocht, bestaat er statistische onzekerheid over hoe vaak uitkomsten optreden, met name bij ziekenhuizen met kleine patiëntenaantallen. Daardoor is het onderscheidend vermogen (‘power’) tussen ziekenhuizen met kleine patiëntenaantallen laag.1

Een voorbeeld: kinderhartchirurgie

Als voorbeeld bespreken we een invloedrijk onderzoek naar volume-uitkomstrelaties in de kinderhartchirurgie, waarin bovengenoemde uitdagingen een rol speelden. In dit onderzoek werden uitkomsten vergeleken tussen 90 ziekenhuizen uit 35 landen verspreid over 5 continenten.2 De ziekenhuizen verschilden in het aantal hartoperaties bij pasgeborenen dat er jaarlijks werd uitgevoerd: van 6 tot 163 ingrepen per jaar. Het is aannemelijk dat deze ziekenhuizen verschilden in case-mix, bijvoorbeeld doordat ziekenhuizen met veel ingrepen wellicht juist veel ‘lichte’ ingrepen doen, die veelal gepaard gaan met weinig complicaties. Dit alleen al kan tot de onjuiste conclusie leiden dat meer ingrepen doen leidt tot minder complicaties. Weliswaar werd er in het onderzoek gecorrigeerd voor gemeten verschillen in case-mix, zoals het jaar van de operatie en het bruto nationaal product van het betreffende land, maar het blijft de vraag in hoeverre alle mogelijke verschillen in case-mix zijn meegenomen en of de case-mixvariabelen in alle ziekenhuizen op dezelfde manier zijn gemeten.

In het onderzoek werd het verband geanalyseerd tussen de patiëntenaantallen per ziekenhuis en het risico op sterfte. Vervolgens werd de analyse telkens herhaald bij subgroepen van de ziekenhuizen, waarbij steeds meer van de kleinere ziekenhuizen buiten beschouwing werden gelaten. De gedachte achter het opschroeven van de ondergrens is dat de volume-uitkomstrelatie een plateau heeft, met andere woorden: dat vanaf een bepaald volume de uitkomsten niet noemenswaardig meer verschillen. Met het opschroeven van de volume-ondergrens werd de relatie tussen volume en uitkomst steeds zwakker. Uiteindelijk was dit verband niet meer ‘statistisch significant’ bij een ondergrens van 60 hartoperaties bij kinderen jonger dan 30 dagen. Deze grens werd als klinisch relevant beschouwd, wat betekent dat dit het gewenste minimaal aantal ingrepen betreft.

Natuurlijk is statistische significantie hier niet per se hetzelfde als klinische relevantie. Nog afgezien daarvan is het belangrijk om te beseffen dat het op deze manier identificeren van een volume-ondergrens berust op een afname van variatie in volume tussen ziekenhuizen in combinatie met een steeds kleiner wordende steekproef – en daardoor een verlies van power; hiermee wordt dus niet aangetoond dat een verband afwezig is (‘absence of evidence is not evidence of absence’).

Tot slot

Het onderzoek naar volumenormen in kinderhartchirurgie stond centraal in een recente discussie over centralisatie van zorg. Die discussie is breder dan alleen de rol van volumenormen en valt buiten het bestek van dit artikel. Discussies over vergelijkingen tussen ziekenhuizen draaien regelmatig om de vraag of er voldoende is gecorrigeerd voor verschillen in case-mix. In dit stuk hebben we duidelijk gemaakt dat er meer aspecten zijn die aandacht verdienen in een discussie over volumenormen. Daarbij merken we op dat we niet uitputtend zijn. Wordt volume verdeeld tussen veel of weinig medewerkers? Is een volumenorm overdraagbaar, oftewel kunnen specialisten hun volumenorm meenemen naar een ander ziekenhuis? Kan een volumenorm het ongewenste effect hebben dat een ingreep laagdrempeliger wordt uitgevoerd, waardoor de capaciteit om andere ingrepen uit te voeren mogelijk wordt verkleind? Welke uitkomstmaten zijn geschikt? Hoe weeg je verschillende uitkomstmaten, zoals zeldzame complicaties versus bereisbaarheid en bereikbaarheid? Leidt een volumenorm voor de ene ingreep ook tot verbetering op een vergelijkbare ingreep?3 En welke proces- en structuurvariabelen spelen eigenlijk een rol in volume-uitkomstrelaties?3 Naast de beschreven methodologische uitdagingen verdienen deze vragen ook aandacht tijdens besluitvorming over volumenormen.

Literatuur
  1. Siregar S, Groenwold RH, Versteegh M, van Herwerden LA. Prestatie-indicatoren voor ziekenhuizen. Ned Tijdschr Geneeskd. 2012;156:A5487. Medline.
  2. Kansy A, Zu Eulenburg C, Sarris G, et al. Higher programmatic volume in neonatal heart surgery is associated with lower early mortality. Ann Thorac Surg. 2018;105(5):1436-1440. doi:10.1016/j.athoracsur.2017.11.028. Medline
  3. Mesman R, Berden HJJM, Westert GP. Van voldoen aan volumenormen naar leren van zorguitkomsten. Ned Tijdschr Geneeskd. 2022;166:D6277. Medline.
Auteursinformatie

LUMC, Leiden. Afd. Klinische Epidemiologie: prof.dr. R.H.H. Groenwold, arts en klinisch epidemioloog; prof.dr. F.R. Rosendaal, arts niet praktiserend en klinisch epidemioloog. Afd. Willem-Alexander Kinderziekenhuis: dr. A.A.W. Roest, kinderarts.

Contact R.H.H. Groenwold (r.h.h.groenwold@lumc.nl)

Belangenverstrengeling

Belangenconflict en financiële ondersteuning: geen gemeld.

Auteur Belangenverstrengeling
Rolf H.H. Groenwold ICMJE-formulier
Arno A.W. Roest ICMJE-formulier
Frits R. Rosendaal ICMJE-formulier
Dit artikel is gepubliceerd in het dossier
Methodologie van onderzoek
Heb je nog vragen na het lezen van dit artikel?
Check onze AI-tool en verbaas je over de antwoorden.
ASK NTVG

Ook interessant

Reacties

Onderzoek naar de relatie tussen volume en kwaliteit kent vele methodologische complicaties; de auteurs wijzen terecht op een aantal hiervan. In de discussie wijzen ze bovendien nog op een aantal kwesties waar in onderzoek nog nauwelijks aandacht aan is besteed, zoals de overdraagbaarheid van volume. Een van de beperkingen van het onderzoek naar volume is immers dat niet duidelijk is wat precies het object van de vergelijking moet zijn; is dit de chirurg, het team, het ziekenhuis? Waarschijnlijk spelen deze allen een rol, waarbij de rol van het ziekenhuis zeker niet moet worden onderschat; zeker bij complexe aandoeningen spelen immers veel afdelingen een rol; naast de OK gaat het bijvoorbeeld om de IC en de radiologie. Een ziekenhuis is een ecologie waarin vele elementen bijdragen aan kwaliteit (of het gebrek daaraan). Een niet genoemde maar wel relevante factor is wat er gebeurt als een deel van de zorg verdwijnt naar een andere plek: wordt de rest van de zorg dan slechter, bijvoorbeeld door onvoldoende deskundigheid bij diagnose-stelling? Dit soort cascade-effecten zouden meer in beeld moeten worden gebracht waarbij onderzoek op populatieniveau nodig is.

Roland Bal, hoogleraar Healthcare governance
Jan Willem
Coebergh

Ik ondersteun wat Roland Bal stelt. Mijn ervaring bij het IKZ, waarin we overigens vaak 'population-based' studies konden doen samen met specialisten van grote en kleine (potentiele) verwijzende ziekenhuizen, leerde ook het belang van aandacht, dus ook  waardering  voor het voor- en natraject, lees de verwijzer(s) en/of  de nabehandelaar(s).  Natuurlijk ook omdat er sprake kan zijn van wezenlijke invloed op het resultaat, al of niet  succesvol.  Ketenzorg dus en vermijding van vernederend gebluf uit zg topziekenhuizen.   

JWW Coebergh