Samenvatting
Verschillende effectmaten kunnen een relatie tussen een interventie of risicofactor en een uitkomst kwantificeren, waaronder de risicoratio en de oddsratio.
Oddsratio’s zijn bedoeld voor patiënt-controleonderzoek, waar ze een goede schatting geven van het relatieve risico, maar worden ook vaak gepresenteerd in cohortonderzoek en gerandomiseerde gecontroleerde onderzoeken (RCT’s).
Een oddsratio wordt in cohortonderzoek en RCT’s vaak ten onrechte geïnterpreteerd als een risicoratio; de oddsratio geeft echter een overschatting van de risicoratio, met name als de uitkomst vaak voorkomt.
Een reden dat oddsratio’s gepresenteerd worden, is het gebruik van logistische regressie om te corrigeren voor confounders. Er zijn echter andere methoden om in een cohortonderzoek of RCT gecorrigeerde risicoratio’s te berekenen, zoals de mantel-haenszel-methode, log-binomiale regressie, poisson-regressie met robuuste standaardfout, en de ‘Verdubbelen van mensen met de uitkomst’-methode met robuuste standaardfout.
Om te voorkomen dat oddsratio’s verkeerd geïnterpreteerd worden, zouden in cohortonderzoeken en RCT’s risicoratio’s berekend moeten worden.
artikel
In medisch onderzoek wordt vaak het effect van een interventie of het effect van een risicofactor op een dichotome (ja/nee) uitkomst bestudeerd. Voorbeelden hiervan zijn ‘Is er een effect van het dagelijks slikken van acetylsalicylzuur op sterfte aan hart- en vaatziekten?’ of ‘Is er een effect van overgewicht op het krijgen van diabetes mellitus type 2?’. Er zijn verschillende effectmaten (of associatiematen) om een dergelijke relatie te kwantificeren, zoals het risicoverschil, de risicoratio (ook wel het relatieve risico genoemd), de oddsratio of de hazardratio.1 Dit artikel gaat over het gebruik van oddsratio’s en risicoratio’s (zie uitlegkader).
Oddsratio’s worden vaak gepresenteerd in cohortonderzoeken of in gerandomiseerde gecontroleerde onderzoeken (RCT’s). In dit soort onderzoek geeft de oddsratio echter een overschatting van de risicoratio als de uitkomst niet zeldzaam is. Een illustratief voorbeeld van hoe dit tot grote misverstanden kan leiden, is een RCT naar het effect van chirurgie bij patiënten met compressie van het ruggenmerg als gevolg van kanker.2 De primaire uitkomstmaat was ‘kunnen lopen’, wat 70,3% van de patiënten inderdaad kon na follow-up. De auteurs van het artikel corrigeerden voor ‘kunnen lopen’ vóór aanvang van het onderzoek en presenteerden in hun abstract een oddsratio van 6,2 volgens de mantel-haenszel-methode (een methode om te corrigeren voor andere variabelen). Op basis van de aantallen die genoemd worden in het artikel, kunnen de mantel-haenszel-risicoratio (1,48) en de ongecorrigeerde odds- en risicoratio worden berekend (tabel 1). Het verschil tussen de oddsratio en de risicoratio is groot, met name voor de gecorrigeerde odds- en risicoratio (6,26 vs. 1,48). Lezers van dit artikel zouden de oddsratio gemakkelijk per abuis kunnen interpreteren als een risicoratio, dus een 6 maal verhoogde kans om te kunnen lopen in plaats van een 1,5 maal verhoogde kans. De correcte interpretatie van de oddsratio is dat de odds om te kunnen lopen 6 maal verhoogd is in de interventiegroep ten opzichte van de odds in de controlegroep. Omdat de odds voor ons echter geen begrijpelijke maat is, kunnen we die 6 maal verhoogde odds niet goed op waarde schatten (zie ook ‘Risicoratio versus oddsratio’).
Het bovenstaande voorbeeld illustreert het belang van het juiste begrip van de oddsratio en de risicoratio. In dit artikel zal ik eerst het verschil tussen deze 2 effectmaten uitleggen en bespreken voor welke typen onderzoek ze geschikt zijn. Vervolgens licht ik het probleem van het gebruik van oddsratio’s in cohortonderzoeken en RCT’s toe. Ten slotte noem ik verschillende analysemethoden om risicoratio’s in plaats van oddsratio’s te berekenen.
Risicoratio versus oddsratio
Een risicoratio is gedefinieerd als het risico op de uitkomst (bijvoorbeeld ziekte) in de groep die blootgesteld is (bijvoorbeeld aan een interventie of risicofactor) gedeeld door het risico op de uitkomst in de groep die niet is blootgesteld. In tabel 2 staan de resultaten van het ESPRIT-onderzoek, een RCT bij patiënten met een TIA of een klein herseninfarct. In dit onderzoek werd onderzocht wat het effect van acetylsalicylzuur (30-325 mg 1 dd) en dipyridamol (200 mg 2 dd) versus alleen acetylsalicylzuur was.3 Het risico op de primaire uitkomst (een combinatie van cardiovasculaire en vasculaire mortaliteit en morbiditeit, en een grote bloeding) in de acetylsalicylzuur-dipyridamolgroep was 12,7% en in de acetylsalicylzuurgroep 15,7%. Dit levert een risicoratio op van 0,81 met een 95%-BI van 0,67-0,97. Dit betekent dat patiënten die acetylsalicylzuur en dipyridamol kregen een 0,81 maal zo groot risico hadden op de uitkomst dan patiënten die alleen acetylsalicylzuur kregen. Dat wil zeggen: de patiënten die behandeld werden met de combinatietherapie waren beter af. Dit is hetzelfde als een relatieve risicoreductie van 19,0% (1-0,81).
Het uitvoeren van een RCT of een cohortonderzoek is niet altijd mogelijk, bijvoorbeeld vanwege ethische bezwaren of omdat de uitkomst pas na lange tijd optreedt of erg zeldzaam is. In dat soort situaties kan een patiënt-controleonderzoek de aangewezen onderzoeksopzet zijn om een verband tussen risicofactoren en een uitkomst te onderzoeken. In een patiënt-controleonderzoek worden mensen met een uitkomst (bijvoorbeeld ziekte) vergeleken met mensen zonder die uitkomst; er wordt dus geselecteerd op de uitkomst in plaats van op de interventie of risicofactor.
Aangezien de onderzoeker bepaalt wat de verhouding is tussen het aantal mensen met en zonder de ziekte die in het onderzoek worden opgenomen, is het niet mogelijk om een risico te berekenen voor de blootgestelde en niet-blootgestelde groep. Dat risico wordt immers bepaald door de verhouding tussen geïncludeerde patiënten en controlepersonen. Daarom worden in patiënt-controleonderzoek de odds van blootstelling bij de patiënten (het aantal blootgestelde patiënten gedeeld door het aantal niet-blootgestelde patiënten) berekend en de odds van blootstelling bij de controlepersonen (het aantal blootgestelde controlepersonen gedeeld door het aantal niet-blootgestelde controlepersonen). De ratio van beide, de oddsratio, vormt de effectmaat in een patiënt-controleonderzoek.
De essentie van een odds is dat de patiënten in de teller niet vertegenwoordigd zijn in de noemer; het gaat om een verhouding in plaats van een proportie.4 Dit heeft tot gevolg dat de 2 odds en de oddsratio moeilijk te interpreteren zijn. Bij de meeste patiënt-controleonderzoeken kan de oddsratio echter rechtstreeks geïnterpreteerd worden als een risicoratio (voor details hierover verwijs ik naar de literatuur5,6). In tabel 3 staan de resultaten van het RATIO-onderzoek, een patiënt-controleonderzoek naar het effect van het gebruik van orale anticonceptie op het doorgemaakt hebben van een beroerte.7 De oddsratio in dit onderzoek was 1,65 (95%-BI: 1,21-2,24).
Omdat in een patiënt-controleonderzoek geen risicoratio berekend kan worden, is de oddsratio ontwikkeld als effectmaat in een patiënt-controleonderzoek, maar deze kan ook berekend worden in een cohortonderzoek of in een RCT. De oddsratio kan als risicoratio worden geïnterpreteerd als een afwijking zeldzaam is; de oddsratio geeft echter een overschatting van de risicoratio als de uitkomst niet zeldzaam is (≤ 10% wordt vaak gebruikt als grens voor zeldzaamheid). Hoe vaker de uitkomst voorkomt en hoe verder de oddsratio van 1 afligt, hoe groter het verschil tussen de oddsratio en risicoratio zal zijn. Zolang de oddsratio in een cohortonderzoek of RCT niet geïnterpreteerd wordt als risicoratio, is dit geen probleem. Een oddsratio moet namelijk gelezen worden als een x keer verhoogde odds op de uitkomst. Omdat we echter geen gevoel hebben voor wat een odds is, in tegenstelling tot een risico of een kans, zal een lezer van een artikel de oddsratio toch voor het gemak vaak als een risicoratio interpreteren. Een verkeerde interpretatie van de oddsratio kan leiden tot grote misverstanden zoals geïllustreerd door het voorbeeld in de inleiding.
Oddsratio’s in cohortonderzoeken en RCT’s
Uit bovenstaande blijkt dat er geen reden is om bij een cohortonderzoek of RCT een oddsratio te presenteren. Toch wordt dit vaak gedaan in cohortonderzoeken en RCT’s. In een selectie van 75 cohortonderzoeken, gepubliceerd in 2006 en 2007 in tijdschriften met een hoge impactfactor, werd bij ongeveer een derde van de artikelen een oddsratio in plaats van een risicoratio gepresenteerd. In 193 RCT’s met een dichotome uitkomst, gepubliceerd in 2008 in 5 tijdschriften met een hoge impactfactor, presenteerden 24 (12%) van de artikelen oddsratio’s.1
Een reden dat oddsratio’s gepresenteerd worden in cohortonderzoek, is dat logistische regressie vaak gebruikt wordt om te corrigeren voor confounding. Logistische regressie levert echter altijd een oddsratio op.8 Ook in een RCT wordt soms logistische regressie gebruikt om de invloed van variabelen bij de start van een onderzoek (‘baseline’-variabelen) te bekijken. In een deel van de bovengenoemde 24 RCT’s was correctie voor deze variabelen inderdaad de reden om oddsratio’s te presenteren, maar dit gold niet voor alle artikelen.
Een andere reden om oddsratio’s in plaats van risicoratio’s te presenteren is dat oddsratio’s symmetrisch zijn. Als men de uitkomst (en dus de referentiecategorie) omdraait, bijvoorbeeld ‘geen beroerte’ versus ‘beroerte’ in tabel 3, zal de nieuwe oddsratio de inverse zijn van de oude oddsratio, dus 1 / 1,65 = 0,61. Als dit voor de risicoratio wordt gedaan, bijvoorbeeld ‘uitkomst nee’ versus ‘uikomst ja’ in tabel 2, zal de nieuwe risicoratio niet de inverse zijn van de oude risicoratio; 87,3% / 84,3% = 1,04 is niet hetzelfde als 1 / 0,81 = 1,23. Het is dus niet fout om een oddsratio te presenteren zolang deze maar als zodanig geïnterpreteerd wordt.
Ook in dwarsdoorsnedeonderzoek worden vaak oddsratio’s gepresenteerd, terwijl in dit type onderzoek beter prevalentieratio’s berekend kunnen worden in plaats van oddsratio’s. De alternatieven voor logistische regressie die hieronder worden besproken, kunnen ook gebruikt worden om prevalentieratio’s te schatten in dwarsdoorsnedeonderzoek.9
Gecorrigeerde risicoratio’s berekenen in cohortonderzoeken en RCT’s
Zoals hierboven genoemd is het gebruik van logistische regressie een van de redenen voor het presenteren van oddsratio’s in cohortonderzoeken en RCT’s. Er zijn echter analysemethoden beschikbaar die corrigeren voor confounding en die toch risicoratio’s kunnen schatten.
Er zijn 4 methoden die in simulatieonderzoek correcte schattingen en correcte nauwkeurigheid (correcte betrouwbaarheidsintervallen) van de risicoratio’s geven.9-15 In een situatie met 1 of 2 categorische variabelen (dit zijn variabelen die in te delen zijn in categorieën, zoals man of vrouw) waarvoor gecorrigeerd moet worden, is de mantel-haenszel-risicoratio een simpele en doeltreffende methode.16 Dit kan bijvoorbeeld als men wil corrigeren voor gestratificeerde randomisatie in een klinisch onderzoek (zie tabel 1). Deze methode kan eenvoudig worden toegepast met een spreadsheet van Rothman, genaamd ‘Episheet’ (http://krothman.hostbyet2.com). In een situatie met meer variabelen of met continue variabelen waarvoor gecorrigeerd moet worden, kan log-binomiale regressie toegepast worden.11 Als log-binomiale regressie niet convergeert, dat wil zeggen: geen schattingen van het effect oplevert, kan poisson-regressie met robuuste standaardfout worden gebruikt.12 Beide methoden kunnen uitgevoerd worden met veelgebruikte statistische programma’s, zoals SPSS, SAS, R en Stata.10,15,17 Als poisson-regressie een probleem oplevert omdat individuele kansen berekend moeten worden en kansen voor sommige individuen boven de 1 komen, kan de methode ‘Verdubbelen van mensen met de uitkomst’ met robuuste standaardfout worden toegepast.18,19 Deze methode vereist echter extra programmeerwerk en statistische expertise.
Waar moet de lezer op letten bij het lezen van publicaties?
Als in een artikel oddsratio’s worden gepresenteerd, moet eerst bepaald worden of het een cohortonderzoek, een RCT of een patiënt-controleonderzoek betreft. Indien het inderdaad een cohortonderzoek of een RCT is, moet de lezer controleren hoe vaak de uitkomst voorkomt in het betreffende onderzoek en hoe ver de oddsratio van de 1 zit. Hoe vaker de uitkomst voorkomt en hoe verder de oddsratio van de 1 zit, hoe groter de afwijking tussen de oddsratio en de risicoratio zal zijn. Indien de uitkomst bij > 10% van de onderzoeksdeelnemers voorkomt, mag de oddsratio niet als risicoratio geïnterpreteerd worden.
De lezer kan proberen om met behulp van de ruwe getallen in het artikel (voor zover deze gegeven zijn) de ongecorrigeerde risicoratio te berekenen om een inschatting te krijgen van het verschil tussen de ongecorrigeerde oddsratio en de ongecorrigeerde risicoratio. Indien mogelijk gebruikt de lezer de berekende risicoratio om de onderzoeksresultaten beter te kunnen interpreteren. Met name bij cohortonderzoek is dit soms lastig, omdat de gepubliceerde oddsratio gecorrigeerd zal zijn voor confounders; het is vaak niet mogelijk om met de getallen uit het artikel zelf de overeenkomstige gecorrigeerde risicoratio te berekenen. Het verschil tussen de ongecorrigeerde oddsratio en ongecorrigeerde risicoratio geeft dan wel een aanwijzing hoe ver de oddsratio afligt van de risicoratio.
Als in het artikel de resultaten van een patiënt-controleonderzoek worden gepresenteerd, kan de oddsratio bijna altijd wel direct geïnterpreteerd worden als een risicoratio.
Aanwijzingen bij het schrijven van publicaties
Een auteur moet proberen om het gebruik van oddsratio’s te voorkomen als het een cohortonderzoek of een RCT betreft. Indien geen correctie voor confounders of baselinevariabelen nodig is, kan de auteur het beste rechtstreeks een risicoratio berekenen en geen oddsratio. Indien correctie voor confounders of baselinevariabelen wel nodig is, kan de auteur het beste een analysemethode gebruiken die gecorrigeerde risicoratio’s in plaats van gecorrigeerde oddsratio’s berekent. Als dat om een bepaalde reden niet mogelijk is, dan moet hij of zij expliciet aangeven of de gepresenteerde oddsratio wel of niet geïnterpreteerd kan worden als een risicoratio, afhankelijk van hoe vaak de uitkomst voorkomt in het onderzoek. Als het een patiënt-controleonderzoek betreft, kan de auteur een oddsratio berekenen, die afhankelijk van de samplingmethode van de controlepersonen rechtstreeks te interpreteren is als de risicoratio.
Conclusie
In dit artikel kwamen de problemen aan bod van het gebruik van oddsratio’s in plaats van risicoratio’s in cohortonderzoeken en RCT’s. De lezer van wetenschappelijke artikelen moet altijd bedacht zijn op mogelijke misinterpretatie als oddsratio’s gepresenteerd worden in een cohortonderzoek of een RCT. Hoe vaker de uitkomst voorkomt en hoe verder de oddsratio van 1 afligt, hoe groter de afwijking tussen de oddsratio en risicoratio zal zijn. Om te voorkomen dat oddsratio’s verkeerd geïnterpreteerd worden, zouden risicoratio’s rechtstreeks berekend moeten worden in cohortonderzoek en RCT’s. Redacteuren van tijdschriften kunnen hierin een rol spelen door onderzoekers aan te moedigen om risicoratio’s in plaats van oddsratio’s te presenteren in cohortonderzoek en RCT’s.
Leerpunten
Oddsratio’s zijn bedoeld voor patiënt-controleonderzoek. Ze worden echter ook vaak gebruikt in RCT’s en cohortonderzoeken.
Logistische regressie is een gebruikelijke methode om te corrigeren voor confounding; logistische regressie levert echter altijd oddsratio’s op.
Een oddsratio in een cohortonderzoek of een RCT wordt snel geïnterpreteerd als een risicoratio, maar geeft in dit soort onderzoek een overschatting van de risicoratio als de uitkomst vaak voorkomt en naarmate de oddsratio verder van de 1 ligt.
Om te voorkomen dat oddsratio’s verkeerd geïnterpreteerd worden, dienen risicoratio’s rechtstreeks berekend te worden in cohortonderzoeken en RCT’s.
Oddsratio en risicoratio
De oddsratio en de risicoratio worden als volgt berekend:
Oddsratio = (a / c) / (b / d)
Risicoratio = (a / (a + b)) / (c / (c + d))
In een cohortonderzoek of een RCT benadert de oddsratio de risicoratio als de uitkomst zeldzaam is, dus als a << b en c << d. Wanneer de uitkomst niet zeldzaam is, moet de risicoratio worden berekend.
Literatuur
Knol MJ, Duijnhoven RG, Grobbee DE, Moons KG, Groenwold RH. Potential misinterpretation of treatment effects due to use of odds ratios and logistic regression in randomized controlled trials. PLoS ONE. 2011;6:e21248 Medline. doi:10.1371/journal.pone.0021248
RA, Tibbs PA, Regine WF, et al. Direct decompressive surgical resection in the treatment of spinal cord compression caused by metastatic cancer: a randomised trial. Lancet. 2005;366:643-8 Medline. doi:10.1016/S0140-6736(05)66954-1
The Esprit Study Group. Aspirin plus dipyridamole versus aspirin alone after cerebral ischaemia of arterial origin (ESPRIT): randomised controlled trial. Lancet. 2006;367:1665-73 Medline. doi:10.1016/S0140-6736(06)68734-5
Scholten RJ. Dwalingen in de methodologie. XI. ‘Odds’ en wat dies meer zij. Ned Tijdschr Geneeskd. 1998;142:2452-4 Medline. NTvG
Knol MJ, Vandenbroucke JP, Scott P, Egger M. What do case-control studies estimate? Survey of methods and assumptions in published case-control research. Am J Epidemiol. 2008;168:1073-81 Medline. doi:10.1093/aje/kwn217
Greenland S, Thomas DC. On the need for the rare disease assumption in case-control studies. Am J Epidemiol. 1982;116:547-53 Medline.
Kemmeren JM, Tanis BC, van den Bosch MA, et al. Risk of Arterial Thrombosis in Relation to Oral Contraceptives (RATIO) study: oral contraceptives and the risk of ischemic stroke. Stroke. 2002;33:1202-8 Medline. doi:10.1161/01.STR.0000015345.61324.3F
Groenwold RH. Verstoring in observationeel onderzoek: ‘confounding’. Ned Tijdschr Geneeskd. 2012;156:A4221. NTvG
Barros AJ, Hirakata VN. Alternatives for logistic regression in cross-sectional studies: an empirical comparison of models that directly estimate the prevalence ratio. BMC Med Res Methodol. 2003;3:21 Medline. doi:10.1186/1471-2288-3-21
Knol MJ, Le Cessie S, Algra A, Vandenbroucke JP, Groenwold RH. Tackling the problem of overestimating risk ratios by odds ratios in randomized controlled trials and observational cohort studies: alternatives for logistic regression. CMAJ. 2011 (epub) Medline.
Robbins AS, Chao SY, Fonseca VP. What’s the relative risk? A method to directly estimate risk ratios in cohort studies of common outcomes. Ann Epidemiol. 2002;12:452-4 Medline. doi:10.1016/S1047-2797(01)00278-2
Zou G. A modified poisson regression approach to prospective studies with binary data. Am J Epidemiol. 2004;159:702-6 Medline. doi:10.1093/aje/kwh090
Austin PC. Absolute risk reductions, relative risks, relative risk reductions, and numbers needed to treat can be obtained from a logistic regression model. J Clin Epidemiol. 2010;63:2-6 Medline. doi:10.1016/j.jclinepi.2008.11.004
Austin PC, Laupacis A. A Tutorial on Methods to Estimating Clinically and Policy-Meaningful Measures of Treatment Effects in Prospective Observational Studies: A Review. The International Journal of Biostatistics. 2011;7:6.
Lumley T, Kronmal R, Ma S. Relative Risk Regression in Medical Research: Models, Contrasts, Estimators, and Algorithms. UW Biostatistics Working Paper Series. Paper 293. Washington: The Berkeley Electronic Press; 2006. link
Mantel N, Haenszel W. Statistical aspects of the analysis of data from retrospective studies of disease. J Natl Cancer Inst. 1959;22:719-48 Medline.
Spiegelman D, Hertzmark E. Easy SAS calculations for risk or prevalence ratios and differences. Am J Epidemiol. 2005;162:199-200 Medline. doi:10.1093/aje/kwi188
Miettinen O. Design options in epidemiologic research. An update. Scand J Work Environ Health. 1982;8(Suppl 1):7-14 Medline.
Schouten EG, Dekker JM, Kok FJ, et al. Risk ratio and rate ratio estimation in case-cohort designs: hypertension and cardiovascular mortality. Stat Med. 1993;12:1733-45 Medline. doi:10.1002/sim.4780121808
Risicoratio buiten eigen betrouwbaarheidsinterval?
In tabel 2 ligt de risicoratio 0,81 buiten zijn eigen 95% betrouwbaarheidinterval 1,21 -2,24. Het bij behorende 95% betrouwbaarheidsinterval klopt niet . Het juiste betrouwbaarheidsinterval is 0.67 - 0.97
Arturo Knol, huisarts np
Betrouwbaarheidsinterval (antwoord auteur)
Er is inderdaad per abuis een verkeerd betrouwbaarheidsinterval in Tabel 2 gepresenteerd. Het betrouwbaarheidsinterval moet inderdaad 0,67-0,97 zijn. In de tekst staat wel het juiste betrouwbaarheidsinterval.
Mirjam Knol