Samenvatting
- Sensitiviteit en specificiteit krijgen in de praktijk vaak een andere betekenis dan in leerboeken. Hun waarde is afhankelijk van de samenstelling van de groepen waarin de test werd onderzocht.
- Zelden wordt er rekening mee gehouden dat de sensitiviteit en specificiteit veranderen in het beloop van de ziekte. De interpretatie van hun waarde blijkt moeilijk te zijn.
- Het aannemelijkheidsquotiënt (de ‘likelihood’-ratio) combineert sensitiviteit en specificiteit, en gaat daarom met dezelfde problemen gepaard.
- De likelihoodratio is de regel van Bayes in zijn eenvoudigste vorm: hoe verandert een bepaalde waarschijnlijkheid (in dit geval de waarschijnlijkheid van de aanwezigheid van een bepaalde ziekte) door toevoeging van een nieuw gegeven (de uitslag van een diagnostische test)?
- De regel van Bayes wordt toegepast op allerlei gebieden, maar zelden in de klinische praktijk omdat de waarschijnlijkheid van een diagnose voorafgaande aan de test moeilijk is te kwantificeren.
- Likelihoodratio's zijn goed bruikbaar bij het onderzoek van diagnostiek en bij het onderwijs in het diagnostisch denken. Ook kunnen ze helpen bij het probabilistisch interpreteren van klinische trials.
Dwalingen in de methodologie. XXXVI. Van 'likelihood'-ratio's en de regel van Bayes
Rotterdam, december 2001,
Met recht wijst collega Vermeulen erop (2001:2421-4) dat het gebruik van de ‘likelihood’-ratio (LR) belangrijke voordelen biedt boven dat van sensitiviteit en specificiteit (SeSp). Er zijn nog enkele aanvullende argumenten te noemen.1
Diagnostiek begint met het kiezen van een test in relatie tot het doel (aantonen of juist uitsluiten van een veronderstelde ziekte). De LR van een testuitkomst biedt meer duidelijkheid over het onderscheidend vermogen dan de SeSp-benadering en zo kan men beter kiezen tussen alternatieve tests. Heeft men de keuze uit meerdere tests en wil men bijvoorbeeld een bepaalde ziekte uitsluiten, dan zal men kiezen voor die test waarvan de LR van de uitkomst ‘normaal’ het dichtst bij de waarde 0 ligt.
De tweede stap is de interpretatie van een resultaat: de uitkomsten van tests zijn meestal niet dichotoom (‘normaal’/‘abnormaal’), maar worden uitgedrukt op een ordinale schaal (bijvoorbeeld ‘normaal’, ‘verdacht’, ‘zeer verdacht’, ‘zeker afwijkend’) of op een continue schaal (een concentratie). Zowel bij een dichotome testuitkomst als bij onderzoeken met een ordinaal resultaat heeft men te maken met een niet beoordeelbaar testresultaat. De grootste kracht van het LR-concept is juist dat alle mogelijke uitkomsten getalsmatig kunnen worden gekarakteriseerd, inclusief de niet beoordeelbare.1 Daardoor gaat geen informatie verloren, zoals dat wel gebeurt bij het kunstmatig dichotomiseren van uitslagen in ‘normaal’ en ‘abnormaal’ in de SeSp-benadering. Bij continue variabelen is men gebaat bij de interpretatie van de actuele waarde, bijvoorbeeld de interpretatie van de prostaatspecifiek-antigeenwaarde in relatie tot de kans op prostaatcarcinoom. Ook voor allerlei afbeeldingstechnieken, zoals ook in de neurologie worden gebruikt, geldt dat men vaak werkt met diverse uitkomstcategorieën met elk hun eigen LR en dus met elk hun bijpassende voorspellende waarde, zoals Vermeulen heeft voorgerekend.
Bijna altijd worden – hetzij gelijktijdig, hetzij sequentieel – meerdere tests gebruikt. Hoe moeten die combinaties worden geïnterpreteerd? Het LR-concept biedt eenvoudig de mogelijkheid de LR van de uitkomst van elke test te berekenen en de verkregen LR's met elkaar te vermenigvuldigen. Dan blijkt vaak dat de combinatie van twee positieve testuitkomsten of twee negatieve tot een groter onderscheidend vermogen leidt, terwijl het minder duidelijkheid schept wanneer de ene test een normale uitkomst heeft en de andere een afwijkende of vice versa – met alle problemen van dien.
Bij meta-analysen van diagnostische tests met uitkomsten op een ordinale schaal is de LR eveneens van nut. De verschillende uitkomstcategorieën blijken dan vaak onderling sterk te verschillen in hun LR, terwijl met de SeSp-benadering de studies in eerste instantie veel homogener lijken.
De laatste alinea van Vermeulens artikel is een juist pleidooi voor meer Bayesiaans denken: diagnostiek is nooit geblinddoekt schieten.
Giard RWM, Hermans J. The diagnostic information of tests for the detection of cancer: the usefulness of the likelihood ratio concept. Eur J Cancer 1996;32A:2042-8.
Dwalingen in de methodologie. XXXVI. Van 'likelihood'-ratio's en de regel van Bayes
Rijswijk, januari 2002,
In het artikel van collega Vermeulen komt een storende fout (dwaling?) voor (2001:2421-4). In de tabel staat: ‘In de likelihoodratio worden sensitiviteit en specificiteit gecombineerd tot één getal: sensitiviteit/(1 – specificiteit).’ Dit is juist, maar hiervoor staat: ‘[. . .] de likelihoodratio (LR) is een getal waarmee men de voorafkans vermenigvuldigt om te komen tot de achterafkans, dat wil zeggen tot de kans op de ziekte als de test positief uitvalt: voorafkans × LR = achterafkans’, en dat is duidelijk onjuist. In het gegeven voorbeeld is de voorafkans 0,5 en de LR 3,8, dus volgens de gegeven vergelijking is de achterafkans 0,5 × 3,8 = 1,9 en dat klopt niet. De goede formule luidt: voorafkans/(voorafkans + (1 – voorafkans)/LR) = achterafkans. De uitkomst van het voorbeeld is: 0,5/(0,5 + (1-0,5)/3,8) = 0,5/(0,5 + 0,5/3,8) = 0,5/(0,5 + 0,13) = 0,79, de uitkomst die ook vermeld wordt. Ook al is de formule iets gecompliceerder dan gesuggereerd wordt, het blijft jammer dat zo weinig met de regel van Bayes gewerkt wordt.
Dwalingen in de methodologie. XXXVI. Van 'likelihood'-ratio's en de regel van Bayes
Amsterdam, januari 2002,
Het is maar wat je onder ‘kans’ verstaat. Als wij het over kansen hebben, bijvoorbeeld ‘1 van de 4’, zou je ook kunnen zeggen ‘1 tegen 3’ en dit laatste wordt gedaan bij het vermenigvuldigen met de likelihoodratio. Daarom schreef ik in het artikel dat bij de feitelijke berekening niet de echte voorafkans wordt gebruikt, maar de vooraf-odds. Vervolgens liet ik zien dat men deze odds weer in een kans kan omzetten, en zo kwam ik dus tot de achterafkans van 0,79.
Dwalingen in de methodologie. XXXVI. Van 'likelihood'-ratio's en de regel van Bayes
België, januari 2002,
Vermeulen stelt in zijn artikel dat de beoordeling van sensitiviteit en specificiteit afhankelijk is van de juiste definitie, het stadium van de ziekte en de samenstelling van de patiëntengroep waarmee men heeft vergeleken bij het onderzoek (2001:2421-4). Voor diagnostiek in de huisartsgeneeskunde kan men dit nog scherper formuleren door te stellen dat de waarde van een test moet worden nagegaan in een populatie die representatief is voor de setting waarin de test zal moeten worden gebruikt. Op onze afdeling werd dergelijk onderzoek gedaan in verband met de diagnose van dementie en alcoholproblemen.1 2 Hierin werd het redeneren van een test naar de ziekte, zoals de auteur dat noemt, consequent doorgetrokken. In het onderzoek naar dementie betekende dit dat relatief eenvoudige klinische tests een belangrijke waarde kunnen hebben in de diagnostiek, terwijl gesofisticeerde computertests in deze populatie en in deze fase van de ziekte slechts een beperkte waarde hebben boven datgene wat uit de resultaten van eenvoudige tests reeds bekend is. Redenerend volgens het gezond verstand (bijvoorbeeld: eenvoudige tests komen vóór meer gesofisticeerde en anamnese komt vóór testonderzoek) en gebruikmakend van de likelihoodratio's zijn wij nagegaan wat de beste volgorde is om tests te gebruiken. Met betrekking tot het opsporen van alcoholafhankelijkheid en overmatig alcoholgebruik bleek de anamnese veel doeltreffender dan laboratoriumtests.2 Meer nog, indien de resultaten van één van de klassieke, korte vragenlijsten (‘Cut down, annoyed, feeling guilty, eye-opener’ (CAGE), ‘Five-shot’, ‘Alcohol use disorders identification test’ (AUDIT)) bekend zijn, levert bloedonderzoek vrijwel geen bijkomende informatie.
Wij sluiten ons aan bij de stelling van de auteur dat in het onderwijs en de opleiding de likelihoodratio's het diagnostisch denken goed zichtbaar kunnen maken. In onze opleiding is hiervoor heel wat aandacht. De ervaring leert dat voor studenten sensitiviteit en specificiteit vaak verwarrend zijn en dat likelihoodratio's hen meer aanspreken, maar dat concreet ermee omgaan een hele klus is. Wij hebben in Vlaanderen beslist om voor de clinicus suggestieve en begrijpelijke termen te implementeren veeleer dan abstracte wiskundige.3 De likelihoodratio noemen we ‘de kracht van het argument’. Deze kracht kan ‘aantonend’ zijn of ‘ontkennend’, termen die verwijzen naar de positieve en negatieve likelihoodratio. De kracht maakt de verschilllende argumenten onderling vergelijkbaar. Hiermee overtuigen wij de jonge clinici ervan dat een klinisch argument best evenveel kracht kan hebben als een duur technologisch argument. Om dit in feitelijk klinisch redeneren in te kunnen passen moet men de ‘voorkans’ kennen, want medische besliskunde is gebaseerd op de stelling: ‘Voorkans (in odds) maal kracht is gelijk aan nakans (in odds).’ In een stapsgewijze besliskunde van de huisarts wordt dan nakans opnieuw voorkans bij het toepassen van het volgende argument, waarbij uiteraard rekening wordt gehouden met de eventuele onderlinge afhankelijkheid van verschillende tests. Hierin verschilt de huisarts nogal van de ziekenhuisarts, die heel dikwijls een ‘cohortbesliskunde’ hanteert. Hierbij worden alle argumenten tegelijk verzameld en daarna wordt hun gezamenlijke voorspellende waarde ingeschat. Dit gaat sneller, maar kost natuurlijk veel meer.4
Lepeleire J de. De diagnose van dementie. Het aandeel van de huisarts [proefschrift]. Leuven: Katholieke Universiteit Leuven; 2000.
Aertgeerts B. Screening for alcohol abuse or dependence [proefschrift]. Leuven: Katholieke Universiteit Leuven; 2000.
Vandenende J, Derese A, Debaene B, Béthune X de, Lemiengre M, Boeckx J, et al. Medische besliskunde. Een nieuw accent in de Vlaamse huisartsgeneeskunde. Huisarts Nu 1996;25:282-344.
Buntinx F. Ondersteuning van het besliskundig denken van de huisarts [inaugurele rede]. Maastricht: Universiteit Maastricht; 2000.