Evaluatie van de toegevoegde waarde van diagnostische tests

Klinische praktijk
K.G.M. Moons
Y. van der Graaf
Citeer dit artikel als
Ned Tijdschr Geneeskd. 2000;144:1256-61
Abstract

Samenvatting

- Bij de beschrijving van methoden voor de evaluatie van diagnostisch onderzoek richt men zich meestal op één diagnostische test en het schatten van de testeigenschappen daarvan, zoals sensitiviteit, specificiteit, likelihood ratio en het oppervlak onder de ‘receiver operating characteristic’(ROC)-curve (het zogenaamde ‘testonderzoek’).

- Testonderzoek is alleen nuttig in situaties waarin de diagnose nagenoeg wordt gebaseerd op één test (screening) en in de initiële fasen van diagnostische testevaluaties om doelmatigheidsredenen. Deze methoden zijn niet geschikt om de klinische ofwel toegevoegde waarde van een test te kwantificeren.

- De waarde van een diagnostische test kan worden geëvalueerd door te onderzoeken of de test een bijdrage levert aan het aantonen of uitsluiten van ziekte, aan de keuze van behandeling, of dat het leidt tot gezondheidswinst.

- Voor de evaluatie van de toegevoegde waarde van een diagnostische test binnen het diagnostisch traject dient men in de onderzoeksopzet rekening te houden met de patiëntengroep bij wie de test in de praktijk zal worden toegepast, de waarschijnlijkheidsdiagnose en de voorafkans hierop, de achtereenvolgende diagnostische fasen en de referentietest.

- Bij de analyse van de gegevens wordt per stap in het diagnostisch proces berekend hoe een testuitslag de kans op aan- of afwezigheid van de vermoede aandoening beïnvloedt.

Auteursinformatie

Universitair Medisch Centrum, Julius Centrum voor Huisartsgeneeskunde en Patiëntgebonden Onderzoek, Postbus 85500, 3508 GA Utrecht.

Dr.K.G.M.Moons, epidemioloog; mw.dr.Y.van der Graaf, arts-epidemioloog.

Contact dr.K.G.M.Moons (k.g.m.moons@jc.azu.nl)

Heb je nog vragen na het lezen van dit artikel?
Check onze AI-tool en verbaas je over de antwoorden.
ASK NTVG

Ook interessant

Reacties

Amsterdam, juni 2000,

Met veel aandacht hebben wij het interessante artikel van Moons en Van der Graaf gelezen (2000:1256-61). Wij zijn het geheel met de auteurs eens dat de toegevoegde diagnostische waarde zeer belangrijk is in de evaluatie van een test, waarin bij de analyse van de gegevens per stap in het diagnostisch proces berekend wordt hoe een testuitslag de kans op aan- of afwezigheid van de vermoede aandoening beïnvloedt. Dit is in praktijk belangrijker dan de klassieke parameters, zoals sensitiviteit,specificiteit en predictieve waarden, gemeten bij de afzonderlijke evaluatie van een enkele diagnostische test. Echter, in deze tijd van economische bezuinigingen op de gezondheidszorg is de verhouding van deze parameter tot de kosten van de test tevens van groot belang bij het optimaal selecteren van de aan te vragen diagnostische tests.1 Het belang van deze kosteneffectiviteit is echter totaal niet vermeld in dit artikel.

Recentelijk hebben wij de objectieve toegevoegde waarde van tests in het differentiaaldiagnostische proces bij icterische patiënten onderzocht in een EG-onderzoeksprogramma, genaamd ICTEC-project. De ziektebeelden als oorzaak van geelzucht werden ingedeeld in 19 categorieën. Van december 1993 tot mei 1997 werden door internisten en chirurgen, al dan niet in opleiding, in 47 algemene ziekenhuizen uit 17 Europese landen, gegevens van 1940 patiënten met icterus verzameld. Deze werden ingevoerd in een programma gebaseerd op het theorema van Bayes. Met alleen de gegevens verkregen met anamnese en lichamelijk onderzoek werd de diagnose in 73% correct gesteld. Derhalve was de relatieve diagnostische bijdrage van de in totaal 9251 aangevraagde paraklinische tests met ongeveer 50.000 gegevens slechts 27%. De gemiddelde toegevoegde waarde van de diagnostische tests was 5,7%. Recentelijk zijn de resultaten van deze evaluatie bij 356 patiënten in de categorie ‘pancreas- en galwegcarcinomen’ gedetailleerd gepubliceerd.2 In deze groep werden de hoogste toegevoegde diagnostische waarden berekend voor percutane transhepatische cholangioscopie (PTC) (31%) en CT-scan (25%). Echter, als wij de kosten van ieder onderzoek meenemen in onze analyse, dan worden deze geavanceerde beeldvormende technieken ruim voorbij gestreefd door de eenvoudige echografie en biochemische leverfunctietests: de toegevoegde diagnostische waarde bedroeg respectievelijk 0,46% per ECU en 0,27% per ECU.

Hieruit mag blijken dat het uitdrukken van de toegevoegde waarde van diagnostische tests in relatie tot de financiële kosten tevens een belangrijke parameter is bij de evaluatie van diagnostisch onderzoek, mede gezien de voortdurende bezuinigingen op de gezondheidszorg.

E. de Bree
D. Tsiftsis
Literatuur
  1. Eiseman B, Jones R, McClatchey M, Borlase B. Cost-effective diagnostic test sequencing. World J Surg 1989;13:272-6.

  2. Bree E de, Tsiftsis D, Santos RM, Lavelle SM, Cuervas-Mons V, Gauthier A, et al. Objective assessment of the contribution of each diagnostic test and of the ordering sequence in jaundice caused by pancreato-biliary carcinoma. Scand J Gastroenterol 2000;35:438-45.

Utrecht, juli 2000,

Wij zijn verheugd te lezen dat collegae De Bree en Tsiftsis het eens zijn met onze suggestie om in de evaluatie van een diagnostische test altijd te streven naar een kwantificering van de mate waarin de testuitslag de kans op aanwezigheid van de vermoede aandoening verandert ten opzichte van de situatie voor de test. Hoewel de auteurs nog enigszins lijken te twijfelen, zijn wij van mening dat een dergelijke (stapsgewijze) evaluatie van diagnostische tests de praktijk veel beter dient dan het schatten van de klassieke parameters als sensitiviteit, specificiteit en predictieve waarde van een (enkele) test. Terecht wijzen de auteurs ons erop dat wij weinig aandacht hebben besteed aan het belang van de ‘kosten’ in diagnostische onderzoekingen. Dit was ook niet het doel van ons artikel. Maar wij willen hier toch nog kort op ingaan.

Twee soorten kosten van diagnostiek kunnen worden onderscheiden: ten eerste kosten in termen van nadelige effecten als gevolg van het ondergaan van de test ofwel belasting voor de patiënt en ten tweede kosten in termen van ‘harde’ valuta ofwel de financiële kosten van de test. In ons artikel hebben wij wel, zij het kort, aandacht besteed aan het eerste aspect van kosten van diagnostiek. Wij gaven aan dat bij de evaluatie van diagnostische tests die mogelijk belastend zijn voor de patiënt en gepaard kunnen gaan met morbiditeit of sterfte, het van belang is om de waarde van de test in termen van kosteneffectiviteit uit te drukken. Het tweede, financiële aspect van kosten van diagnostiek, waarop de auteurs met name wijzen, is inderdaad geheel achterwege gebleven in ons artikel, maar is even goed van belang in diagnostische onderzoekingen. Het is namelijk goed denkbaar dat er situaties zijn waarin de te evalueren test niet per se belastend is, maar wel kostbaar, waardoor de financiële kosten een belangrijke rol kunnen spelen bij de beoordeling of deze test al dan niet toegevoegde waarde voor de praktijk heeft. Dit wordt goed geïllustreerd in het voorbeeld van de auteurs. Wij delen dan ook hun mening dat bij de uiteindelijke afweging beide parameters, de diagnostische waarde van de test in termen van percentage correct geclassificeerden en de financiële kosten, tegen elkaar moeten worden afgewogen.

Op grond van het voorgaande zouden wij als aanvulling op ons artikel willen stellen dat net als bij therapeutisch onderzoek ook bij de vergelijking van de (toegevoegde) waarde van verschillende diagnostische tests, men de tests niet alleen moet vergelijken op verschil in diagnostische effectiviteit (oppervlak onder de ‘receiver operating characteristic’(ROC)-curve of percentage correcte diagnosen), maar eveneens op verschillen in kosten, zowel in termen van patiëntbelasting als in guldens. Kortom, ook in diagnostische onderzoekingen dient men als uitkomstmaat veelvuldiger de (diagnostische) kosteneffectiviteit te kwantificeren.

K.G.M. Moons
Y. van der Graaf

Groningen, juli 2000,

Bij het vergelijken van diagnostiek is het vergelijken met de zogenaamde gouden standaard gewenst. De gouden standaard is bevat in de ROC-curve. Een slechte test wordt door de auteurs benoemd als de diagonaal in de figuur op bl. 1260 (2000:1256-61). Een dergelijke lijn wordt beschreven door de vergelijking Y = X. Als wij de waarden voor X en Y respectievelijk sensitiviteit (= Se) en 1 - specificiteit (= Sp) invullen ontstaat Se = 1 - Sp. Dit betekent dat deze diagonaal de tests representeert waarvoor Se+ Sp = 1. De waarde van Sp + Se ligt tussen 0 en 2. Intuïtief zou men kunnen verwachten, dat voor Se + SP P 0 tests slecht zijn te interpreteren. Dit is echter niet het geval. De kans op een terechte diagnose in respectievelijk de index- en de controlegroep is Se en Sp. De kans op een onterechte diagnose in respectievelijk de index- en de controlegroep is 1 - Se en 1 - Sp. De kans op een terechte uitspraak is P(t) = SeSp en een onterechte uitspraak P(f) = (1 - Se)(1 - Sp). De diagnostische oddsratio (DOR) is de verhouding tussen de kansen op terechte en onterechte uitspraken.3 Voor Se + Sp = 1 is 1 - Se = Sp en 1 - Sp = Se. Als wij dit in de noemer van de formule voor de DOR1 2 substitueren, ontstaat

De betekenis hiervan wordt duidelijk alswij deze formule op het werpen van een geldstuk toepassen (algemeen beschouwd als de gouden standaard voor een slechte test). Als wij de kans op ‘munt’ willen weten is P(t) = 0,5 en P(f) = 0,5. Derhalve is de DOR = 1. Hieruit volgt dat de door de auteurs beschreven diagonaal inderdaad de gouden standaard is voor de waardeloze test en wordt gekenmerkt door Sp + Se = 1.

A. Knol
Literatuur
  1. Knol A. Odds ratio met sensitiviteit en specificiteit. Orghidee 1996; 4:33-4.

  2. Knol A. Parvovirus-B19-infectie in de zwangerschap: een oorzaak van non-immune hydrops foetalis [ingezonden]. [LITREF JAARGANG="1999" PAGINA="541-2" VOLGNR="03"]Ned Tijdschr Geneeskd 1999;143:541.[/LITREF]

  3. Knol A. Van informatie naar expertsysteem. Oregoscoop 1999:27-8.

Utrecht, juli 2000,

Collega Knol ondersteunt onze beweringen met de correcte formules. Om het artikel aantrekkelijk te maken voor de lezer hebben wij zoveel mogelijk formules vermeden.

K.G.M. Moons
Y. van der Graaf