Een serie over de waarde van lichamelijk onderzoek

Klinische praktijk
Tjeerd O.H. de Jongh
Joost O.M Zaat
Citeer dit artikel als
Ned Tijdschr Geneeskd. 2010;154:A2650
Abstract

Samenvatting

  • Dit artikel is de inleiding op een nieuwe serie in het Nederlands Tijdschrift voor Geneeskunde over de waarde van het lichamelijk onderzoek.

  • Gekoppeld aan deze serie staan op de website (www.ntvg.nl) hoofdstukken uit het nieuwe leerboek over fysische diagnostiek en filmpjes over de uitvoering van het lichamelijk onderzoek.

  • Hoewel lichamelijk onderzoek een essentieel onderdeel is van het diagnostische proces, is er vaak weinig aandacht voor de juiste uitvoering en onvoldoende kennis van de waarde van de bevindingen.

  • Diagnostiek bestaat meestal uit het combineren van vele gegevens uit anamnese en lichamelijk onderzoek. Er is echter alleen onderzoek gedaan naar de waarde van geïsoleerde tests en zelfs daarnaar is weinig goed onderzoek gedaan.

  • De waarde van een bevinding bij het lichamelijk onderzoek wordt het best weergegeven door de ‘likelihood’-ratio, die aangeeft hoe de kans op de aan- of afwezigheid van een aandoening verandert door de uitslag van het onderzoek.

Auteursinformatie

Leids Universitair Medisch Centrum, afd Public Health en Eerstelijnsgeneeskunde, Leiden.

Drs T.O.H. de Jongh, huisarts.

Nederlands Tijdschrift voor Geneeskunde, Amsterdam.

Dr. J.O.M. Zaat, huisarts.

Contact drs. T.O.H. de Jongh (tohdejongh@telfort.nl)

Verantwoording

Belangenconflict: geen gemeld. Financiële ondersteuning: geen gemeld.
Aanvaard op 18 augustus 2010

Dit artikel is gepubliceerd in het dossier
Fysische diagnostiek
Heb je nog vragen na het lezen van dit artikel?
Check onze AI-tool en verbaas je over de antwoorden.
ASK NTVG

Ook interessant

Reacties

Een helder verhaal over Likelyhood Ratio's (LR). Er wordt goed beschreven dat de Likelihood-ratio's (LR's) onderhevig zijn aan een aantal onzekerheden. LR's zijn zoals gesteld makkelijker te interpreteren dan sensitiviteit en specificiteit. Maar er kleven ook nadelen aan LR's die minder worden belicht.
Zo is de waarde van verschillende test combinaties weinig onderzocht, een uitzondering zijn de Well's criteria.
Een ander nadeel van het gebruik van de LR is dat door sensitiviteit en specificiteit te combineren tot één getal het zicht verloren gaat op de mogelijkheid om fout positieve resultaten af te wegen met de fout negatieve resultaten. Bovendien wordt uit het oog verloren dat sensitiviteit en specificiteit en hun verhouding te beïnvloeden zijn door de keuze van het afkappunt van een test. Zo zal bij het afkappunt 40 graden in plaats van 38.5 graden het aantal fout positieve uitslagen doen afnemen en het aantal fout negatieve uitslagen doen toenemen. Verder wordt de waarde van koorts door andere factoren beïnvloed zoals de leeftijd.

Hoe je combineert is van invloed op sensitiviteit en specificiteit en is eigenlijk ook te beschrijven in termen van de keuze van het afkappunt. Sterker nog, in de klinische praktijk wanneer je te maken hebt met meneer M. kun je als arts kiezen voor een ander afkappunt dan bij mevrouw K. (bij dezelfde test) omdat de afweging van fout positief en fout negatief voor meneer M. anders is dan voor mevrouw Kuipers.
Er wordt goed aandacht besteed aan het verschil in vaardigheid van het beoordelen van symptomen en tekens bij het lichamelijk onderzoek tussen de verschillende artsen, beginnende en onervaren artsen tegenover doorgewinterde "alte Hasen". Juist bij het lichamelijk onderzoek kan de dokter opgevat worden als "de test" en zullen sensitiviteit en specificiteit van dezelfde symptomen en tekens verschillend zijn, wanneer ze bepaald worden bij deze verschillende groepen artsen.

 

G.W. Landman AIOS interne, dr. K.H. Groenier Huisarts geneeskunde UMCG, professor dr. R.O.B. Gans interne geneeskunde UMCG

Tjeerd
de Jongh

In hun reactie bevestigen Landman ea onze stelling dat de Likelihood-ratio misschien wel de beste maat is om aan te geven hoe de kans op een aandoening verandert door de uitkomst van een test, maar zeker geen ideale. Er zijn ons echter geen nadelen van de Likelihood-ratio bekend die niet ook gelden voor sensitiviteit en specificiteit.

Het begrip test omvat in feite elke informatie die een arts gebruikt om een diagnose te bevestigen of uit te sluiten, ook antwoorden op anamnesevragen vallen daaronder. Het is teleurstellend dat er zo weinig onderzoek is gedaan naar de waarde van informatie uit anamnese en lichamelijk onderzoek en inderdaad is er bijna niets bekend over combinaties van gegevens. De enige mogelijkheid is dan om deze gegevens serieel te testen en de achterafkans na de ene test te gebruiken als voorafkans voor de volgende

Dat het afkappunt belangrijk is bij het beoordelen van een test en invloed heeft op de waarde van de LR+ is juist, Bij de beschrijving van een test hoort dat afkappunt zo exact mogelijk aangegeven te worden. Bij voorkeur steeds hetzelfde afkappunt, anders zijn onderzoeken niet meer met elkaar te vergelijken. In de praktijk is dat vaak moeilijk: wanneer drinkt/plast een kind minder dan normaal als test bij dreigende dehydratie?

Ondanks het besef dat ook de Likelihoodratio's geen absolute,ultieme maten zijn,  worden zij door ons in deze serie artikelen over de waarde van het lichamelijk onderzoek gebruikt, omdat zij op eenvoudige wijze relatief betrouwbare informatie geven over die waarde.

 

Tjeerd de Jongh

Mijn complimenten met dit interessante initiatief om de waarde van anamnese en lichamelijk onderzoek op een wetenschappelijke manier te benaderen. Hoewel artsen in de praktijk veel waardering hechten aan deze basale diagnostische middelen, zijn publicaties op dit onderwerp ondervertegenwoordigd. Opvallend was toch de lage diagnostische waarde van anamnese en onderzoek voor het vaststellen van dehydratie bij ouderen, in het eerste artikel van de reeks.
In de proloog van de reeks, als ook de daarop volgende reacties van Landman e.a. en De Jongh, wordt de likelihood ratio (LR) genoemd als middel om de diagnostische waarde van anamnestische gegevens of bevindingen bij lichamelijk onderzoek te evalueren. In hun discussie geven zij allen toe dat de LR en sensitiviteit / specificiteit dezelfde nadelen hebben (afhankelijk van uitvoerder, afkappunt, populatie). Aangezien de LR een afgeleide is van de laatste 2, is dit niet meer dan logisch.

 Waarom hebben de auteurs niet gekozen om de positief voorspellende waarde (DW+)  en negatief voorspellende waarde (DW-) te vermelden? Een LR+ van 10 zou kunnen suggereren dat een diagnose met zekerheid gesteld wordt, maar bij een lage a priori kans, bijvoorbeeld 1%, wordt de DW+ maar een beetje hoger (9%). Bij een hoge a priori kans neemt de DW+ veel sterker toe. De clinicus beslist namelijk op grond van deze voorspellende waarden: als de DW- bijvoorbeeld 99% is, dan hoeft de arts geen vervolgonderzoeken te doen, aangezien de kans erg klein is dat hij iets vindt. Omgekeerd zal een DW+ van 90-95% voldoende zijn om een diagnose te bevestigen en gerichte behandeling in te zetten.
Uiteraard is zijn de voorspellende waarden gebonden aan de (prevalentie van de) populatie waarin studies zijn uitgevoerd, evenals de gebruikte afkappunten. In de evaluatie van een test moet men daarom de populatie en een eventueel afkappunt vermelden, om de voorspellende waarden in dat kader te kunnen interpreteren. Bijvoorbeeld: de DW- van een lage klinische verdenking op DVT + d-dimeer <0.5 is 99%in een ziekenhuispopulatie. Zodoende kan men concluderen dat in het ziekenhuis DVT op grond van deze "test" veilig is uit te sluiten. Of: de DW+ van het oordeel van de chirurg om appendicitis te diagnosticeren bij lichamelijk onderzoek is 80%. Bij welke DW+ men besluit te behandelen, hangt af van de ernst van de aandoening en de risico's van (over)behandeling, maar vermelding ervan in een publicatiereeks als deze is zonder meer waardevol.

 

Nick Wlazlo, arts-onderzoeker Interne Geneeskunde, Catharina Ziekenhuis Eindhoven

Tjeerd
de Jongh

Collega Wlazio heeft groot gelijk wanneer hij in zijn reactie schrijft dat positief en negatief voorspellende waarde zeer belangrijke maten van een test zijn, die een diagnose zo (on) waarschijnlijk kunnen maken dat het beleid daar direct uit volgt.

Toch zijn er goede redenen waarom wij in het boek Fysische Diagnostiek en in deze serie artikelen in het NTv|G, die daarop zijn gebaseerd, gekozen hebben om testresultaten vooral weer te geven in positieve en negatieve Likelihoodratio's.

De voorspellende waarde van een test voor een afwijking is direct gekoppeld aan de voorafkans op die afwijking en dus aan de onderzochte populatie. Het vermelden van de voorspellende waarde van een test op een ernstige afwijking, zoals deze bekend is uit een ziekenhuispopulatie is buitengewoon verwarrend voor een huisarts die deze test toepast in een (eventueel asymptomatische) populatie.De gevonden voorspellende waarde heeft voor hem geen enkele betekenis. Het is een bekende valkuil dat de waarde van tests in een ziekenhuispopulatie, met veel ernstige aandoeningen, geextrapoleerd wordt naar een extramurale populatie waar die waarde niet geldt.

Omdat wij in het boek de waarde van testen willen aangeven in allerlei verschillende populaties hebben wij gekozen voor likelihoodratio's, die alleen de verandering van de kans (eigenlijk odd's) op een afwijking weergeven, onafhankelijk van de voorafkans. In de beschrijving vermelden wij dan hoeveel de kans op de aandoening (in geringe mate, duidelijk, sterk of zeer sterk) toe- of afneemt.

Een praktisch punt is dat in de literatuur de waarde van diagnostische tests (bijna) altijd in likelihood ratio's wordt weergegeven(1). Aangezien het boek en deze serie gebaseerd is op deze literatuur gebruiken wij bij voorkeur dezelfde parameters als uitkomst.

 

TOH de Jongh

 

1. McGee SR. Evidence Based Physical Diagnosis.2e druk 2007. Saunders-Elsevier