‘Is deze uitslag afwijkend of niet?’ Dat is de eerste vraag die opkomt wanneer we bij patiënten iets meten. Het belang hiervan is dat een afwijkende waarde vaak wordt gezien als een oorzaak van de klachten. Bij longfunctiemetingen is de grens tussen ‘afwijkend’ en ‘niet-afwijkend’ een terugkerend onderwerp van discussie. Toch is dat in de praktijk meestal oplosbaar, zolang we (a) een duidelijk onderscheid maken tussen een afwijking van de referentiewaarden en een functiestoornis, en (b) gebruikmaken van iets dat ‘het gezonde verstand’ genoemd kan worden.
Wanneer spreken we van luchtwegobstructie?
Iedere luchtweg heeft een bepaalde weerstand. De grens tussen een niet-afwijkende en afwijkende luchtwegobstructie is dus altijd arbitrair. Het ligt voor de hand deze grens te baseren op metingen bij gezonde en zieke personen. Een veelgebruikte maat voor luchtwegobstructie is de FEV1/FVC-ratio, die wordt bepaald tijdens een geforceerde uitademing. Het is de maximale hoeveelheid uitgeademde lucht in…
Longfunctie als procent voorspeld leidt tot beoordelingsfout
Bij de beoordeling van spirometrische gegevens wordt traditioneel de gemeten waarde omgezet in procent van de voorspelde waarde. Hiermee wordt beoogd een maat te gebruiken die onafhankelijk is van leeftijd, lengte, geslacht en etnische groep. Gramprey1 stelde vermoedelijk als eerste deze transformatie voor. Het werd vermoedelijk gemeengoed door het advies van Bates and Christie2: "a useful general rule is that a deviation of 20% from the predicted normal value probably is significant". Sobol schreef hier over: “Nowhere else in medicine is such a naive view taken of the limit of normal.”3 Het is al lang bekend dat het gebruik van procent voorspeld leidt tot beoordelingsfouten.3-5 Miller5 adviseerde daarom, conform het advies van de Europese Gemeenschap voor Kolen en Staal,6 de z-score te gebruiken dat niet de bezwaren van procent voorspeld kent. Het gebruik van procent voorspeld werd vervolgens afgeraden door alle grote internationale wetenschappelijke verenigingen van pulmonologen.7-12
Wat zijn de voor- en nadelen van %voorspeld en z-score? De laatste geeft aan hoe veel keer de spreiding, uitgedrukt als standaard deviatie (SD), een waarneming verschilt van de voorspelde waarde. Omdat hierbij rekening wordt gehouden met leeftijd, lengte, geslacht en etnische groep, is de z-score daarvan onafhankelijk. Zoals uit richtlijnen van alle grote internationale verenigingen van pulmonologen blijkt6-12 is er consensus dat meetresultaten die vallen buiten het 90% of 95% referentie-interval als passend bij pathologie kunnen worden geduid. Omdat FEV1 en FVC bij pathologie vrijwel alleen maar te klein kunnen uitvallen wordt het 5de percentiel (P5) als ‘ondergrens van normaal’ (LLN) aanbevolen; per definitie komt een waarneming beneden dat percentiel bij 5% van een gezonde populatie voor. P5 komt overeen met een z-score van -1.64. Wij kunnen nu P5 bij verschillende leeftijden uitdrukken als procent van de voorspelde waarde (figuur 1). Hieruit blijkt dat 80% van de voorspelde waarde bij jonge mensen vrijwel overeen komt met de ‘ondergrens van normaal’, maar bij een bejaarde daar ver boven ligt. Daarentegen valt bij jonge mensen 73% van voorspeld ver onder maar bij bejaarden binnen het normale bereik. Het gebruik van %voorspeld leidt dus tot een leeftijdsgebonden bias en een potentieel aanzienlijke beoordelingsfout, bijv. van de ernst van een afwijking, in tegenstelling tot de z-score.
Van den Aardweg komt tot een tegenovergestelde conclusie11. Hij baseert deze op een hypothetische situatie waarbij in verschillende populaties de spreiding om de voorspelde waarde een factor twee verschilt terwijl de voorspelde waarde dezelfde is. Uit het GLI-onderzoek,12 dat is gebaseerd op gegevens van 74.187 gezonde niet-rokers in 5 werelddelen, is duidelijk dat zo’n situatie zich niet voordoet. Weliswaar zijn voorspelde waarden verschillend tussen vier in het GLI rapport onderzochte etnische groepen, maar zowel de voorspelde waarde als de spreiding verschillen proportioneel. Zoals uit figuur 1 blijkt, ontleend aan 57.395 gezonde blanken,12 werkt het dus net andersom dan van den Aardweg veronderstelt: geen bias bij de z-score, wel bij procent voorspeld.
Bij volwassenen neemt de voorspelde waarde met de leeftijd aanzienlijk maar de spreiding zeer weinig af (tabel 1). Als een waarneming 1 SD van de voorspelde waarde verschilt komt dit op elke leeftijd overeen met een verschil van 1 z-score; tegelijkertijd verdubbelt bij volwassenen diezelfde afwijking uitgedrukt als procent voorspeld (tabel 1), zodat er een sterke leeftijdsbias is. Het advies van van den Aardweg om de z-score niet maar procent voorspeld wel te gebruiken bij de beoordeling van een patiënt berust op een hypothetische situatie die zich in de praktijk niet voordoet; het staat ook haaks op het advies van alle grote internationale pulmonologische organisaties6-12.
FEV1 als procent van de voorspelde waarde wordt overigens tot nog toe wel gebruikt om de ernst van een stoornis te classificeren. Dat deze classificatie door de leeftijdsbias te wensen over laat t.o.v. de z-score blijkt uit tabel 1 en figuur 1. Uitslagen van longfunctie-onderzoek zijn niet pathognomonisch voor een diagnose maar kunnen hooguit tot een classificatie “obstructie”, “reversibel” of “restrictief patroon” leiden; daarom staan de resultaten van ons onderzoek los van enige klinische diagnose. Zowel FEV1 als z-score correleren slecht met klinische symptomen, morbiditeit en mortaliteit en zijn daarom niet bij uitstek geschikt om de klinische ernst van een aandoening te classificeren. Andere multi-dimensionele indices zijn ontwikkeld die wel rekening houden met comorbiditeit en klinische verschijnselen. Een voorbeeld daarvan is de BODE index voor COPD, die beter in staat is om ziekenhuisopname en mortaliteit te voorspellen dan FEV1.14 Dit illustreert ten overvloede dat meetgegevens altijd in een klinische context moeten worden geïnterpreteerd; een arts dient immers de patiënt en niet de getallen te behandelen.
Philip Quanjer
Literatuur
Interpretatie van spirometrie
Het gaat vooral om het nulpunt
In zijn reactie van 21-3-2014 stelt collega Quanjer opnieuw voor om een percentiel van de gezonde populatie (bijvoorbeeld P5) te gebruiken als grens tussen een afwijkende en niet-afwijkende longfunctie. Daar ben ik het geheel mee eens. Duidelijk is dat de P5 overeenkomt met een z-score van -1,64, mits de gemeten variabele normaal verdeeld is rondom de voorspelde waarde. Voor de meeste variabelen die in het Global Lung Function Initiative bij gezonde personen worden beschreven, is dat pas het geval na een nonlineaire transformatie (1). Omdat hierover verwarring ontstond: het gaat om de transformatie van de longfunctievariabele x naar x’ :
x’ = P + {(x/P)^L - 1}P/L.
Hier is P de predicted value en L een parameter die de scheefheid van de verdeling van x weergeeft. De getransformeerde variabele x’ is bij benadering normaal verdeeld.
De vraag of iemand wel of niet tot de gezonde populatie behoort, is echter niet precies hetzelfde als de vraag hoe ernstig de functie gestoord is. Daartoe is het handig om de gemeten variabele x zodanig uit te drukken dat de ernst van de stoornis direct duidelijk wordt. Dat is het geval wanneer x = 0 en x = 1 een duidelijke functionele betekenis hebben. Hieraan wordt voldaan wanneer x wordt uitgedrukt als fractie van de voorspelde waarde. Het nulpunt (x = 0) komt dan overeen met een totale uitval. Het heeft in die zin een universele functionele betekenis. Het is voor iedereen, onafhankelijk van ras of geslacht of wat dan ook, gelijk. Het dient als een anker bij de interpretatie. Wanneer x wordt uitgedrukt als fractie van voorspeld, heeft x = 1 ook een functionele betekenis: de functie is dan namelijk zoals verwacht.
Bij de z-score ‘zweeft’ het nulpunt: het komt overeen met de voorspelde waarde (die wisselt, afhankelijk van de eigenschappen van de patient). Weliswaar levert dat ook informatie op over de functie, maar dat geldt niet voor het punt waar x = 1. Bij de z-score wordt x = 1 bepaald door de standaarddeviatie van de normale populatie, wat geen directe functionele betekenis heeft.
Collega Merkus dank ik voor zijn reactie (27-3-2014). Ik denk echter niet dat er veel mensen zullen zijn die een percentiel verwarren met een percentage.
Joost van den Aardweg, longarts