Maak onderscheid tussen prevalentie en functie

Interpretatie van spirometrie

Opinie
Joost G. van den Aardweg
Citeer dit artikel als
Ned Tijdschr Geneeskd. 2014;158:A7529
Abstract
Download PDF

artikel

‘Is deze uitslag afwijkend of niet?’ Dat is de eerste vraag die opkomt wanneer we bij patiënten iets meten. Het belang hiervan is dat een afwijkende waarde vaak wordt gezien als een oorzaak van de klachten. Bij longfunctiemetingen is de grens tussen ‘afwijkend’ en ‘niet-afwijkend’ een terugkerend onderwerp van discussie. Toch is dat in de praktijk meestal oplosbaar, zolang we (a) een duidelijk onderscheid maken tussen een afwijking van de referentiewaarden en een functiestoornis, en (b) gebruikmaken van iets dat ‘het gezonde verstand’ genoemd kan worden.

Wanneer spreken we van luchtwegobstructie?

Iedere luchtweg heeft een bepaalde weerstand. De grens tussen een niet-afwijkende en afwijkende luchtwegobstructie is dus altijd arbitrair. Het ligt voor de hand deze grens te baseren op metingen bij gezonde en zieke personen. Een veelgebruikte maat voor luchtwegobstructie is de FEV1/FVC-ratio, die wordt bepaald tijdens een geforceerde uitademing. Het is de maximale hoeveelheid uitgeademde lucht in 1 seconde, gedeeld door de totale hoeveelheid uitgeademde lucht.

Bij gezonde jonge volwassenen is deze ratio gemiddeld circa 0,83.1 Volgens het Global Initiative for Obstructive Lung Disease komt een waarde < 0,70 (na luchtwegverwijding) overeen met een afwijkende luchtwegobstructie.2 Bij de meeste gezonde jonge volwassenen is de FEV1/FVC-ratio inderdaad > 0,70.1,2 Een FEV1/FVC-ratio < 0,70 wordt echter gevonden bij ongeveer 10-25% van de gezonde 70-plussers.3,4

Een nieuw overkoepelend referentiewaardensysteem

Recent werd een nieuw referentiewaardensysteem voorgesteld door het Global Lung Function Initiative (GLI), waarin gegevens uit een groot aantal onderzoeken zijn verwerkt en dat is gebaseerd op > 97.000 metingen bij gezonde niet-rokers van 2,5-95 jaar.5 Het GLI-systeem levert naast voorspelde waarden voor verschillende spirometrische parameters ook het 5e percentiel (P5). Dit is afhankelijk van de leeftijd, de lengte, het geslacht en het ras (Kaukasisch, Afro-Amerikaans, Noord- en Zuidoost-Aziatisch).

Omdat de GLI-referentiewaarden van toepassing zijn op uiteenlopende populaties, lijkt het zinnig deze ook in Nederland in te voeren. Daarbij kan P5 gebruikt worden als ondergrens van ‘normaal’. Dat is een arbitraire grens, maar wel een waarvan we weten wat die betekent: per definitie heeft slechts 5% van de gezonde populatie een lagere waarde (figuur a). Dat voorkomt dat we bij 10-25% van de asymptomatische ouderen ten onrechte concluderen dat zij een afwijkende bronchusobstructie hebben.

Figuur 1

Elders in dit tijdschrift wordt in een onderzoek aannemelijk gemaakt dat invoering van de GLI-referentiewaarden geen grote verschillen oplevert vergeleken met de referentiewaarden die tot nu toe werden gebruikt.6 Een beperking van dit onderzoek is echter dat de patiënten geordend werden naar de ‘diagnose’ op het aanvraagformulier voor het longfunctieonderzoek, wat lang niet altijd overeenkomt met de werkelijke diagnose. Het blijft dus onduidelijk in hoeverre het referentiewaardensysteem leidt tot terechte of onterechte diagnosen.

De auteurs propageren ook het gebruik van de z-score op basis van het GLI-referentiewaardensysteem. Dat is het aantal standaarddeviaties dat de gemeten waarde verwijderd is van de voorspelde waarde, uitgaande van een normale verdeling. P5 komt overeen met een z-score van -1,64 (figuur a). Hoewel de z-score aangeeft waar een meting staat ten opzichte van de gezonde populatie, is het geen handige maat voor het interpreteren van longfunctiegegevens. Het geldt alleen voor een normale verdeling, terwijl de meeste variabelen in het GLI-systeem pas normaal verdeeld zijn na een non-lineaire transformatie.5

Bij veel patiënten worden waarden gemeten ver buiten het bereik van de gezonde populatie, zodat een score gebaseerd op de spreiding van de gezonde populatie niet zo veel zegt. Het belangrijkste probleem is echter dat de ernst van de functionele beperking losstaat van de spreiding van de gezonde populatie, wat de basis van de z-score is.

Eenvoudige manier om functiestoornis in te schatten

Een inzichtelijke manier om een functionele beperking in te schatten is een variabele die min of meer lineair gerelateerd is aan de mate van beperking uit te zetten op een schaal van 0 (totale uitval) tot 100% (het gemiddelde van de gezonde populatie). Iedereen kan zich direct een voorstelling maken bij een waarde van 25% (‘ernstig gestoord’) of 75% (‘licht beperkt’).

De mate van functionele beperking wordt niet bepaald door de spreiding binnen de gezonde populatie. Bij een geringe spreiding hebben de meeste gezonde mensen ongeveer dezelfde functie. Bij een grote spreiding loopt de functionele toestand binnen de gezonde populatie meer uiteen. In figuur a ligt een FEV1/FVC-ratio van 50% van voorspeld 4 standaarddeviaties onder het gemiddelde (z-score van -4). In figuur b is de spreiding 2 maal zo groot en komt dezelfde functie overeen met een z-score van -2. Een relatief grotere spreiding van de FEV1/FVC-ratio komt bijvoorbeeld voor op hoge leeftijd.

Tezamen met de lagere voorspelde waarde bij ouderen betekent dit dat bij mensen die we als ‘niet-afwijkend’ betitelen (waarde > P5), vaker een functionele beperking voorkomt dan bij jongeren. Kennelijk worden deze beperkingen geaccepteerd, want ze worden gevonden bij een groep ouderen zonder klachten.

Het gezonde verstand, ofwel het theorema van Bayes

Wanneer we de FEV1/FVC-ratio gebruiken als een test voor bronchusobstructie, leidt de gekozen ondergrens onvermijdelijk tot vals-positieve en vals-negatieve uitslagen. De testuitslag moet dan ook geïnterpreteerd worden in het licht van de voorafkans. Dit volgt uit het bekende theorema van Bayes, een regel voor voorwaardelijke kansen.7 Het is een manier om ‘met gezond verstand’ naar een testuitslag te kijken. Voor de meeste longziekten is onduidelijk hoe vaak zij gepaard gaan met longfunctiewaarden in het niet-afwijkende gebied (vals-negatieve uitslagen). Wanneer P5 gebruikt wordt als ondergrens, weten we wel iets over de vals-positieve uitslagen (namelijk < 5% van de gezonde populatie).

Conclusie

Een percentiel van de gezonde populatie, bijvoorbeeld P5, is een goede grens voor het onderscheid tussen een niet-afwijkende en afwijkende longfunctie. Voor het inschatten van de ernst van de functiestoornis geeft het vertrouwde gebruik van het percentage van de voorspelde waarde het meeste inzicht. Dit geniet de voorkeur boven de z-score.

Literatuur
  1. Roca J, Burgos F, Sunyer J, et al. Reference values for forced spirometry. Eur Respir J. 1998;11:1354-62 Medline. doi:10.1183/09031936.98.11061354

  2. Vestbo J, Hurd SS, Augustí AG, et al. Global strategy for the diagnosis, management, and prevention of chronic obstructive pulmonary disease. Am J Respir Crit Care Med. 2013;187:347-65 Medline. doi:10.1164/rccm.201204-0596PP

  3. Hansen JE, Sun XG, Wasserman K. Spirometric criteria for airway obstruction: use percentage of FEV1/FVC ratio below the fifth percentile, not < 70%. Chest. 2007;131:349-55 Medline. doi:10.1378/chest.06-1349

  4. Swanney MP, Ruppel G, Enright PL, et al. Using the lower limit of normal for the FEV1/FVC ratio reduces the misclassification of airway obstruction. Thorax. 2008;63:1046-51 Medline. doi:10.1136/thx.2008.098483

  5. Quanjer PH, Stajonevic S, Cole TJ, et al. Multi-ethnic reference values for spirometry for the 3-95-yr age range: the global lung function 2012 equations. Eur Respir J. 2012;40:1324-43 Medline. doi:10.1183/09031936.00080312

  6. Quanjer PH, Stam H, Mertens FW, de Jongste JC, Chavannes NH, Hoogsteden HC. Eigentijdse interpretatie van longfunctiegegevens. Ned Tijdschr Geneeskd. 2014;158:A7031.

  7. Papoulis A. Bayes’ Theorem in statistics. In: Papoulis A. Probability, random variables and stochastic processes. 2e dr. New York: McGraw-Hill; 1984. p. 38-79.

Auteursinformatie

Medisch Centrum Alkmaar, afd. Longziekten, Alkmaar.

Contact Dr. J.G. van den Aardweg, longarts (j.g.vanden.aardweg@mca.nl)

Verantwoording

Belangenconflict en financiële ondersteuning: geen gemeld.
Aanvaard op 26 februari 2014

Auteur Belangenverstrengeling
Joost G. van den Aardweg ICMJE-formulier
Eigentijdse interpretatie van longfunctiegegevens
Heb je nog vragen na het lezen van dit artikel?
Check onze AI-tool en verbaas je over de antwoorden.
ASK NTVG

Ook interessant

Reacties

 

Bij de beoordeling van spirometrische gegevens wordt traditioneel de gemeten waarde omgezet in procent van de voorspelde waarde. Hiermee wordt beoogd een maat te gebruiken die onafhankelijk is van leeftijd, lengte, geslacht en etnische groep. Gramprey1 stelde vermoedelijk als eerste deze transformatie voor. Het werd vermoedelijk gemeengoed door het advies van Bates and Christie2: "a useful general rule is that a deviation of 20% from the predicted normal value probably is significant". Sobol schreef hier over: “Nowhere else in medicine is such a naive view taken of the limit of normal.”3 Het is al lang bekend dat het gebruik van procent voorspeld leidt tot beoordelingsfouten.3-5 Miller5 adviseerde daarom, conform het advies van de Europese Gemeenschap voor Kolen en Staal,6 de z-score te gebruiken dat niet de bezwaren van procent voorspeld kent. Het gebruik van procent voorspeld werd vervolgens afgeraden door alle grote internationale wetenschappelijke verenigingen van pulmonologen.7-12

 

Wat zijn de voor- en nadelen van %voorspeld en z-score? De laatste geeft aan hoe veel keer de spreiding, uitgedrukt als standaard deviatie (SD), een waarneming verschilt van de voorspelde waarde. Omdat hierbij rekening wordt gehouden met leeftijd, lengte, geslacht en etnische groep, is de z-score daarvan onafhankelijk. Zoals uit richtlijnen van alle grote internationale verenigingen van pulmonologen blijkt6-12 is er consensus dat meetresultaten die vallen buiten het 90% of 95% referentie-interval als passend bij pathologie kunnen worden geduid. Omdat FEV1 en FVC bij pathologie vrijwel alleen maar te klein kunnen uitvallen wordt het 5de percentiel (P5) als ‘ondergrens van normaal’ (LLN) aanbevolen; per definitie komt een waarneming beneden dat percentiel bij 5% van een gezonde populatie voor. P5 komt overeen met een z-score van -1.64. Wij kunnen nu P5 bij verschillende leeftijden uitdrukken als procent van de voorspelde waarde (figuur 1). Hieruit blijkt dat 80% van de voorspelde waarde bij jonge mensen vrijwel overeen komt met de ‘ondergrens van normaal’, maar bij een bejaarde daar ver boven ligt. Daarentegen valt bij jonge mensen 73% van voorspeld ver onder maar bij bejaarden binnen het normale bereik. Het gebruik van %voorspeld leidt dus tot een leeftijdsgebonden bias en een potentieel aanzienlijke beoordelingsfout, bijv. van de ernst van een afwijking, in tegenstelling tot de z-score.

         Van den Aardweg komt tot een tegenovergestelde conclusie11. Hij baseert deze op een hypothetische situatie waarbij in verschillende populaties de spreiding om de voorspelde waarde een factor twee verschilt terwijl de voorspelde waarde dezelfde is. Uit het GLI-onderzoek,12 dat is gebaseerd op gegevens van 74.187 gezonde niet-rokers in 5 werelddelen, is duidelijk dat zo’n situatie zich niet voordoet. Weliswaar zijn voorspelde waarden verschillend tussen vier in het GLI rapport onderzochte etnische groepen, maar zowel de voorspelde waarde als de spreiding verschillen proportioneel. Zoals uit figuur 1 blijkt, ontleend aan 57.395 gezonde blanken,12 werkt het dus net andersom dan van den Aardweg veronderstelt: geen bias bij de z-score, wel bij procent voorspeld.

      Bij volwassenen neemt de voorspelde waarde met de leeftijd aanzienlijk maar de spreiding zeer weinig af (tabel 1). Als een waarneming 1 SD van de voorspelde waarde verschilt komt dit op elke leeftijd overeen met een verschil van 1  z-score; tegelijkertijd verdubbelt bij volwassenen diezelfde afwijking uitgedrukt als procent voorspeld (tabel 1), zodat er een sterke leeftijdsbias is. Het advies van van den Aardweg om de z-score niet maar procent voorspeld wel te gebruiken bij de beoordeling van een patiënt berust op een hypothetische situatie die zich in de praktijk niet voordoet; het staat ook haaks op het advies van alle grote internationale pulmonologische organisaties6-12.

 

FEV1 als procent van de voorspelde waarde wordt overigens tot nog toe wel gebruikt om de ernst van een stoornis te classificeren. Dat deze classificatie door de leeftijdsbias te wensen over laat t.o.v. de z-score blijkt uit tabel 1 en figuur 1. Uitslagen van longfunctie-onderzoek zijn niet pathognomonisch voor een diagnose maar kunnen hooguit tot een classificatie “obstructie”, “reversibel” of “restrictief patroon” leiden; daarom staan de resultaten van ons onderzoek los van enige klinische diagnose. Zowel FEV1 als z-score correleren slecht met klinische symptomen, morbiditeit en mortaliteit en zijn daarom niet bij uitstek geschikt om de klinische ernst van een aandoening te classificeren. Andere multi-dimensionele indices zijn ontwikkeld die wel rekening houden met comorbiditeit en klinische verschijnselen. Een voorbeeld daarvan is de BODE index voor COPD, die beter in staat is om ziekenhuisopname en mortaliteit te voorspellen dan FEV1.14 Dit illustreert ten overvloede dat meetgegevens altijd in een klinische context moeten worden geïnterpreteerd; een arts dient immers de patiënt en niet de getallen te behandelen.

 

 

Philip Quanjer

 

 

Literatuur

  1. Gramprey J. Les valeurs “dites normales” en spirographie. Rev méd Nancy 1954; 79: 648-657.
  2. Bates DV, Christie RV. (1964). Respiratory Function in Disease, p. 91. Saunders, Philadelphia and London.
  3. Sobol BJ, Sobol PG. Per cent of predicted as the limit of normal in pulmonary function testing: a statistically valid approach. Editorial. Thorax 1979; 34: 1-3.
  4. Sobol  BJ, Weinheimer B. Assessment of ventilatory abnormality in the asymptomatic subject: an exercise in futility. Thorax 1966; 21: 445-449.
  5. Miller MR. Predicted values: how should we use them? Editorial. Thorax 1988; 43: 265-267.
  6. Quanjer PH, ed. Standardized lung function testing. Report Working Party Standardization of Lung Function Tests. European Community for Coal and Steel. Bull Eur Physiopathol Respir 1983; 19 suppl. 5: 45-51
  7. Official Statement of the American Thoracic Society. Lung function testing: selection of reference values and interpretative strategies. Am Rev Resp Dis 1991; 144: 1202-1218.
  8. Quanjer PhH, Tammeling GJ, Cotes JE, Pedersen OF, Peslin R, Yernault JC. Lung volumes and forced ventilatory flows. Official Statement of the European Respiratory Society. Eur Respir J 1993; 6 suppl. 16: 5-40.
  9. Miller MR, Hankinson J, Brusasco V, Burgos F, Casaburi R, Coates A, et al. ATS/ERS Task Force Standardisation of Lung Function Testing. Standardisation of spirometry. Eur Respir J 2005; 26: 319-338.
  10. Beydon N, Davis SD, Lombardi E, Allen JL, Arets HGM, Aurora P, et al. An Official American Thoracic Society/European Respiratory Society Statement: Pulmonary Function Testing in Preschool Children. Am J Respir Crit Care Med 2007; 175: 1304–1345.
  11. Levy ML, Quanjer PH, Booker R, Cooper BG, Holmes S, Small IR. Diagnostic spirometry in primary care. Proposed standards for general practice compliant with American Thoracic Society and European Respiratory Society recommendations. Prim Care Resp J 2009; 18: 130-147.
  12. Quanjer PH, Stanojevic S, Cole TJ, et al. ERS Task Force report. Multi-ethnic reference values for spirometry for the 3-95-yr age range: the global lung function 2012 equations. Eur Respir J. 2012; 40: 1324–1343.
  13. Van den Aardweg JG. Interpretatie van spirometrie. Ned Tijdschr Geneesk 2014;158: A7529.
  14. Celli BR, Cote CG, Lareau SC, Meek PM. Predictors of Survival in COPD: more than just the FEV1. Respir Med 2008, 102: S27-35
Joost G.
van den Aardweg

Het gaat vooral om het nulpunt

 

In zijn reactie van 21-3-2014 stelt collega Quanjer opnieuw voor om een percentiel van de gezonde populatie (bijvoorbeeld P5) te gebruiken als grens tussen een afwijkende en niet-afwijkende longfunctie. Daar ben ik het geheel mee eens. Duidelijk is dat de P5 overeenkomt met een z-score van -1,64, mits de gemeten variabele normaal verdeeld is rondom de voorspelde waarde. Voor de meeste variabelen die in het Global Lung Function Initiative bij gezonde personen worden beschreven, is dat pas het geval na een nonlineaire transformatie (1). Omdat hierover verwarring ontstond: het gaat om de transformatie van de longfunctievariabele x naar x’ :

                                          x’ = P + {(x/P)^L - 1}P/L.

Hier is P de predicted value en L een parameter die de scheefheid van de verdeling van x weergeeft. De getransformeerde variabele x’ is bij benadering normaal verdeeld.

 

De vraag of iemand wel of niet tot de gezonde populatie behoort, is echter niet precies hetzelfde als de vraag hoe ernstig de functie gestoord is. Daartoe is het handig om de gemeten variabele x zodanig uit te drukken dat de ernst van de stoornis direct duidelijk wordt. Dat is het geval wanneer x = 0 en x = 1 een duidelijke functionele betekenis hebben. Hieraan wordt voldaan wanneer x wordt uitgedrukt als fractie van de voorspelde waarde. Het nulpunt (x = 0) komt dan overeen met een totale uitval. Het heeft in die zin een universele functionele betekenis. Het is voor iedereen, onafhankelijk van ras of geslacht of wat dan ook, gelijk. Het dient als een anker bij de interpretatie. Wanneer x wordt uitgedrukt als fractie van voorspeld, heeft x = 1 ook een functionele betekenis: de functie is dan namelijk zoals verwacht.

 

Bij de z-score ‘zweeft’ het nulpunt: het komt overeen met de voorspelde waarde (die wisselt, afhankelijk van de eigenschappen van de patient). Weliswaar levert dat ook informatie op over de functie, maar dat geldt niet voor het punt waar x = 1. Bij de z-score wordt x = 1 bepaald door de standaarddeviatie van de normale populatie, wat geen directe functionele betekenis heeft.

 

Collega Merkus dank ik voor zijn reactie (27-3-2014). Ik denk echter niet dat er veel mensen zullen zijn die een percentiel verwarren met een percentage.

 

 

Joost van den Aardweg, longarts

  1. Quanjer PH, Stajonevic S, Cole TJ, et al. Multi-ethnic reference values for spirometry for the 3-95-yr age range. Eur Respir J. 2012;40:1324-43.