De voorspellende waarde van classificatie van mammografie-uitslagen volgens het 'Breast imaging reporting and data system' (BI-RADS): retrospectief follow-uponderzoek in een ziekenhuispopulatie

To evaluate the positive predictive value (PPV) of the final assessment categories of the ‘Breast Imaging Reporting and Data System’ (BI-RADS) in order to assess diagnostic performance in breast cancer diagnosis.

Design

Retrospective follow-up study.

Method

In the period June 2000-May 2001 a total of 2,762 mammograms were included in the study. Additional ultrasound was performed in 654 patients (23,7). The reports were assigned a BI-RADS category, which included risk assessment information. Follow-up data were obtained from the Ziekenhuis Informatie Systeem (hospital information system) (pathology diagnosis: n = 215; follow-up examination: n = 1477) and from data obtained from PALGA, a nationwide network and registry of histo- and cytopathology in the Netherlands (n = 1070).

Results

The prevalence of breast cancer was 4.1. In 17 cases there was a false-negative diagnosis. The PPV of BI-RADS 1 (‘normal’) was 0.3, BI-RADS 2 (‘benign’) was 0.6, BI-RADS 3 (‘probably benign’) was 3.9, BI-RADS 4 (‘suspicious’) was 52.7 and BI-RADS 5 (‘highly suggestive of malignancy’) was 100. The PPVs of BI-RADS categories 3, 4 and 5 were high, compared with American studies. This may reflect the fact that in American studies the fear of a false-negative diagnosis prevails over the risk of a false-positive diagnosis, while in the Netherlands more value is attached to keeping the number of unnecessary biopsies to a minimum.

Conclusion

The application of the BI-RADS categories improved the clarity of mammography reporting and enabled analysis of the diagnostic performance of mammography and ultrasound investigation in the diagnosis of breast cancer.

Samenvatting

Doel

De bepaling van de positief voorspellende waarde (PVW) voor borstkanker van de eindcategorieën van mammografieverslagen, zoals aanbevolen in het ‘Breast imaging reporting and data system’ (BI-RADS) ten behoeve van kwaliteitsbewaking.

Opzet

Retrospectieve follow-upstudie.

Methode

In de periode juni 2000-mei 2001 werden 2762 mammografieën verricht; 654 (23,7) werden aangevuld met echografie, die werd betrokken bij de eindconclusie. Het verslag werd afgesloten met een eindcategorie volgens de BI-RADS-classificatie, waarmee een inschatting van de kans op maligniteit werd gegeven. Follow-upgegevens werden verkregen via het Ziekenhuis Informatie Systeem (pathologiediagnose: n = 215; resultaten van aanvullend onderzoek: n = 1477) en het Pathologisch-Anatomisch Landelijk Geautomatiseerd Archief (PALGA) (n = 1070).

Resultaten

De prevalentie van het mammacarcinoom was 4,1; er waren 17 fout-negatieve diagnosen. De PVW van categorie BI-RADS 1 (‘normaal’) was 0,3, van categorie BI-RADS 2 (‘benigne’) 0,6, van categorie BI-RADS 3 (‘waarschijnlijk benigne’) 3,9, van categorie BI-RADS 4 (‘verdachte bevinding’) 52,7 en BI-RADS 5 (‘zeer verdachte bevinding’) 100. De waarden van de laatste drie categorieën lagen hoger dan in de Amerikaanse literatuur. Dit kon deels worden verklaard door een verschil in benadering: hier lag meer nadruk op het vermijden van onnodige ingrepen bij een fout-positieve bevinding, terwijl in de VS het risico op een fout-negatief onderzoek zwaarder weegt.

Conclusie

Het toepassen van de BI-RADS-categorieën gaf naast duidelijkheid in de patiëntenzorg ook inzicht in de bijdrage van de radiologie binnen het mammateam.

Gratis dit artikel lezen?

Maak met 2 klikken een gratis account aan

Account aanmaken

Heb je al een account of een abonnement? Inloggen

Artikelinformatie

Aanvaard op

25 februari 2004

20 oktober 2004

Citeer dit artikel als

Ned Tijdschr Geneeskd. 2004;148:2077-83

Vakgebied

Auteursinformatie

Leids Universitair Medisch Centrum, afd. Radiologie, Postbus 9600, 2300 RC Leiden.

Mw.dr.H.M.Zonderland, radioloog; hr.A.J.Nieborg, datamanager.

Medical University of South Carolina, dept. Radiology, Charleston, S.C., Verenigde Staten.

Hr.dr.T.L.Pope, radioloog.

Contact mw.dr.H.M.Zonderland (h.m.zonderland@lumc.nl)

Heb je nog vragen na het lezen van dit artikel?

Check onze AI-tool en verbaas je over de antwoorden.

ASK NTVG

Reacties

(Geen onderwerp)

Rotterdam, oktober 2004,

Een retrospectieve evaluatie van mammadiagnostiek zoals die van Zonderland et al. (2004:2077-83) verdient brede navolging. De keuze van hun kwaliteitsmaat, de voorspellende waarde (hier: de kans op mammacarcinoom gegeven een bepaalde classificatie volgens het ‘Breast imaging reporting and data system’; BI-RADS), is echter minder gelukkig. Deze maat wordt niet alleen door de kwaliteit van beoordeling beïnvloed, maar tevens door de prevalentie van mammacarcinoom. Bij de BI-RADS-classificatie wordt een ordinale schaal gebruikt en dan is de likelihoodratio (LR) voor het beschrijven van de diagnostische kwaliteit verreweg te prefereren.1 Deze evaluatiemaat wordt niet door de prevalentie beïnvloed en maakt het onderscheidend vermogen ten aanzien van benigne en maligne mamma-afwijkingen duidelijk voor elk van de BI-RADS-categorieën: bij een waarde LR = 1 is de test niet onderscheidend voor benigne en maligne afwijkingen, een waarde dicht bij 0 maakt een benigne mamma-afwijking het aannemelijkst, en een zeer hoge waarde maakt een mammacarcinoom zeer waarschijnlijk. De voorspellende waarde van elke BI-RADS-categorie voor mammacarcinoom kan met de LR en de a-priorikans of eventueel de ‘prior odds’ eenvoudig worden berekend.1

Wanneer de data uit tabel 2 van Zonderland et al. worden bewerkt voor berekening van de LR, ziet de tabel er als volgt uit (afgerond op 2 cijfers na de komma):

In de eerste en tweede rij staan de kansen op die BI-RADS-categorie, gegeven de diagnose ‘mammacarcinoom’ respectievelijk ‘benigne mamma-afwijking’. De LR is in elke kolom het quotiënt van deze twee kansen (bijvoorbeeld bij categorie BI-RADS 1: de kans op die classificatie gegeven de diagnose ‘mammacarcinoom’ is 0,04 en gegeven de diagnose ‘benigne mamma-afwijking’ 0,58, dus LR = 0,04/0,58 = 0,08).

Het gebruik van de LR heeft duidelijk voordelen in vergelijking met de door Zonderland et al. gekozen weg van de voorspellende waarde. In de eerste plaats is de LR het geschiktst om de kwaliteit van elke BI-RADS-categorie apart te meten en deze maat wordt niet beïnvloed door de prevalentie van mammacarcinoom. In de tweede plaats maakt de LR het mogelijk om de mammografische accuratesse van radiodiagnostische afdelingen van verschillende ziekenhuizen te vergelijken en daarbij kan men zich spiegelen aan een gedefinieerde (minimum)norm, wat een objectieve kwaliteitstoetsing bevordert. Ook vergelijking met de in de literatuur gepubliceerde evaluaties is mogelijk.2

Het verschil tussen de twee benaderingen is het duidelijkst bij de categorie BI-RADS 3. De auteurs noemen hiervoor als voorspellende waarde 3,9&percnt;. De LR van categorie BI-RADS 3 is echter bijna 1 en is dus niet of nauwelijks onderscheidend. Binnen de totale onderzoeksgroep was de kans op borstkanker 4,1&percnt;. De kans op ziekte is dus voor en en na testen bij categorie BI-RADS 3 niet of nauwelijks veranderd. Het beleid dat men bij deze klasse 3 moet volgen, zal dan vooral bepaald worden door de a-priorikans op mammacarcinoom en die is grotendeels een functie van de leeftijd.

De auteurs laten in deze studie zien dat evaluatieonderzoek van mammografie met behulp van informatiesystemen van zowel het ziekenhuis als de pathologen (Pathologisch-Anatomisch Landelijk Geautomatiseerd Archief) geen zware opgave is. Daarom verdient deze studie navolging en daarbij biedt de LR de beste mogelijkheden voor evaluatie en vergelijking.

R.W.M. Giard

Literatuur

Giard RWM, Hermans J. The diagnostic information of tests for the detection of cancer: the usefulness of the likelihood ratio concept. Eur J Cancer 1996;32A:2042-8.
Devillé WLJM, Bossuyt PMM, Vet HCW de, Bezemer PD, Bouter LM, Assendelft WJJ. De praktijk van systematische reviews. X. Zoeken, selecteren en methodologisch beoordelen van diagnostisch evaluatieonderzoek. [LITREF JAARGANG="2002" PAGINA="2281-4"]Ned Tijdschr Geneeskd 2002;146:2281-4.[/LITREF]

(Geen onderwerp)

Leiden, november 2004,

De suggestie van collega Giard om de LR te gebruiken bij het evalueren van de classificatie van mammografie-uitslagen is een zeer nuttige aanvulling op de door ons gepresenteerde studie. Doordat deze maat niet wordt beïnvloed door de prevalentie, is ze zeer geschikt om de resultaten te vergelijken van verschillende instellingen, bijvoorbeeld kankerinstituten versus algemene ziekenhuizen, of om een vergelijking te trekken tussen de resultaten die worden behaald in gezondheidssystemen in verschillende landen.

Het BI-RADS is in de VS ontwikkeld en bevat een serie aanbevelingen om iedere radioloog in staat te stellen zijn of haar kwaliteiten te meten. Het berekenen van de positief voorspellende waarde (PVW) van de eindcategorieën is daarvan een belangrijk onderdeel. Ten behoeve van de regels die in de VS gelden voor de screeningspraktijk zijn berekeningen van de PVW's van de eindcategorieën 4 en 5 zelfs verplicht gesteld. In onze studie hebben wij in deze lijn gehandeld.

Daarnaast werpt de berekening van de PVW van de diverse eindcategorieën een ander licht op de resultaten dan de LR, en dat komt inderdaad het duidelijkst tot uiting in de categorie BI-RADS 3. Terwijl men op grond van de LR zou kunnen concluderen dat deze categorie net zo goed afgeschaft zou kunnen worden (de LR is immers niet of nauwelijks onderscheidend), wijst de PVW ons erop dat deze categorie toch bestaansrecht heeft. De diversiteit van diagnostische bevindingen in de mammadiagnostiek is groot; ze kunnen niet simpel opgesplitst worden in ‘goedaardig’ en ‘verdacht’. Er zal behoefte blijven bestaan aan een tussenweg, ook al is deze behoefte per radioloog verschillend. Het gegeven dat de PVW van categorie BI-RADS 3 statistisch significant hoger is dan die van categorie BI-RADS 1 en 2 past hierbij. Alleen al de evaluatie van de PVW van deze eindcategorie kan inzicht geven in de mate waarin een radioloog een ‘underreader’ of ‘overreader’ is; met andere woorden, ze is onmisbaar als kwaliteitsinstrument binnen één ziekenhuis. De toetsing van dit instrument was het primaire doel van onze follow-upstudie.

H.M. Zonderland

T.L. Pope

A.J. Nieborg

De voorspellende waarde van classificatie van mammografie-uitslagen volgens het 'Breast imaging reporting and data system' (BI-RADS): retrospectief follow-uponderzoek in een ziekenhuispopulatie

Design

Method

Results

Conclusion

Samenvatting

Doel

Opzet

Methode

Resultaten

Conclusie

Citeer dit artikel als

Ook interessant

Richtlijn 'Screening en diagnostiek van het mammacarcinoom' (herziening)

Mammadiagnostiek: integratie pathologie en radiologie

Mammatumoren karakteriseren met VTIQ-elastografie

Reacties

(Geen onderwerp)

(Geen onderwerp)