Samenvatting
Doel
De bepaling van de positief voorspellende waarde (PVW) voor borstkanker van de eindcategorieën van mammografieverslagen, zoals aanbevolen in het ‘Breast imaging reporting and data system’ (BI-RADS) ten behoeve van kwaliteitsbewaking.
Opzet
Retrospectieve follow-upstudie.
Methode
In de periode juni 2000-mei 2001 werden 2762 mammografieën verricht; 654 (23,7) werden aangevuld met echografie, die werd betrokken bij de eindconclusie. Het verslag werd afgesloten met een eindcategorie volgens de BI-RADS-classificatie, waarmee een inschatting van de kans op maligniteit werd gegeven. Follow-upgegevens werden verkregen via het Ziekenhuis Informatie Systeem (pathologiediagnose: n = 215; resultaten van aanvullend onderzoek: n = 1477) en het Pathologisch-Anatomisch Landelijk Geautomatiseerd Archief (PALGA) (n = 1070).
Resultaten
De prevalentie van het mammacarcinoom was 4,1; er waren 17 fout-negatieve diagnosen. De PVW van categorie BI-RADS 1 (‘normaal’) was 0,3, van categorie BI-RADS 2 (‘benigne’) 0,6, van categorie BI-RADS 3 (‘waarschijnlijk benigne’) 3,9, van categorie BI-RADS 4 (‘verdachte bevinding’) 52,7 en BI-RADS 5 (‘zeer verdachte bevinding’) 100. De waarden van de laatste drie categorieën lagen hoger dan in de Amerikaanse literatuur. Dit kon deels worden verklaard door een verschil in benadering: hier lag meer nadruk op het vermijden van onnodige ingrepen bij een fout-positieve bevinding, terwijl in de VS het risico op een fout-negatief onderzoek zwaarder weegt.
Conclusie
Het toepassen van de BI-RADS-categorieën gaf naast duidelijkheid in de patiëntenzorg ook inzicht in de bijdrage van de radiologie binnen het mammateam.
(Geen onderwerp)
Rotterdam, oktober 2004,
Een retrospectieve evaluatie van mammadiagnostiek zoals die van Zonderland et al. (2004:2077-83) verdient brede navolging. De keuze van hun kwaliteitsmaat, de voorspellende waarde (hier: de kans op mammacarcinoom gegeven een bepaalde classificatie volgens het ‘Breast imaging reporting and data system’; BI-RADS), is echter minder gelukkig. Deze maat wordt niet alleen door de kwaliteit van beoordeling beïnvloed, maar tevens door de prevalentie van mammacarcinoom. Bij de BI-RADS-classificatie wordt een ordinale schaal gebruikt en dan is de likelihoodratio (LR) voor het beschrijven van de diagnostische kwaliteit verreweg te prefereren.1 Deze evaluatiemaat wordt niet door de prevalentie beïnvloed en maakt het onderscheidend vermogen ten aanzien van benigne en maligne mamma-afwijkingen duidelijk voor elk van de BI-RADS-categorieën: bij een waarde LR = 1 is de test niet onderscheidend voor benigne en maligne afwijkingen, een waarde dicht bij 0 maakt een benigne mamma-afwijking het aannemelijkst, en een zeer hoge waarde maakt een mammacarcinoom zeer waarschijnlijk. De voorspellende waarde van elke BI-RADS-categorie voor mammacarcinoom kan met de LR en de a-priorikans of eventueel de ‘prior odds’ eenvoudig worden berekend.1
Wanneer de data uit tabel 2 van Zonderland et al. worden bewerkt voor berekening van de LR, ziet de tabel er als volgt uit (afgerond op 2 cijfers na de komma):
In de eerste en tweede rij staan de kansen op die BI-RADS-categorie, gegeven de diagnose ‘mammacarcinoom’ respectievelijk ‘benigne mamma-afwijking’. De LR is in elke kolom het quotiënt van deze twee kansen (bijvoorbeeld bij categorie BI-RADS 1: de kans op die classificatie gegeven de diagnose ‘mammacarcinoom’ is 0,04 en gegeven de diagnose ‘benigne mamma-afwijking’ 0,58, dus LR = 0,04/0,58 = 0,08).
Het gebruik van de LR heeft duidelijk voordelen in vergelijking met de door Zonderland et al. gekozen weg van de voorspellende waarde. In de eerste plaats is de LR het geschiktst om de kwaliteit van elke BI-RADS-categorie apart te meten en deze maat wordt niet beïnvloed door de prevalentie van mammacarcinoom. In de tweede plaats maakt de LR het mogelijk om de mammografische accuratesse van radiodiagnostische afdelingen van verschillende ziekenhuizen te vergelijken en daarbij kan men zich spiegelen aan een gedefinieerde (minimum)norm, wat een objectieve kwaliteitstoetsing bevordert. Ook vergelijking met de in de literatuur gepubliceerde evaluaties is mogelijk.2
Het verschil tussen de twee benaderingen is het duidelijkst bij de categorie BI-RADS 3. De auteurs noemen hiervoor als voorspellende waarde 3,9%. De LR van categorie BI-RADS 3 is echter bijna 1 en is dus niet of nauwelijks onderscheidend. Binnen de totale onderzoeksgroep was de kans op borstkanker 4,1%. De kans op ziekte is dus voor en en na testen bij categorie BI-RADS 3 niet of nauwelijks veranderd. Het beleid dat men bij deze klasse 3 moet volgen, zal dan vooral bepaald worden door de a-priorikans op mammacarcinoom en die is grotendeels een functie van de leeftijd.
De auteurs laten in deze studie zien dat evaluatieonderzoek van mammografie met behulp van informatiesystemen van zowel het ziekenhuis als de pathologen (Pathologisch-Anatomisch Landelijk Geautomatiseerd Archief) geen zware opgave is. Daarom verdient deze studie navolging en daarbij biedt de LR de beste mogelijkheden voor evaluatie en vergelijking.
Giard RWM, Hermans J. The diagnostic information of tests for the detection of cancer: the usefulness of the likelihood ratio concept. Eur J Cancer 1996;32A:2042-8.
Devillé WLJM, Bossuyt PMM, Vet HCW de, Bezemer PD, Bouter LM, Assendelft WJJ. De praktijk van systematische reviews. X. Zoeken, selecteren en methodologisch beoordelen van diagnostisch evaluatieonderzoek. [LITREF JAARGANG="2002" PAGINA="2281-4"]Ned Tijdschr Geneeskd 2002;146:2281-4.[/LITREF]
(Geen onderwerp)
Leiden, november 2004,
De suggestie van collega Giard om de LR te gebruiken bij het evalueren van de classificatie van mammografie-uitslagen is een zeer nuttige aanvulling op de door ons gepresenteerde studie. Doordat deze maat niet wordt beïnvloed door de prevalentie, is ze zeer geschikt om de resultaten te vergelijken van verschillende instellingen, bijvoorbeeld kankerinstituten versus algemene ziekenhuizen, of om een vergelijking te trekken tussen de resultaten die worden behaald in gezondheidssystemen in verschillende landen.
Het BI-RADS is in de VS ontwikkeld en bevat een serie aanbevelingen om iedere radioloog in staat te stellen zijn of haar kwaliteiten te meten. Het berekenen van de positief voorspellende waarde (PVW) van de eindcategorieën is daarvan een belangrijk onderdeel. Ten behoeve van de regels die in de VS gelden voor de screeningspraktijk zijn berekeningen van de PVW's van de eindcategorieën 4 en 5 zelfs verplicht gesteld. In onze studie hebben wij in deze lijn gehandeld.
Daarnaast werpt de berekening van de PVW van de diverse eindcategorieën een ander licht op de resultaten dan de LR, en dat komt inderdaad het duidelijkst tot uiting in de categorie BI-RADS 3. Terwijl men op grond van de LR zou kunnen concluderen dat deze categorie net zo goed afgeschaft zou kunnen worden (de LR is immers niet of nauwelijks onderscheidend), wijst de PVW ons erop dat deze categorie toch bestaansrecht heeft. De diversiteit van diagnostische bevindingen in de mammadiagnostiek is groot; ze kunnen niet simpel opgesplitst worden in ‘goedaardig’ en ‘verdacht’. Er zal behoefte blijven bestaan aan een tussenweg, ook al is deze behoefte per radioloog verschillend. Het gegeven dat de PVW van categorie BI-RADS 3 statistisch significant hoger is dan die van categorie BI-RADS 1 en 2 past hierbij. Alleen al de evaluatie van de PVW van deze eindcategorie kan inzicht geven in de mate waarin een radioloog een ‘underreader’ of ‘overreader’ is; met andere woorden, ze is onmisbaar als kwaliteitsinstrument binnen één ziekenhuis. De toetsing van dit instrument was het primaire doel van onze follow-upstudie.