Alle symptomen, ziektes en bijwerkingen lijken gecorreleerd

De valkuil van zoeken op internet

Illustratie van alles wat er onder de search-knop kan zitten
Thijs E. van Mens
F.A. (Erik) Klok
Marcel Levi
Citeer dit artikel als
Ned Tijdschr Geneeskd. 2023;167:D7753
Abstract
Download PDF

Veel artsen hebben de gewoonte om klinische observaties in te voeren in online zoekmachines. Daar komt vaak een aantal hits uit. Zegt een aantal online hits iets over een mogelijk verband?

Samenvatting

In toenemende mate ontwikkelen artsen de gewoonte om opmerkelijke klinische observaties in te voeren in online zoekmachines, medisch (PubMed) of anderszins (Google). Door de exponentiele groei van medische publicaties en het fenomeen publicatiebias, bestaat hierbij het risico op het leggen van klinische verbanden die er in werkelijkheid niet zijn. Een gemiddelde zoekopdracht in PubMed levert bijna altijd resultaten op, ongeacht of de ingevoerde zoektermen een plausibel verband hebben.

Om deze stelling meer wetenschappelijk te staven, hebben wij recent een studie uitgevoerd waarin we 30.000 geautomatiseerde zoekopdrachten hebben ingevoerd in PubMed, met willekeurige zoektermen uit de categorieën ‘ziekte’, ‘symptoom’ of ‘medicatie’. De uitkomst was het aantal zoekresultaten. Inderdaad gaven veel van deze volstrekt willekeurige zoekopdrachten resultaten. Enkele resultaten op PubMed betekenen op voorhand geenszins dat er een werkelijk verband is. De resultaten onderstrepen het belang van een ‘critical appraisal’ van zoekopdrachten uit de dagelijkse praktijk.

artikel

Patiënt A, een vrouw van 66 jaar, wordt opgenomen met onverklaarde rabdomyolyse. Zij gebruikt onder meer indapamide. De dienstdoende arts-assistent zoekt op PubMed naar een verband: de zoekopdracht levert 5 hits op. Er is inderdaad casuïstiek beschreven. Indapamide wordt gestopt en voor in het vervolg geregistreerd als gecontra-indiceerd.

Patiënt B, een vrouw van 42 jaar, komt op de polikliniek Interne Geneeskunde voor controle van haar diabetes mellitus type 2. Zij blijkt sinds twee dagen een eruptie van pustels in het gelaat te hebben. Het laboratoriumonderzoek laat een eosinofilie van 1,4 x 109/l (referentiewaarden: < 0,4 x 109/l) zien. Haar behandelend arts zoekt online: de zoekopdracht levert 315 PubMed-hits op en hij stelt de werkdiagnose ‘eosinofiele folliculitis’.

Het is een goede gewoonte van clinici om bij het stuiten op een onverwachte combinatie van ziektes, behandelingen of symptomen, te zoeken of de betreffende combinatie eerder is beschreven in de literatuur. Deze gewoonte is zo oud als de medische literatuur zelf, maar vormt zeker ook onderdeel van de moderne evidencebased praktijk. We doen een vluchtige online zoektocht, of zelfs een volledig uitgewerkte ‘critically appraised topic’ (CAT). Online zoekmachines zijn hiervoor onmisbaar geworden. De toenemende toegankelijk en effectiviteit van medische – bijvoorbeeld PubMed – en niet-medische zoekmachines – bijvoorbeeld Google – leert ons aan dat schijnbaar alle antwoorden binnen handbereik zijn – op zichzelf een positieve ontwikkeling. Maar ongebreideld gebruik van zoekmachines kent ook nadelen.

Vervolg patiënt A Kort na de opname blijkt de PCR-test van een keeluitstrijk positief voor influenza A. Desgevraagd had de patiënte kort voor opname bijpassende klachten doorgemaakt. Bovendien had de patiënte geen hypokaliëmie, het veronderstelde mechanisme van de beschreven rhabdomyolyse bij indapamide. De diagnose ‘influenza-geassocieerde rabdomyolyse’ wordt gesteld, een zeldzame maar bekende complicatie van een influenza A-infectie.

Vervolg patiënt B De patiënte wordt verwezen naar de dermatoloog. Het klinisch beeld is acne medicamentosa. De patiënte blijkt kort geleden te zijn begonnen met een oraal anticonceptivum combinatiepreparaat, wat inderdaad vaak acne veroorzaakt. De werkdiagnose van eosinofiele folliculitis komt te vervallen.

Een gemiddelde zoekopdracht in medische zoekmachines als PubMed levert bijna altijd resultaten op, ongeacht of de ingevoerde zoektermen een plausibel verband hebben. Voorbeelden van schijnbaar onbenullige associaties op PubMed zijn gemakkelijk gevonden: cystische fibrose en ehlers-danlossyndroom,1 darmmicrobioom en enkelbandletsel,2 lijnzaadolie en het antifosfolipidensyndroom.3

Er wordt jaarlijks circa een miljoen nieuwe artikelen geïndexeerd in MEDLINE, en dit aantal groeit exponentieel.4 Het bekende fenomeen van publicatiebias maakt dat deze medische informatie niet altijd een goede afspiegeling is van de werkelijkheid. Een opvallende combinatie van aandoeningen of symptomen bij een patiënt of een nieuwe klinische correlatie wordt al snel gepubliceerd als casuïstische beschrijving of patiëntenserie. Terwijl een negatieve studie, waarin geen verband wordt gevonden of de hypothese niet klopt, minder kans maakt op publicatie.5,6 Een onverklaard symptoom wordt gemeld als bijwerking bij een patiënt die een nieuw of zeldzaam geneesmiddel gebruikt, maar hoe vaak zou datzelfde symptoom niet voorkomen bij mensen die het middel niet gebruiken? Bovendien zijn er excessen, zoals de opkomst van ‘predator journals’,7 en zelfs computergegenereerde onzinartikelen, met als doel het frauduleus ophogen van citatiescores.8

Toename tijdens covid-19-pandemie

De covid-19-pandemie heeft deze problemen nog eens uitvergroot. Tijdens deze periode nam het aantal medische publicaties met 60% toe; de grootste stijging ooit. Tegelijkertijd werd de publicatiebias verergerd doordat redacties minder rigoureuze peerreview en redactionele bewerking accepteerden, in het belang van snelle disseminatie van de nieuwste gegevens over covid-19.9 De snelheid van de wetenschappelijke ontwikkeling was een indrukwekkend succesverhaal. Maar het leidde ook tot meer dubieuze publicaties over bijvoorbeeld de invloed van covid-19 op familiare hypercholesterolemie,10 wel of geen verminderde spermatogenese na covid-19-vaccinatie,11 en de mogelijke effectiviteit van kippensoep tegen covid-19.12

Tegen deze achtergrond van wildgroei aan medische publicaties en het verstorende effect van publicatiebias, heeft onze toenemende neiging om alles in een zoekmachine in te voeren het risico op het leggen van verbanden die er in werkelijkheid niet zijn. Veel correlaties zijn ooit beschreven, deels doordat op basis van toeval zeldzame aandoeningen samen kunnen voorkomen. Wat je ook zoekt, de kans is groot dat je het vindt.

Deze situatie heeft eerder geleid tot de stelling van een van de auteurs dat voor werkelijk alles een associatie te vinden is in PubMed. Als men twee totaal ongerelateerde aandoeningen in PubMed intypt, is de kans groot dat je een aantal artikelen vindt.13 Dit zal voor veel praktiserende clinici gevoelsmatig kloppen. Maar, het is in wezen een toetsbare hypothese. Om dit wetenschappelijk te staven, hebben wij de stelling recent onderzocht in een studie gepubliceerd in het European Journal of Internal Medicine.14

Onderzoeksopzet

De studie behelsde 30.000 volstrekt willekeurige zoekopdrachten in PubMed. De zoekopdrachten hadden de vorm: “zoekterm”[title/abstract] AND “zoekterm”[title/abstract]. De combinatie van zoektermen bestonden uit de categorieën ‘ziekte’ en ‘ziekte’, ‘ziekte’ en ‘symptoom’ of ‘symptoom’ en ‘medicijn’, de laatste als generieke zoekstrategie naar bijwerkingen.

De bronnen voor de individuele zoektermen waren de volgende openbaar beschikbare databestanden. Voor ziektes gebruikten we een lijst van 362 aandoeningen van NHS Inform, de nationale gezondheidsinformatie dienst van Schotland. Voor symptomen gebruikten we circa 14.000 unieke bijwerkingen gerapporteerd aan het U.S. Food and Drug Administration Adverse Events Reporting System in het derde kwartaal van 2022. En voor medicijnen gebruikten we alle 876 geneesmiddelen die momenteel zijn goedgekeurd door het Europees Geneesmiddelenbureau (EMA) voor gebruik bij mensen. Uit deze lijsten werden telkens op geautomatiseerde en willekeurige wijze termen geselecteerd en ingevoerd in PubMed in de genoemde combinaties.

Het aantal zoekresultaten was de uitkomst. Het grote aantal herhalingen, 10.000 per categorie, en de willekeurige selectie uit uitgebreide lijsten van vooraf ongerelateerde zoektermen, creëerden als het ware de achtergrondfrequentie van aantal PubMed-hits. Een kanttekening is dat dit niet een steekproevenverdeling is van zoektermen in de frequenties zoals PubMed-gebruikers die daadwerkelijk invoeren, maar op willekeurige wijze geselecteerd. Alle gebruikte aandoeningen zijn wel veelvoorkomend.

Resultaten

De resultaten zijn onder meer uit te drukken in histogrammen – zie hiervoor het oorspronkelijke artikel – en als het 95e percentiel van het aantal zoekresultaten. Die 95e percentielen met de bijbehorende interpretatie staan weergegeven in tabel 1. Het betrof 4 zoekresultaten voor een zoekopdracht naar een ziektebeeld en een symptoom, 80 voor twee ziektebeelden, en 3 voor een symptoom en medicatie. Dat betekent bijvoorbeeld dat als gezocht wordt naar de correlatie tussen twee ziektebeelden, de zoekopdracht op basis van toeval al 95% kans heeft om tot 80 hits – dus tussen 0 en 80 – te produceren. Slechts 5% van dergelijke zoekopdrachten levert meer dan 80 resultaten op. Respectievelijk 88%, 64% en 90% van de zoekopdrachten leverden geen resultaten op. Daartegenover staat dat de kans op het vinden van meer dan 4 hits bij een combinatie van twee ziektes 20% is.

Tabel
Achtergrondfrequentie van aantal zoekresultaten in PubMed
Resultaten van 30.000 willekeurige zoekopdrachten, en interpretatie.
Tabel | Achtergrondfrequentie van aantal zoekresultaten in PubMed | Resultaten van 30.000 willekeurige zoekopdrachten, en interpretatie.

 

Bovendien hebben we onze reeds gepubliceerde analyse aangevuld met een vierde categorie, waarin we de selectie beperkten tot 20 door ons gekozen veelgebruikte geneesmiddelen en 20 veelvoorkomende symptomen. In deze analyse – weliswaar slecht generaliseerbaar vanwege de handmatige selectie – levert 59% van de willekeurige zoekopdrachten resultaten op, en is de kans 20% op het vinden van meer dan 23 hits, opnieuw met vooraf ongerelateerde zoektermen. De data lijken de stelling dus wel te ondersteunen: welk verband je ook zoekt in de medische zoekmachines, de kans is groot dat je iets vindt.

Beschouwing

Uiteindelijk leveren ook veel zoekopdrachten geen hits op. Maar veruit de meeste ziektebeelden, symptomen en geneesmiddelen, hebben in werkelijkheid niets met elkaar te maken. Het feit dat je met totaal willekeurige combinaties aan zoektermen toch vaak resultaten vindt, suggereert dat er niet-bestaande verbanden worden gerapporteerd, waarvan een deel zich laat verklaren door publicatiebias.

Uiteraard staat een grondige beoordeling van individuele studies die uit een zoekopdracht komen nog steeds centraal, temeer daar wij de resultaten van onze geautomatiseerde zoekopdrachten niet beoordeeld hebben op relevantie. Een deel van de gevonden verbanden in deze willekeurige zoekopdrachten zal wel degelijk relevant zijn. Een ander deel zal wel beide termen bevatten maar geen verband claimen.

Conclusie

Evengoed roepen de data wat ons betreft op tot een kritische houding naar mogelijke correlaties die we vinden met medische zoekmachines. Enkele hits op PubMed betekenen op voorhand geenszins dat er een echt verband is. Dit is niet bedoeld als aanzet tot pessimisme over de staat van de medische literatuur; wel is het een pleidooi om mogelijke klinische correlaties in de literatuur extra zorgvuldig te beoordelen. Met andere woorden: als we schijnbare klinische correlaties uit de praktijk besluiten na te gaan met een zoekmachine, moet de nadruk liggen op de critical appraisal van de zoekresultaten. Dit is een vaardigheid die studenten geneeskunde terecht krijgen aangeleerd, maar die gedurende de medische carrière ook onderhouden moet worden.

Figuur
Figuur
Sinds kort biedt het NTvG de mogelijkheid het antwoord op vragen op te zoeken binnen de bijna 30.000 peerreviewed publicaties van het tijdschrift. Tot 1 januari is deze nieuwe AI-tool gratis toegankelijk op www.ntvg.nl/ask. 
Literatuur
  1. Jarisch A, Giunta C, Zielen S, König R, Steinmann B. Sibs affected with both Ehlers-Danlos syndrome type IV and cystic fibrosis. Am J Med Genet. 1998;78:455-60. doi:10.1002/(SICI)1096-8628(19980806)78:5<455::AID-AJMG11>3.0.CO;2-E. Medline
  2. Terada M, Uchida M, Suga T, Isaka T. Altered gut microbiota richness in individuals with a history of lateral ankle sprain. Res Sports Med. 2022:1-15. doi:10.1080/15438627.2022.2036989. Medline
  3. Reifen R, Amital H, Blank M, et al. Linseed oil suppresses the anti-beta-2-glycoprotein-I in experimental antiphospholipid syndrome. J Autoimmun. 2000;15:381-5. doi:10.1006/jaut.2000.0439. Medline
  4. National Science Board, National Science Foundation. Publication output: U.S. trends and international comparisons. Sci Eng Ind 2020 2019. NSB-2020-6
  5. Allen C, Mehler DMA. Open science challenges, benefits and tips in early career and beyond. PLoS Biol. 2019;17:e3000246. doi:10.1371/journal.pbio.3000246. Medline
  6. Open Science Collaboration Psychology. Estimating the reproducibility of psychological science. Science. 2015;349.
  7. Severin A, Low N. Readers beware! Predatory journals are infiltrating citation databases. Int J Public Health. 2019;64:1123-4. doi:10.1007/s00038-019-01284-3. Medline
  8. Cabanac G, Labbé C. Prevalence of nonsensical algorithmically generated papers in the scientific literature. J Assoc Inf Sci Technol. 2021;72:72. doi:10.1002/asi.24495.
  9. Clark J How covid-19 bolstered an already perverse publishing system. BMJ. 2023:380.
  10. Bampatsias D, Dimopoulou MA, Karagiannakis D, et al. SARS-CoV-2 infection-related deregulation of blood lipids in a patient with -/-LDLR familial homozygous hypercholesterolemia: A case report. J Clin Lipidol. 2023;17:219-24. doi:10.1016/j.jacl.2023.02.001. Medline
  11. Li H, Xiao X, Zhang J, et al. Impaired spermatogenesis in COVID-19 patients. EClinicalMedicine. 2020;28:100604. doi:10.1016/j.eclinm.2020.100604. Medline
  12. Rennard SI, Kalil AC, Casaburi R. Chicken Soup in the Time of COVID. Chest. 2020;158:864-5. doi:10.1016/j.chest.2020.04.044. Medline
  13. Levi M. Je kunt voor werkelijk alles een associatie vinden in PubMed. Med Contact (Bussum). 2019;38.
  14. van Mens TE, Klok FA, Levi M. Searching the literature to explain unexpected clinical observations: all that glitters is not gold. Eur J Intern Med. 2023;112:17-18. doi:10.1016/j.ejim.2023.04.007. Medline
Auteursinformatie

LUMC, afd. Interne geneeskunde, Leiden: dr. T.E van Mens, arts in opleiding tot specialist interne geneeskunde (tevens: Amsterdam UMC, afd. Vasculaire Geneeskunde, Amsterdam Cardiovascular Sciences, Amsterdam institute for Infection and Immunity); prof.dr. F.A. Klok, internist. Amsterdam UMC, afd. Interne geneeskunde, Amsterdam: prof.dr. M. Levi, internist

Contact T.E. van Mens (t.e.van_mens@lumc.nl)

Belangenverstrengeling

Belangenconflict en financiële ondersteuning: geen gemeld.

Auteur Belangenverstrengeling
Thijs E. van Mens ICMJE-formulier
F.A. (Erik) Klok ICMJE-formulier
Marcel Levi ICMJE-formulier
Dit artikel is gepubliceerd in het dossier
Methodologie van onderzoek
Heb je nog vragen na het lezen van dit artikel?
Check onze AI-tool en verbaas je over de antwoorden.
ASK NTVG

Ook interessant

Reacties

Beste collega, dank voor dit verhelderende artikel. 

De Witte Raven is een werkgroep die zich richt op het oplossen van casuïstiek waarbij de huisarts een gevoel heeft dat het eigenlijk onuitstaanbaar is dat de klachten niet kunnen worden verklaard. Witte Raven – OOK zoekstrategie. Het is geen ALK, het heeft ook weinig te maken met een niet-pluis gevoel en toch denkt de huisarts 'hier moet een verklaring voor te vinden zijn'. We hebben een zoekstrategie ontwikkeld die kan helpen om de diagnose te vinden. (zie site) Wij hebben uw artikel besproken en namens de Witte Raven heb ik onderstaande vraag voor u. 

Aan het slot wordt door u gesuggereerd om criticial appraisal te gebruiken voor het beoordelen van de resultaten. Studenten worden daarin opgeleid, meldt u daar. De meeste critical appraisal tools worden gebruikt om het wetenschappelijk gehalte van een artikel te beoordelen. Gaat het hier echter niet vooral om een beoordeling of de gevonden resultaten relevant zijn voor die ene patient? Als u dat met me eens bent, hebt u dan een bruikbare tool die we kunnen gebruiken?
Dank voor uw antwoord en met vriendelijke groet namens de Witte Raven. 

Erik Stolper

Erik Stolper, huisarts-onderzoeker

Beste collega Stolper,

 

Bedankt voor de interesse in het artikel. Inderdaad, de meeste critical appraisal tools gaan grotendeels (maar niet volledig) over interne validiteit van het betreffende onderzoek. De toepasbaarheid op een individuele patiënt is een inschatting op zichzelf. Ik kan u helaas geen aparte tool daarvoor aanraden. Overigens is het ons inziens wel zo dat zowel een gebrekkige interne validiteit als publicatiebias afdoen aan de toepasbaarheid op de patiënt. Als de bevindingen niet kloppen zijn ze ook niet relevant voor de patiënt. Maar dat is een open deur.

 

Thijs van Mens

Thijs van Mens