Samenvatting
Om auteurs adviezen te kunnen geven ter verkleining van de kans op afwijzing van hun artikelen werd een retrospectief onderzoek verricht naar de redenen van afwijzing door de hoofdredactie van het Nederlands Tijdschrift voor Geneeskunde van in 1990 ter publikatie aangeboden oorspronkelijke stukken (OS), capita selecta (CS), klinische lessen (KL) en casuïstische mededelingen (CM) en naar de invloed van lengte van het artikel, professionele status van de eerste auteur, relevantste vakgebied en herkomst van het artikel op de afwijzingskans.
Van 547 artikelen werd 38 (208) afgewezen; van de CM de meeste (49) en van de CS de minste (33). De adviesprocedure was bij de OS het uitgebreidst, bij de CM het beperktst. ‘Inhoudelijke tekortkomingen’ was de meest voorkomende reden van afwijzing in iedere rubriek, met name bij de OS (80). KL en CM werden relatief vaak afgewezen vanwege gebreken in de ‘klinische boodschap’. De gemiddelde lengte van afgewezen èn aanvaarde artikelen overschreed de limiet. Bij professionele status en vakgebied was er verschil in afwijzingskans (χ2, p < 0,05). Specialisten hadden de kleinste kans op afwijzing (31). Niet-specialisten hadden voordeel van supervisie van een specialist. Artikelen uit niet-academische instellingen werden vaker afgewezen dan artikelen uit academische centra, maar per rubriek was dit verschil niet significant.
Auteurs wordt geadviseerd hun artikelen te toetsen aan de beschreven criteria. Raadplegen van (methodologische) deskundigen, literatuurbestanden of de hoofdredactie kan de kans op aanvaarding vergroten. Niet-specialisten kunnen profiteren van supervisie. Wetenschappelijke instelling en bereidheid tot verwerken van redactionele adviezen vergroten de aanvaardingskans van een artikel.
(Geen onderwerp)
Nijmegen, mei 1991,
Met grote interesse heb ik deze analyse gelezen; de conclusies lijken mij zeer leerzaam voor auteurs, lezers en redactie(s) (1991;840-5). Wat ik niet begrijp, is de grote nadruk die wordt gelegd op de statistische significantie van verschillen. Statistische toetsen veronderstellen immers een aselecte steekproef uit de populatie waarnaar men met behulp van de toetsen wil generaliseren.1
De 547 in 1990 aangeboden artikelen zijn zelf de populatie en worden niet voorgesteld als een mogelijke representatieve steekproef uit bijv. alle aangeboden artikelen van de laatste tien jaar, hetgeen waarschijnlijk moeilijk waar te maken zal zijn. In de titel wordt de reikwijdte van het artikel dan ook terecht tot 1990 beperkt. Ik meen dat in dit geval descriptieve statistiek volstaat, terwijl toetsen onder het hoofdstuk ‘inferential statistics’ vallen.
Het heeft bijv. weinig zin over tabel 1 (bl. 841) te melden dat de verschillen tussen de afwijzingspercentages van de 4 onderzochte rubrieken (OS, CS, KL en CM) niet significant waren. Het was in 1990 echt zo, en waarschijnlijk niet ‘toevallig’ dat de casuïstische mededelingen relatief minder vaak aanvaard werden dan de overige artikelen; de helft (CM) versus bijna twee derde (overige) werd aanvaard. In de beschouwing worden de CM dan ook terecht als de rubriek met de grootste afwijzingskans voorgesteld, hetgeen vanwege het ontbreken van statistische significantie (indien zinvol) niet correct zou zijn. Bij de CM is er ook het duidelijkste verschil (trend of geen trend, bl. 844) tussen academische en niet-academische bijdragen: van de 42 CM uit academisch milieu werd 62% (bijna normaal) geaccepteerd, en slechts 45% van de 67 uit niet-academisch milieu: bij CM vormde de herkomst dus relatief nogal vaak een handicap; of men van een ernstige hinderpaal kan spreken, is niet uit een statistische toets af te leiden. In feite gaat het om ongeveer 11 CM van niet-academische herkomst (11 teleurgestelde auteurs) die ook aanvaard zouden zijn als dit milieu voor CM eveneens 62% gescoord had.
Een ander resultaat waarbij de toetsen mijns inziens niet alleen niet zinvol, maar ook enigszins misleidend zijn, betreft de lengte van de artikelen (tabel 3 en figuur 1). De verschillen tussen de aanvaarde en afgewezen artikelen voor de afzonderlijke rubrieken mogen dan wat betreft de toegestane lengte geen van alle significant zijn, in 1990 was het echt zo dat bij de aangeboden capita selecta de te lange stukken er beter afkwamen: 72% werd aanvaard tegenover 55% van de CS die niet langer waren dan de limiet: wellicht hadden de te lange capita vaker voldoende te bieden, zodat er na bekorting een aanvaardbaar stuk kon overblijven.
Statistici waarschuwen nogal eens voor de overdreven waarde die in artikelen aan statistische toetsen wordt gehecht, als zou de wetenschappelijkheid daar altijd van afhangen. Mijns inziens is uw analyse hiervan een goed voorbeeld, aangezien aan de voorwaarden voor toetsen niet voldaan is, en bij beperking van conclusies tot het betreffende jaar ook niet voldaan hoeft te worden.
Rümke ChrL. Enkele grondbegrippen uit de statistiek; VI. Statistische toetsingen en de onbetrouwbaarheid van op grond daarvan getrokken conclusies. [LITREF JAARGANG="1988" PAGINA="1603-6"]Ned Tijdschr Geneeskd 1988; 132: 1603-6.[/LITREF]
(Geen onderwerp)
Rotterdam, juni 1991,
Wij danken collega Vis voor zijn reactie op ons artikel. Centraal in zijn betoog staat de stelling dat wij bij de statistische analyse van onze bevindingen hadden kunnen volstaan met descriptieve statistiek, omdat onze conclusies zich zouden beperken tot het jaar 1990. Dit laatste uitgangspunt lijkt ons niet correct; onze resultaten beperken zich tot alle artikelen die in 1990 beoordeeld werden, maar onze conclusies zijn wel degelijk generaliserend van aard, aangezien ze gericht zijn op de eerstkomende jaren met de bedoeling om auteurs adviezen te geven om hun kans op afwijzing te verkleinen. De toegepaste statistiek heeft vanuit dat gezichtspunt duidelijk zijn wetenschappelijke waarde.
De door collega Vis aangehaalde voorbeelden worden door hem alleen in het kader van 1990 geplaatst. Zonder twijfel werden bijvoorbeeld de CM in 1990 echt het meest afgewezen; zonder extrapolatie van dit gegeven naar de (nabije) toekomst is dit echter niet ‘leerzaam voor auteurs, lezers en redacties’. Wij geven er de voorkeur aan om een breder kader te geven aan onze analyse en menen dat wij daarbij de waarde van de gebruikte toetsen niet hebben overschat.