nd-aktuell.de / 05.06.2025 / Wissen

Wissenschaft, wir müssen reden

Oftmals gelingt es nicht, die Ergebnisse empirischer Versuche unabhängig zu bestätigen

Isabelle Bartram
Im Wissenschaftsbetrieb mag manchmal die Versuchung aufkommen, den Laborkittel an den Nagel zu hängen.
Im Wissenschaftsbetrieb mag manchmal die Versuchung aufkommen, den Laborkittel an den Nagel zu hängen.

Unter dem provokanten Titel »Why Most Published Research Findings Are False«, analysierte John Ioannidis[1], Professor an der Universität Stanford, bereits vor 20 Jahren, warum die meisten veröffentlichten Forschungsergebnisse falsch seien. Der Gesundheitswissenschaftler und Statistiker traf seitdem umstrittene Aussagen zur Covid-19-Pandemie. Doch seine Analyse der Probleme des Wissenschaftsbetriebs ist nach wie vor hochaktuell – wie zwei kürzlich veröffentlichte Studien aus ganz unterschiedlichen Fachgebieten zeigen.

Fast ein Jahr lang wiederholte ich das gleiche Experiment Tag für Tag – ohne Erfolg.

-

Der Begriff der »replication crisis«, zu deutsch Reproduzierbarkeitskrise, entstand in den frühen Zehnerjahren in der innerwissenschaftlichen Diskussion im Zuge der Beobachtung, dass bereits veröffentlichte, zum Teil viel zitierte wissenschaftliche Studien das Grundkriterium der empirischen Wissenschaft nicht erfüllten: Es gelang nicht, ihre Ergebnisse in unabhängigen Experimenten zu reproduzieren. Als Basis für Anwendungen wie Medikamentenentwicklung beispielsweise sind nicht reproduzierbare Studienergebnisse wertlos.

Die Autor*innen einer kürzlich veröffentlichten Studie[2] wollten überprüfen, ob auch verhaltensökologische Insektenexperimente betroffen sind. Forschende an den Universitäten Jena, Bielefeld und Münster hatten in drei verschiedenen Laboren die gleichen drei Versuche durchgeführt. Sie testeten die Auswirkungen von Futtermangel auf Abwehrreaktionen bei Blattwespenlarven, den Zusammenhang zwischen der Körperfarbe und der bevorzugten Umgebungsfarbe bei Grashüpfern sowie die Wahl des Lebensraums bei Reismehlkäfern. Es zeigte sich, dass die Reproduzierbarkeit zwar größer war als in anderen Forschungsfeldern, doch auch hier stimmten nicht alle Ergebnisse zwischen den unterschiedlichen Laboren überein. Als Ursachen vermuten die Autor*innen, dass unter anderem Unterschiede in der biologischen Heterogenität der untersuchten Versuchstiere eine Rolle spielten.

Die Ergebnisse der Grashüpfer-Experimente waren zwar zwischen den Laboren der aktuellen Studie ähnlich, konnten die ursprüngliche Studie von 2021 jedoch nicht bestätigen. Hier hatten Forschende gezeigt, dass grüne oder braune Grashüpfer sich bevorzugt in Umgebungen entsprechend ihrer Färbung aufhalten. In den neuen Versuchen konnte dieser Effekt nicht nachgewiesen werden. Außerhalb einer speziellen Reproduzierbarkeitsstudie wäre es jedoch kaum möglich, diese Erkenntnis zu veröffentlichen. »Negative Ergebnisse« und Wiederholungen bereits veröffentlichter Versuche sind für wissenschaftliche Fachverlage uninteressant und werden normalerweise auch nicht mit Forschungsförderung unterstützt.

Nur kurz nachdem Ioannidis seinen Artikel veröffentlicht hatte – der mir leider erst Jahre später im Internet begegnete –, arbeitete ich in einem renommierten Neurowissenschaftslabor. Hier sollte ich einen bereits veröffentlichten Verhaltensversuch mit Honigbienen wiederholen, um darauf aufbauend neue Erkenntnisse zu gewinnen. Fast ein Jahr lang wiederholte ich als Studentin das gleiche Experiment Tag für Tag – ohne Erfolg. Die Ergebnisse waren einfach nicht reproduzierbar. Meine Daten landeten schließlich im Mülleimer und der Rest der Wissenschaftsgemeinschaft wurde nicht darüber informiert, dass die Ergebnisse der Ursprungsstudie sich nicht reproduzieren ließen und die auf ihnen basierenden Hypothesen über die Funktionsweise des Bienengehirns möglicherweise falsch waren.

Im nächsten Karriereschritt forschte ich auf dem Gebiet der Krebsgenetik. Die Forschungsgruppe hatte gerade eine Förderung für ein damals angesagtes neues Thema erhalten. Fast zwei Jahre lang versuchte ich ohne Erfolg, Ergebnisse aus verschiedenen Studien als Grundlage für mein Promotionsprojekt zu reproduzieren. Währenddessen lastete der Druck auf mir, schnell voranzukommen und meine Promotionsbetreuerin zufriedenzustellen, schließlich würde sie mich benoten und über Vertragsverlängerungen entscheiden. Derartige Forschungsumgebungen bringen Menschen dazu, die eigenen Ergebnisse zu überinterpretieren, es mit der Statistik nicht so genau zu nehmen oder gar zu fälschen. Ich gab indessen einfach irgendwann auf – meine Misserfolge zu veröffentlichen, kam für meine Vorgesetzte leider nicht infrage.

Bei einer Umfrage des renommierten Fachjournals »Nature« antworteten 2016 mehr als 70 Prozent der befragten Wissenschaftler*innen, dass sie selbst erfolglos versucht hätten, die Ergebnisse anderer Forschender zu bestätigen. Über die Hälfte glaubte an die Existenz einer Reproduzierbarkeitskrise. Weltweit bildeten sich verschiedene Initiativen, um groß angelegte Reproduzierbarkeitsstudien in verschiedenen Wissenschaftsdisziplinen durchzuführen. Sie unterlegten die vermutete Schwierigkeit, veröffentlichte Ergebnisse zu wiederholen, mit Zahlen in so unterschiedlichen Wissenschaftsfeldern wie Medizin, Psychologie, Wirtschaftswissenschaften und Sozialwissenschaften. Im April dieses Jahres veröffentlichte[3] die Brazilian Reproducibility Initiative die Ergebnisse des sechsjährigen Versuchs, die Abläufe aus 60 biomedizinischen Fachartikeln zu reproduzieren. Mit niederschmetterndem Ausgang: Je nach Strenge der Kriterien gelang es der Initiative aus über 50 Forschungsteams nur, zwischen 15 und 45 Prozent der ursprünglich veröffentlichten Ergebnisse zu bestätigen.

Die erfolglosen Versuche, Ergebnisse zu reproduzieren, verschwenden die Lebenszeit von Wissenschaftler*innen, fressen finanzielle, zum Teil steuerfinanzierte Ressourcen und verursachen unnötiges Tierleid[4]. Bei medizinischer Forschung steht jedoch noch mehr auf dem Spiel. Inkorrekte Forschungsansätze, die durch falsche Anreize im Wissenschaftssystem am Leben erhalten werden, können Menschenleben in klinischen Studien gefährden und die Therapieentwicklung für Jahrzehnte fehlleiten.

Die heutige Zeit, in der Wissenschaft politisch angegriffen wird und längst belegte Erkenntnisse wie der menschengemachte Klimawandel bezweifelt werden, scheint nicht der richtige Moment für offene Debatten. Doch Zweifel und Selbstkritik zu unterbinden, wird uns am Ende mehr schaden. Wir müssen daher dringend über wissenschaftliche Unsicherheiten, prekäre Arbeitsbedingungen und falsche Anreize reden.

Dr. Isabelle Bartram ist Molekularbiologin und Mitarbeiterin beim Gen-ethischen Netzwerk e. V.

Links:

  1. https://www.nd-aktuell.de/artikel/984233.das-elend-der-statistik.html
  2. https://journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.3003019
  3. https://www.biorxiv.org/content/10.1101/2025.04.02.645026v3
  4. https://www.nd-aktuell.de/artikel/1185994.wissenschaft-ersatz-fuer-tierversuche-petrischale-statt-maeusekaefig.html