Zum Hauptinhalt springen

Randomisierte Studien sind nicht immer der Heilige Gral

Evidence is the base of medicine, but common sense is the salt of it (Slava Ryndine in Schein’s Common Sense Emergency Abdominal Surgery)

Der Zweck medizinisch-wissenschaftlicher Studien besteht darin, qualitativ hochwertige Nachweise zu erbringen, die es den Leistungserbringern im Gesundheitswesen ermöglichen, eine optimale Versorgung zu gewährleisten und die Gesundheit der Patienten zu verbessern; zu diesem Zweck können andere Studiendesigns dem RCT vorgezogen werden. Es ist sicherlich nicht die Absicht, die RCT von ihrem methodischen Sockel zu stoßen, sondern vielmehr, dieses Design mit einer kritischen Anmerkung zu versehen und den Leser auf die potenziellen Vorteile alternativer Studiendesigns in der (chirurgischen) Forschungswelt hinzuweisen.

In der Medizin gilt die randomisierte vergleichende Forschung (RCT) als Goldstandard für die Bestimmung der Wirksamkeit einer bestimmten (medizinischen) Maßnahme und ist somit der Eckpfeiler der evidenzbasierten Medizin. Aber auch dieses Design hat einige Schwächen. Die Zuteilung einer Behandlung durch das Los ist praktikabel, wenn es sich um eine experimentelle Behandlung handelt, der sich der Patient nur in einer Studienumgebung unterziehen kann, oder wenn die Patienten keine Behandlungspräferenz haben. Es kommt jedoch häufig vor, dass chirurgische RCTs diese Bedingungen nicht erfüllen können, z. B. weil die zu bewertenden Behandlungen sehr unterschiedliche Merkmale aufweisen oder beide bereits in der täglichen Praxis eingesetzt werden. Untersuchungen zeigen, dass weniger als die Hälfte der RCTs in den Niederlanden die angestrebte Teilnehmerzahl bis zum geplanten Enddatum erreicht haben.

Eine systematische Übersicht über die Merkmale chirurgischer RCTs zeigt, dass die Studienpopulationen in der Regel klein sind, mit einem Median von 122 Patienten, und dass die ursprünglich berechneten Stichprobengrößen nicht immer erreicht werden. Ein aktueller Bericht von Zorg Onderzoek Nederland und dem Bereich Medizinische Wissenschaften der Niederländischen Organisation für Wissenschaftliche Forschung (ZonMw) zeigt, dass 56 Prozent der niederländischen Versorgungsevaluierungen (in der Regel RCTs) während der Einschlussphase mehr als sechs Monate, 19 Prozent sogar mehr als zwei Jahre verzögert werden. Die vorherrschenden Behandlungspräferenzen der Patienten spielen dabei eine große Rolle. Die Behandlungspräferenzen erschweren den Rekrutierungsprozess, die Stichprobengröße wird nicht in der vorgegebenen Zeit erreicht, und die Abbruchquote kurz nach der Randomisierung ist hoch. Infolgedessen haben RCTs eine unzureichende Aussagekraft, um überzeugende medizinisch-wissenschaftliche Erkenntnisse zu liefern.

Die Frage, ob eine Maßnahme wirksam ist, kann auf verschiedene Weise beantwortet werden.

In der Pyramide der primären wissenschaftlichen Evidenz steht die RCT an erster Stelle, unmittelbar gefolgt von der prospektiven (vergleichenden) Studie. Bei der prospektiven Forschung werden ausgewählte Patienten anhand von Ein- und Ausschlusskriterien über einen längeren Zeitraum verfolgt, um das Auftreten eines bestimmten Ergebnisses zu bewerten. Bei der Beobachtungsforschung hingegen findet keine Randomisierung statt, und den Patienten wird keine Intervention oder Maßnahme auferlegt. Ein Nachteil dieses Konzepts besteht darin, dass zwischen den zu vergleichenden Behandlungsgruppen ein Ungleichgewicht hinsichtlich der Patientenmerkmale bestehen kann ("Confounding by Indication"). Dies sollte daher bei der statistischen Analyse - soweit möglich - korrigiert werden.

Eine Mischform aus RCT und prospektiven Studien ist das umfassende Kohortendesign (CCD). Dieses Kombinationsdesign besteht aus zwei Kohorten: einer randomisierten Kohorte, in die Patienten ohne vorherrschende Behandlungspräferenz eingeschlossen werden, und einer prospektiven Beobachtungskohorte, in die geeignete Patienten, aber mit einer Behandlungspräferenz, eingeschlossen werden. Eine CCD wird in der Literatur auch als "Patientenpräferenzstudie" bezeichnet. Auch bei einer CCD kann das gleiche Ungleichgewicht zwischen den Behandlungsgruppen in Bezug auf die Patientenmerkmale in der prospektiven Kohorte auftreten. Die Ergebnisse der Analysen der randomisierten Kohorte werden dann mit den multivariablen bereinigten Ergebnissen der Beobachtungskohorte gepoolt, ähnlich wie bei einer Meta-Analyse. Trotz der relativen Unbekanntheit der CCD sind mehrere klinische Studien mit diesem Forschungsdesign erfolgreich durchgeführt und abgeschlossen worden (Kuiper et al. 2023) 

Zurück