Apr 22, 2024
Verwendung von Tagen am Leben ohne lebenserhaltende Maßnahmen und ähnliche Zählergebnisse in randomisierten klinischen Studien
BMC Medical Research Methodology Band 23, Artikelnummer: 139 (2023) Diesen Artikel zitieren 1005 Zugriffe 1 Zitate 12 Details zu altmetrischen Metriken Tage am Leben ohne Lebenserhaltung (DAWOLS) und ähnliches
BMC Medical Research Methodology Band 23, Artikelnummer: 139 (2023) Diesen Artikel zitieren
1005 Zugriffe
1 Zitate
12 Altmetrisch
Details zu den Metriken
Tage am Leben ohne lebenserhaltende Maßnahmen (DAWOLS) und ähnliche Ergebnisse, die darauf abzielen, Mortalitäts- und Nicht-Mortalitätserfahrungen zusammenzufassen, werden in der Intensivpflegeforschung zunehmend verwendet. Die Verwendung dieser Ergebnisse wird durch unterschiedliche Definitionen und nicht normale Ergebnisverteilungen erschwert, die statistische Analyseentscheidungen erschweren.
Wir haben die zentralen methodischen Überlegungen bei der Verwendung von DAWOLS und ähnlichen Ergebnissen untersucht und bieten eine Beschreibung und einen Überblick über die Vor- und Nachteile verschiedener statistischer Analysemethoden, ergänzt durch einen Vergleich dieser Methoden anhand von Daten aus der randomisierten klinischen Studie COVID STEROID 2. Wir konzentrierten uns auf leicht verfügbare Regressionsmodelle zunehmender Komplexität (lineare, hürdennegative Binomial-, Null-Eins-inflationierte Beta- und kumulative logistische Regressionsmodelle), die den Vergleich mehrerer Behandlungsarme, die Anpassung von Kovariaten und Interaktionstermen zur Beurteilung der Heterogenität der Behandlungseffekte ermöglichen .
Im Allgemeinen schätzten die einfacheren Modelle die Gruppenmittelwerte angemessen, obwohl die Daten nicht gut genug angepasst waren, um die Eingabedaten nachzuahmen. Die komplexeren Modelle passten besser zu den Eingabedaten und reproduzierten sie somit besser, obwohl dies mit einer höheren Komplexität und Unsicherheit der Schätzungen einherging. Während die komplexeren Modelle separate Komponenten der Ergebnisverteilungen modellieren können (z. B. die Wahrscheinlichkeit, null DAWOLS zu haben), bedeutet diese Komplexität, dass die Spezifikation interpretierbarer Priors in einer Bayes'schen Umgebung schwierig ist.
Abschließend präsentieren wir mehrere Beispiele dafür, wie diese Ergebnisse visualisiert werden können, um die Beurteilung und Interpretation zu erleichtern.
Diese Zusammenfassung zentraler methodischer Überlegungen bei der Verwendung, Definition und Analyse von DAWOLS und ähnlichen Ergebnissen kann Forschern dabei helfen, die Definitions- und Analysemethode auszuwählen, die am besten zu ihren geplanten Studien passt.
COVID STEROID 2-Studie, ClinicalTrials.gov: NCT04509973, ctri.nic.in: CTRI/2020/10/028731.
Peer-Review-Berichte
Sterblichkeit ist traditionell das primäre Ergebnis in den meisten randomisierten klinischen Studien (RCTs) bei kritisch kranken Patienten [1]. Zählergebnisse wie die Anzahl der Tage ohne lebenserhaltende Maßnahmen (DAWOLS; typischerweise einschließlich der Verwendung von mechanischer Beatmung, Vasopressoren/Inotropika oder Nierenersatztherapie) und Tage außerhalb des Krankenhauses (DAOH) werden jedoch zunehmend verwendet [2]. Dies liegt daran, dass diese Ergebnisse mehr Informationen liefern als binäre Ergebnisse wie die Mortalität [3] und ihre Verwendung möglicherweise das Risiko nicht schlüssiger RCTs aufgrund der fehlenden Macht zur Ablehnung klinisch wichtiger Effektgrößen für die Mortalität verringert [4, 5]. ]. Darüber hinaus berücksichtigen diese Ergebnisse nicht nur die Sterblichkeit, sondern auch den Ressourcenverbrauch, und da sie sowohl den Schweregrad der Erkrankung (Dauer der lebenserhaltenden Maßnahmen oder im Krankenhaus) als auch die Mortalität berücksichtigen, können diese Ergebnisse als wichtig für den Patienten angesehen werden [2, 6,7]. ,8] und kann darüber hinaus mit anderen nachteiligen Folgen verbunden sein [6, 7]. Schließlich lassen sich in diese Ergebnisse problemlos auftretende Ereignisse einbeziehen (z. B. neue Episoden lebenserhaltender Maßnahmen oder Rückübernahmen).
Allerdings sind die Verwendung, Analyse und Berichterstattung von DAWOLS, DAOH und ähnlichen Ergebnissen im Vergleich zu denen für die Mortalität mit Herausforderungen verbunden [2]. Diese Herausforderungen stehen im Zusammenhang mit den Ergebnisdefinitionen, einschließlich der Behandlung von Todesfällen und Nichtnormalverteilungen, die statistische Analysen erschweren und sich auf die Wahl des/der Schätzwert(e) (die in einer statistischen Analyse geschätzte Menge) und Wirkungsmaß(e) auswirken können. [2]. Folglich werden diese Ergebnisse häufig mit verschiedenen Methoden analysiert, darunter sowohl regressionsbasierte Methoden als auch nichtparametrische Tests [2]. Nichtparametrische Tests wurden bereits früher empfohlen [9] und werden häufig verwendet [2], weisen jedoch erhebliche Einschränkungen auf, die ihre Nützlichkeit in komplexeren RCT-Designs (z. B. mehrarmige Studien oder adaptive Plattformstudien [10]) beeinträchtigen. Erstens liefern die meisten nichtparametrischen statistischen Tests in erster Linie P-Werte, ohne die Effektgrößen und die Unsicherheit zu quantifizieren, was zur Beurteilung der klinischen Bedeutung eines Behandlungseffekts erforderlich ist. Zweitens schließen die meisten nichtparametrischen Tests entweder eine Anpassung für Kovariaten aus (z. B. der Mann-Whitney-U/Wilcoxon-Rangsummentest) oder erlauben nur die Stratifizierung einer einzelnen Variablen (z. B. der Van-Elteren-Test), und die meisten können nur zwei Gruppen vergleichen auf einmal [9]. Daher können regressionsbasierte Methoden, die nicht nur das Testen von Nullhypothesen, sondern auch die Schätzung von Effektgrößen ermöglichen, geeigneter und aussagekräftiger sein [11] und werden zunehmend für diese Ergebnisse verwendet [2].
In diesem Manuskript geben wir einen Überblick über wichtige konzeptionelle und methodische Überlegungen bei der Verwendung von DAWOLS, DAOH und ähnlichen Ergebnissen, einschließlich der Vor- und Nachteile verschiedener Wahlmöglichkeiten, und richten uns an klinische Forscher, die RCTs unter Verwendung dieser Ergebnisse planen und durchführen. Darüber hinaus diskutieren wir verschiedene regressionsbasierte statistische Ansätze zur Analyse dieser Ergebnisse sowie ein praktisches Beispiel, in dem verschiedene Modelle in einem realen Versuchsdatensatz verglichen werden.
Wir bieten einen Überblick über wichtige methodische Überlegungen bei der Verwendung von DAWOLS und ähnlichen Ergebnissen sowie eine Diskussion und einen Vergleich verschiedener Ansätze zur statistischen Analyse. Wir konzentrieren uns auf regressionsbasierte statistische Methoden, die den Vergleich von mehr als zwei Behandlungsarmen, die Anpassung für mehrere Kovariaten (z. B. Stratifizierungsvariablen, wie allgemein empfohlen [12] oder wichtige prognostische Basisvariablen, die die Aussagekraft erhöhen können [13]), ermöglichen. Bewertung von Wechselwirkungen und heterogenen Behandlungseffekten, Quantifizierung von Wirkungsmaßen mit Unsicherheitsmaßen und schließlich die Nutzung früherer Informationen und die Fähigkeit, vollständige Posterior-Verteilungen zu generieren, wenn sie in einem Bayes'schen Kontext verwendet werden [10, 14]. Wir konzentrieren uns auf die technischen, theoretischen und praktischen Vor- und Nachteile verschiedener Auswahlmöglichkeiten und Modelle und stellen ein ausgearbeitetes Beispiel zur Veranschaulichung und zum Vergleich dieser Definitionen und Modelle bereit, indem wir Daten aus der randomisierten klinischen Studie COVID STEROID 2 erneut analysieren [15].
Wir analysieren und visualisieren Daten aus der COVID STEROID 2-Studie, in der eine höhere (12 mg; Intervention) mit einer niedrigeren (6 mg; Kontrolle) Dosis Dexamethason täglich für bis zu 10 Tage bei Patienten mit Coronavirus-Erkrankung 2019 und definierter schwerer Hypoxie verglichen wurde als Anforderung von mindestens 10 l Sauerstoff/Minute oder mechanischer Beatmung [15]. Die Randomisierung erfolgte stratifiziert nach Standort, Alter unter 70 Jahren und Einsatz invasiver mechanischer Beatmung. DAWOLS wurde am 28. Tag anhand der verfügbaren Daten von 971 Patienten beurteilt. Die Studie wurde von den Komitees für Gesundheitsforschungsethik in der Hauptstadtregion Dänemarks (H-20051056) und allen weiteren relevanten nationalen/lokalen Behörden genehmigt, im Einklang mit der Deklaration von Helsinki durchgeführt und alle Patienten oder ihre gesetzlichen Stellvertreter wurden informiert Einwilligung [15]. Weitere Einzelheiten werden an anderer Stelle dargestellt [15]. In den primären Analysen des Versuchs wurden die tatsächlichen DAWOLS-Werte verwendet, ohne den Tod zu bestrafen, aber für diese Analysen haben wir den Nichtüberlebenden einen Wert von 0 (oder -1 auf der Ordinalskala) Tagen zugewiesen. Da alle Daten aus der COVID STEROID 2-Studie verwendet wurden, wurde für diese Studie keine formelle Berechnung der Stichprobengröße durchgeführt. Die Ergebnisdaten der COVID-STEROID-2-Studie mit unterschiedlichem Umgang mit Nichtüberlebenden sind in Abb. 1 mit relevanten zusammenfassenden Statistiken dargestellt.
Verteilungen der Lebenstage ohne lebenserhaltende Maßnahmen (DAWOLS) am 28. Tag in jeder Behandlungsgruppe (Kontrollgruppe, 6 mg, in Rot und Interventionsgruppe, 12 mg, in Blau) in der COVID STEROID 2-Studie [15]. Die auf drei verschiedene Arten berechnete Verteilung der DAWOLS wird dargestellt: die absoluten Werte (ohne Strafe für den Tod); nachdem den Nichtüberlebenden der Wert 0 zugewiesen wurde; und nachdem den Nichtüberlebenden der Wert -1 zugewiesen wurde. Horizontale Achsen: Anzahl Tage; vertikale Achsen: Anzahl der Patienten. Abkürzungen: IQR: Interquartilbereich, Min./Zwischen/Max.: Prozentsatz der Patienten mit dem Minimalwert, Werten größer als der Minimalwert und kleiner als dem Maximalwert sowie dem Maximalwert
Zentrale methodische Überlegungen bei der Operationalisierung von DAWOLS, DAOH und ähnlichen Ergebnissen sind in Abb. 2 zusammengefasst.
Flussdiagramm, das die notwendigen Entscheidungen und Überlegungen bei der Verwendung von Tagen am Leben ohne lebenserhaltende Maßnahmen und ähnlichen Ergebnissen in randomisierten klinischen Studien veranschaulicht. Überlegungen zu einzelnen Schritten werden im Text weiter ausgeführt
Erstens ist die Ergebnisdefinition, einschließlich Einschränkungen (z. B. aufgrund maximaler Nachbeobachtungsdauern) und der Umgang mit Todesfällen, von zentraler Bedeutung. Am häufigsten wird verstorbenen Patienten der schlechtestmögliche Wert zugewiesen (0 Tage oder ein kategorialer Wert, der bei der Analyse als ordinales Ergebnis schlechter als alle möglichen tatsächlichen Werte ist) [2], was zuvor empfohlen wurde, um sicherzustellen, dass der Tod als schlechtestes Ergebnis behandelt wird in den Analysen [7, 16, 17], sogar für Patienten, die möglicherweise von lebenserhaltenden Maßnahmen entwöhnt oder für kürzere Zeiträume entlassen werden, bevor sie sterben. In manchen Fällen und insbesondere wenn längere Nachbeobachtungszeiträume verwendet werden, können die tatsächlichen Werte (ohne Bestrafung des Todes) bevorzugt werden [8], und die Verwendung dieser Ergebnisse ohne Bestrafung des Todes ist ebenfalls relativ häufig [2].
Zweitens sollte die erwartete Ergebnisverteilung berücksichtigt werden, einschließlich der Frage, ob eine Inflation (Höhepunkte) bei den Mindest- und/oder Höchstwerten erwartet wird. Dies kann auf Daten aus ähnlichen, früheren Studien basieren und wird davon beeinflusst, wie mit dem Tod umgegangen wird. DAWOLS und DAOH weisen typischerweise verzerrte Verteilungen mit erheblicher Inflation beim Minimalwert auf (da ein erheblicher Teil der Patienten entweder stirbt, bevor die lebenserhaltenden Maßnahmen beendet oder entlassen werden, oder innerhalb der Nachbeobachtungszeit, wenn der Tod bestraft wird, was normalerweise den Minimalwert ausmacht). Inflation höher) und manchmal auf dem Maximalwert (aufgrund der Verkürzung der Nachbeobachtungszeit; folglich erhöhen kürzere Nachbeobachtungszeiträume normalerweise die Inflation auf den Maximalwert).
Drittens muss das Effektmaß (Schätzwert) von primärem Interesse (z. B. mittlere Differenz, Differenz der Anteile der Patienten mit den minimalen/maximalen/allen Werten usw.) angegeben werden. Am häufigsten werden Mittelwertdifferenzen verwendet [2], da diese Werte und Unterschiede über den gesamten Bereich der verglichenen Verteilungen hinweg gewichten. Welches Effektmaß von primärem Interesse ist, hängt jedoch von der tatsächlichen Studie und dem Kontext der Studie ab.
Viertens muss auch die Notwendigkeit individueller Vorhersagen oder der Bewertung heterogener Behandlungseffekte (z. B. Subgruppenanalysen) berücksichtigt werden, da dies möglicherweise bestimmte Einschränkungen erfordert, um Vorhersagen über die Skala des Ergebnisses hinaus zu verhindern, und die Wahl des Modells beeinflussen kann. Wenn beispielsweise nur Mittelwerte von Interesse sind, müssen Modelle nicht in der Lage sein, eine Verteilung der vorhergesagten Werte zu reproduzieren, die der tatsächlichen Ergebnisverteilung ähnelt.
Abschließend sollte ein Analyseplan vorab festgelegt werden, einschließlich der verwendeten Wirkungsmaße und der Art und Weise, wie die Eignung des Modells bewertet wird. ob mögliche Sensitivitätsanalysen durchgeführt werden; und welche alternativen Ansätze verwendet werden können, wenn die Daten anders als erwartet verteilt sind, wichtige Annahmen unerwartet verletzt werden oder die Modellanpassung unzureichend ist. Wenn im Analyseplan aufgrund begrenzter Kenntnisse über die Verteilung der Ergebnisdaten mehrere Modelle aufgeführt sind, sollte der Plan eine klare Strategie für die Auswahl des primären Analysemodells enthalten.
Beim Vergleich von Modellen und Ansätzen in dieser Studie konzentrieren wir uns auf DAWOLS, definiert als die Gesamtzahl der lebenden Tage ohne lebenserhaltende Maßnahmen bis zu einer bestimmten maximalen Anzahl von Tagen, möglicherweise neu skaliert auf einen Anteil der maximalen Anzahl von Tagen und mit toten Patienten Der schlechtestmögliche Wert wird zugewiesen (0 Tage oder eine Kategorie, die schlechter ist als der niedrigstmögliche Wert bei Modellierung als Ordinalvariable, d. h. -1).
Wir konzentrieren uns auf vier spezifische Regressionsmodelle mit zunehmender Komplexität:
Lineare Regression, die hauptsächlich Mittelwerte ohne Unter- oder Obergrenzen modelliert
Hürden-negative binomiale Regression [18], ein zweiteiliges Zählmodell, das auf nicht negative Werte beschränkt ist und aus zwei Untermodellen besteht:
Ein logistisches Regressionsmodell, das die Wahrscheinlichkeiten von 0 Tagen modelliert
Ein negativ-binomiales Modell, ein überstreutes Zählmodell, das die Mittelwerte für alle Patienten mit ≥ 1 Tag ohne Obergrenze modelliert
Null-eins-inflationierte Beta-Regression [19, 20], ein dreiteiliges Modell zur Modellierung des Tagesanteils, bestehend aus drei Untermodellen:
Zwei logistische Regressionsmodelle modellieren die Wahrscheinlichkeiten, einen Anteil von entweder 0 oder 1 zu haben, und für diese Patienten die Wahrscheinlichkeit, einen Anteil von 1 zu haben
Ein Beta-Regressionsmodell (unter Verwendung einer Beta-Verteilung, die unimodal, U-förmig oder einheitlich sein kann), das den Anteil der Tage für alle Patienten mit mehr als 0 und weniger als der maximalen Anzahl an Tagen modelliert
Kumulative logistische Regression (auch bekannt als proportionale logistische Regression) [21, 22], ein ordinales Regressionsmodell, das die kumulativen Wahrscheinlichkeiten für jede Kategorie (jede mögliche Anzahl von Tagen) modelliert, beschränkt auf die Vorhersage von Werten, die im Datensatz erscheinen, und mit dem Fähigkeit, den Tod als eindeutige Ergebniskategorie einzubeziehen, die schlechter ist als alle anderen Kategorien
Diese Modelle unterstützen alle so viele Behandlungsarme und Kovariaten wie gewünscht und können zur Schätzung sowohl relativer als auch absoluter Unterschiede verwendet werden (durch Berechnung entweder angepasster bedingter oder marginaler Schätzungen für jede Behandlungsgruppe) und ermöglichen so eine Interpretation entsprechend der klinischen Bedeutung, was idealerweise erfolgt auf der absoluten Skala [23]. Wie die verschiedenen (Unter-)Modelle mit einer typischen DAWOLS-Verteilung umgehen, ist in Abb. 3 dargestellt.
Umgang verschiedener Modelle mit Tagen am Leben ohne lebenserhaltende Maßnahmen (DAWOLS) unter Verwendung von COVID STEROID 2-Studiendaten [15]. Horizontale Achsen: Anzahl bzw. Anteil der Tage; vertikale Achsen: Anzahl der Patienten. Die lineare Regression modelliert den Mittelwert der Verteilung. Es werden keine Grenzen gesetzt; Daher können Vorhersagen außerhalb des gültigen Werteraums in beide Richtungen auftreten (angezeigt durch die Pfeile). Die Hürden-negative Binomial-Regression modelliert den Anteil der Patienten mit genau 0 Tagen (rot) in einem logistischen Regressions-Submodell und die mittlere Anzahl für alle Patienten mit ≥ 1 Tag (blau) unter Verwendung eines (auf Null verkürzten) negativen Binomial-Submodells. Modell. Vorhersagen unterhalb des gültigen Werteraums sind daher nicht möglich, während Vorhersagen oberhalb des maximal gültigen Wertes möglich sind (angezeigt durch den Pfeil). Das Null-Eins-inflationierte Beta-Modell besteht aus drei Untermodellen und modelliert den Anteil von DAWOLS. Zwei logistische Regressionsmodelle schätzen die Wahrscheinlichkeiten für einen Anteil von 0 oder 1 (0 oder 100 %, rot und grün) und die Wahrscheinlichkeiten für einen Anteil von 1 (100 %, grün) unter der Bedingung, dass entweder 0 oder 1 vorliegt. A Die Beta-Regression modelliert den DAWOLS-Anteil für Patienten mit einem DAWOLS-Anteil von > 0 und < 1 (> 0 % und < 100 %, blau). Das kombinierte Modell hat untere und obere Grenzen, die dem gültigen Parameterraum entsprechen; Daher können Anteile < 0 oder > 1 nicht vorhergesagt werden. Das kumulative logistische Regressionsmodell modelliert die Wahrscheinlichkeiten aller unterschiedlichen Werte im Datensatz separat als Ordinalkategorien unter der Annahme der proportionalen Quoten (Tabelle S1 in der Zusatzdatei 1). Daher werden nur im Datensatz auftretende Werte vorhergesagt und bestimmte klinische Ereignisse (z. B. Tod) können als separate Kategorien einbezogen werden, beispielsweise als Kategorie, die schlechter ist als alle anderen Werte (hier -1, schwarz, wobei alle anderen Werte visualisiert werden). Verwendung einzigartiger Farben), obwohl dies die Vorhersage auf der absoluten Skala erschweren kann
Weitere Details zu diesen Modellen, einschließlich ihrer Struktur, geschätzten Parameter, Schlüsselannahmen, verfügbaren Effektmaßen, Darstellung der Ergebnisse sowie der Vorteile und Herausforderungen jedes Modells, sind in Tabelle S1 in der Zusatzdatei 1 zusammengefasst.
Wir haben die bayesianische Parameterschätzung verwendet und alle Modelle mithilfe der R-Softwareversion 4.2.1 (R Core Team, R Foundation for Statistical Computing, Wien, Österreich) und Stan [24] (cmdstanr Version 2.29.2) über das R-Paket brms [25] angepasst Version 2.18.0. Während die allgemeinen Überlegungen für frequentistische Methoden ähnlich wären, ermöglichen Bayes'sche Posterior-Verteilungen eine einfache Berechnung aller abgeleiteten Größen mit geeigneten Unsicherheitsschätzungen, die den Vergleich in diesen Beispielen erleichtern. Für alle Analysen wurden standardmäßige (flache oder sehr schwach aussagekräftige) Prior-Werte mit minimalem Einfluss auf die Ergebnisse verwendet. Alle Analysen verwendeten 4 Ketten mit jeweils 10.000 Gesamtiterationen (2.500 Aufwärmiterationen) und die Konvergenz wurde mithilfe der aktualisierten Rhat-Statistik [26] bewertet (≤ 1,01 in allen Modellen). Der zu den Modellen passende Code und die genauen Prioritäten sind in der Zusatzdatei 1 enthalten.
Die ursprünglichen Analysen der COVID STEROID 2-Studie wurden hinsichtlich der Stratifizierungsvariablen angepasst [15]; Diese Analysen wurden aus Gründen der Einfachheit und Vergleichbarkeit nicht angepasst, da die Nichtkollabierbarkeit einiger (Unter-)Modelle eine Marginalisierung erfordern würde, um die Vergleichbarkeit zu erleichtern. Dies würde die Komplexität in dieser Situation unnötig erhöhen [27], muss jedoch in Betracht gezogen werden, wenn das primäre Analysemodell für einen zukünftigen Versuch auf einer auf Modellvergleichen basierenden Strategie basiert (die idealerweise vordefiniert sein sollte).
Um den Vergleich verschiedener Modelle zu erleichtern, haben wir die erwartete mittlere Anzahl von DAWOLS für jeden Patienten/jede Behandlungsgruppe mithilfe von Vorhersagen für Patienten in jeder Behandlungsgruppe geschätzt, die durch die Kombination von Vorhersagen aus allen Teilen des Hürden-negativen Binomialmodells, dem Null-Eins-inflationierten Modell, berechnet wurden Beta-Modell (mit Anteilen multipliziert mit der maximal möglichen Anzahl von Tagen) und das kumulative logistische Regressionsmodell (mit Wahrscheinlichkeiten, die mit jeder möglichen Anzahl von Tagen multipliziert und summiert werden); Die vorhergesagten Werte wurden bei Bedarf alle auf den möglichen Ergebnisraum gekürzt (einschließlich für -1, das Nichtüberlebenden im kumulativen logistischen Regressionsmodell zugewiesen wurde, das sowohl durch 0 ersetzt als auch unverändert verwendet wurde). Wir haben diese Werte verwendet, um die Mittelwertdifferenzen (der häufigste Schätzwert für diese Ergebnisse [2]) und Mittelwertverhältnisse zu schätzen, um den Vergleich aller Modelle zu erleichtern, die dieselben Schätzwerte verwenden.
Wir haben Modelle anhand der mittleren quadratischen Fehler (RMSEs) und der mittleren absoluten Fehler (MAEs) der Modellvorhersagen mit den Ergebnisdaten verglichen, die zur Anpassung der Modelle verwendet wurden (auf der Anzahl der DAWOLS-Skalen) und darüber hinaus die Unterschiede zwischen berechnet die vorhergesagte und beobachtete mittlere Anzahl von DAWOLS in jeder Behandlungsgruppe. Diese zusammenfassenden Maße wurden unter Verwendung der vollständigen Posterior-Verteilungen berechnet und unter Verwendung mittlerer Posterior-Werte mit 95 %-perzentilbasierten glaubwürdigen Intervallen (CrIs) zusammengefasst. Da die Modelle unterschiedliche Ergebnistransformationen und unterschiedliche Verteilungsfamilien verwendeten, war ein auf Informationskriterien basierender Modellvergleich nicht möglich [28].
Die Modellfitness wurde insbesondere mithilfe grafischer Posterior-Predictive-Checks [29] bewertet, bei denen die für jede Gruppe erfassten Posterior-Predictive-Outcome-Verteilungen mit den beobachteten Outcome-Verteilungen verglichen wurden. Wir verwendeten auch posteriore Vorhersageprüfungen, um die Verteilung der erwarteten (Mittel-)Werte jedes Modells in jeder Behandlungsgruppe visuell mit den beobachteten Gruppenmittelwerten zu vergleichen. Darüber hinaus haben wir die Annahme der proportionalen Quoten des kumulativen logistischen Regressionsmodells visuell bewertet.
Abschließend haben wir mehrere Beispiele erstellt, wie die Rohdaten grafisch dargestellt werden können, um zusätzliche Informationen bereitzustellen und die statistischen Zusammenfassungsmaße zu ergänzen, indem potenzielle Unterschiede im gesamten Verteilungsbereich veranschaulicht werden, inspiriert durch frühere RCTs [30,31,32].
Maße der Modellfitness sind in Tabelle 1 dargestellt.
RMSEs waren in allen Modellen nahezu identisch (etwas höher gegenüber dem kumulativen Logistikmodell, wenn -1 für die schlechteste Kategorie vorhergesagt wurde, was einem Nichtüberleben entspricht); Auch die MAEs waren ähnlich. Die Unterschiede zwischen der vorhergesagten und der tatsächlichen mittleren Anzahl von DAWOLS in jeder Gruppe waren für die linearen, hürdennegativen Binomial- und Null-Eins-inflationierten Beta-Modelle am geringsten und für das kumulative logistische Regressionsmodell etwas größer. Obwohl das Ausmaß dieser Unterschiede möglicherweise von begrenzter Bedeutung ist, wurden die Schätzungen in jeder Gruppe in diesem Modell näher herangezogen. Dies ist wahrscheinlich dadurch zu erklären, dass die Annahme der proportionalen Gewinnchancen etwas verletzt wurde (Abb. S1 in der Zusatzdatei 1).
Die vorhergesagten Mittelwerte in jeder Gruppe, die Mittelwertunterschiede und die Mittelwertverhältnisse sind in ähnlicher Weise in Tabelle 1 dargestellt. In den Abbildungen sind für alle Modell-Datensatz-Kombinationen nachträgliche Vorhersageprüfungen dargestellt. S2-S11 in der Zusatzdatei 1; Eine erhöhte Modellkomplexität führte im Allgemeinen dazu, dass generierte Datenverteilungen eher den tatsächlichen Daten ähnelten. Die vorhergesagten Mittelwerte aus den linearen und hürdennegativen Binomialmodellen lagen nahe an den tatsächlichen Mittelwerten; Beim null-eins-inflationierten Betamodell waren die Punktschätzungen etwas niedriger als die tatsächlichen Werte, und beim kumulativen Logistikmodell (das ein kumulatives Odds Ratio von 1,21, 95 % CrI 0,96 bis 1,53 hatte) lagen die Vorhersagen in beiden Gruppen näher beieinander zueinander als im tatsächlichen Datensatz. Die linearen und hürdennegativen Binomialmodelle generierten keine Daten, die ähnlich verteilt waren wie der Datensatz der COVID-STEROID-2-Studie, der sowohl am 0. als auch am 28. Tag eine erhebliche Inflation aufwies. Die Null-Eins-inflationierten Beta- und kumulativen logistischen Regressionsmodelle reproduzierten die Versuchsdaten relativ gut generativ. Die Mittelwerte in jeder Gruppe wurden von allen Modellen gut vorhergesagt, obwohl das kumulative Logistikmodell die Mittelwerte in der Kontrollgruppe leicht überschätzte und die Mittelwerte in der Interventionsgruppe unterschätzte, wodurch die Gruppenmittelwerte näher beieinander lagen.
Beispiele, wie die Rohdaten visualisiert werden können, sind in Abb. 4 dargestellt.
Beispielvisualisierungen, die veranschaulichen, wie die visuelle Darstellung von Lebenstagen ohne Lebenserhaltung oder ähnlichen Ergebnisdaten die Interpretation unterstützen kann, wobei Lebenstage ohne Lebenserhaltung nach 28 Tagen nach der COVID-STEROID-2-Studie verwendet werden [15]. Unterdiagramm oben links: kumulativer Prozentsatz der Patienten (vertikale Achse), die weniger oder so viele Tage ohne lebenserhaltende Maßnahmen wie auf der horizontalen Achse in jeder Gruppe leben, nach Zuweisung von -1 Tagen an Nichtüberlebende. Dieses Unterdiagramm zeigt, dass Patienten in der Kontrollgruppe über den gesamten Wertebereich weniger Lebenstage ohne lebenserhaltende Maßnahmen hatten. Unterdiagramm oben rechts: „Heatmap“, das den Anteil der Patienten (horizontale Achse) mit jedem Wert in jeder Gruppe visualisiert, nachdem den Nichtüberlebenden 0 Tage zugewiesen wurden; Diese Abbildung ähnelt einem umgedrehten gestapelten Balkendiagramm und zeigt die gesamten Verteilungen an, wobei jeder einzelne Wert seine eigene Farbe in einem Rot-Blau-Verlauf hat (wobei die Farben der Anzahl der Tage entsprechen, die in der Legende unter dem Diagramm dargestellt sind). Ähnlich wie im ersten Unterdiagramm zeigt dieses Unterdiagramm, dass die Patienten in der Kontrollgruppe über den gesamten Wertebereich weniger Tage ohne lebenserhaltende Maßnahmen lebten. Untere Unterdiagramme: Verteilung der Patienten in jedem möglichen Zustand (vertikale Achsen: lebend und zu Hause; lebend und im Krankenhaus; lebend, im Krankenhaus und lebenserhaltend; tot) an jedem Tag nach der Randomisierung (horizontale Achsen) getrennt in den beiden Behandlungen Gruppen. Dieses Unterdiagramm zeigt im Vergleich zu den ersten beiden zusätzliche Details: Die Sterblichkeit war in der Kontrollgruppe höher mit mehr frühen Todesfällen und die Überlebenden waren im Vergleich zur Interventionsgruppe länger lebenserhaltend
Wir haben einen Überblick über die notwendigen methodischen Überlegungen und eine Diskussion von vier verschiedenen Regressionsmodellen zur Bewertung verzerrter und nicht trivial verteilter Ergebnisse wie DAWOLS gegeben und diese Modelle mit realen Daten aus der COVID STEROID 2-Studie verglichen [15]. Wir haben die Modelle einschließlich ihrer wichtigsten Annahmen, Strukturen, Datenanforderungen, verfügbaren Effektmaße und Aspekte im Zusammenhang mit der Darstellung der Ergebnisse beschrieben (Tabelle S1 in der Zusatzdatei 1). Es gibt kein allgemeingültiges bestes Modell und alle Modelle haben Vor- und Nachteile. Während die einfacheren Modelle die Daten nicht gut genug anpassen, um die Eingabedaten nachzuahmen, schätzen sie die Gruppenmittelwerte angemessen ein, sind einfacher zu interpretieren und einfacher in einem Bayes'schen Kontext mit aussagekräftigen Prioritäten zu verwenden. Im Gegensatz dazu lieferten die komplexeren Modelle eine bessere Anpassung an die Daten und konnten neue, ähnliche Daten besser generieren, obwohl keines davon perfekt war. Die komplexeren Modelle können separate Komponenten des Ergebnisses beschreiben (z. B. die Wahrscheinlichkeit, 0 oder mehr DAWOLS zu haben), die in manchen Situationen relevant sein können. Allerdings geht dies mit erhöhter Komplexität, größerer Unsicherheit, größeren Schwierigkeiten im Zusammenhang mit der Verwendung aussagekräftiger Priors und in einigen Fällen mit etwas größeren Fehlern für geschätzte Mittelwerte einher.
Die lineare Regression ist leicht zu interpretieren, einfach zu handhaben und kann verwendet werden, wenn separate Schätzungen für bestimmte Zählungen, wie z. B. Minimal-/Maximalwerte, nicht erforderlich sind. Während die Annahme normalverteilter Residuen (Tabelle S1 in der Zusatzdatei 1) bei der Modellierung von Ergebnissen wie DAWOLS normalerweise verletzt wird, können Mittelwerte und Unsicherheitsmetriken (Konfidenz-/Glaubwürdigkeitsintervalle) aufgrund des zentralen Grenzwertsatzes für größere Stichproben angemessen geschätzt werden [33, 34] im Frequentist-Setting, wenn Bayes'sche Posterior-Verteilungen verwendet werden oder wenn Bootstrapping [35] zur Schätzung robuster Standardfehler verwendet wird. Daher funktioniert die lineare Regression häufig auch bei großen Abweichungen von der Normalität gut [36] und in der Praxis häufig auch für Wahrscheinlichkeits- und Anteilsdaten [37]. Alternativ kann die Quantilregression [38, 39] verwendet werden, um (angepasste) Mediane zu schätzen. Während die Quantilregression nicht die gleichen Verteilungsannahmen hat wie die lineare Regression, ist sie rechnerisch komplexer und erfordert relativ mehr Daten, um die Unsicherheit angemessen abzuschätzen, und funktioniert daher möglicherweise nicht so gut bei kleineren Stichproben [39].
Mehrteilige Modelle, einschließlich Hürden-negativer Binomial- und Null-Eins-inflationierter Beta-Modelle, können Daten besser generativ replizieren und kombinierte und separate Schätzungen für jedes Untermodell liefern. Dies kann wichtig sein, wenn eine Behandlung gegensätzliche Auswirkungen hat, z. B. auf die Mortalität und die Dauer der Organunterstützung bei Überlebenden/Nicht-Überlebenden, was zu gegensätzlichen Unterschieden in den Wahrscheinlichkeiten von 0 Tagen und der durchschnittlichen Anzahl von Tagen bei allen anderen Patienten führt. Solche gegensätzlichen Effekte können die Interpretation der kombinierten Schätzung erschweren und die Aussagekraft verringern [17]; Dies kann jedoch auch durch eine separate Analyse der Mortalität beurteilt werden, wie dies üblicherweise durchgeführt und empfohlen wird [2]. Die Null-Eins-inflationierte Beta-Regression kann theoretisch den Hürden-negativen Binomialmodellen vorzuziehen sein, wenn eine gewisse Inflation beim Maximalwert erwartet wird; Hürden-negative Binomialmodelle sind jedoch einfacher zu verwenden und die Gruppenmittelwerte können in diesen Beispielen besser geschätzt werden. Selbst wenn daher eine gewisse Inflation beim Maximalwert zu erwarten ist, kann ein Hürdenmodell eine geeignete Wahl sein, wenn das Hauptinteresse auf der Modellierung des Anteils der Werte von 0 und > 0 liegt, und Hürdenmodelle können im Vergleich zu Drei-Hürden-Modellen auch eine höhere Präzision bieten. Teilmodelle aufgrund der Verwendung eines Untermodells weniger. Alternativ können längere Nachbeobachtungsdauern gewählt werden, um die Inflation auf den Maximalwert zu begrenzen. Ähnliche Modelle, die hier nicht behandelt werden, umfassen Hürden-Poisson-Modelle (Poisson-Modelle sind weniger flexibel als negative Binomialmodelle, was zu schlechteren Anpassungen führen kann [40]), Hürden-Log-Normal-Modelle, die für die Modellierung nicht negativer kontinuierlicher (nicht zählender) Modelle geeignet sind. Daten und nullinflationierte negative Binomial-/Poisson-Modelle (ähnlich den Hürdenmodellen, aber Modell 0 stammt aus zwei separaten Prozessen und erschwert daher die Interpretation). Schließlich können auch Beta-Binomial-Modelle (ein überstreutes Binomialmodell) für Zählergebnisse mit Maximalwerten in Betracht gezogen werden [40,41,42]. Dieses Modell kann Anpassungen wie die Null-Eins-aufgeblasene Beta-Regression mit höherer Präzision liefern (da es nicht aus mehreren Untermodellen besteht), jedoch ohne die Möglichkeit, Minimal-/Maximalwerte separat zu schätzen. Alternativ wurde kürzlich ein ordinales Beta-Regressionsmodell vorgeschlagen, das ebenfalls in Betracht gezogen werden könnte [43].
Das bewertete kumulative logistische Regressionsmodell weist die geringsten Verteilungsannahmen auf und passt möglicherweise insgesamt gut zu den Daten. Allerdings ist das Ordinal-Odds-Ratio etwas schwierig zu interpretieren, da es sich nicht um eine absolute oder klinisch interpretierbare Skala handelt. Daher ist es schwierig, einen klinisch relevanten Unterschied zu definieren, es sei denn, die Mittelwerte werden durch die Kombination der Wahrscheinlichkeiten aller Zählungen in den Daten geschätzt. Die zentrale Annahme dieses Modells (d. h. dass die Chancen proportional sind) trifft möglicherweise nicht zu, und aus klinischer Sicht können die Auswirkungen der Behandlung zumindest in der Größenordnung auf die Sterblichkeit und die Anzahl der Tage am Leben und ohne lebenserhaltende Maßnahmen bei Überlebenden plausibel unterschiedlich sein . Verstöße gegen die Annahme der proportionalen Gewinnchancen machen das Modell zwar nicht unbedingt ungültig (Tabelle S1 in der Zusatzdatei 1) [44], sie können sich jedoch auf die Ergebnisse auswirken, insbesondere wenn Mittelwerte oder andere absolute Effektmaße berechnet werden. In solchen Situationen kann die Verwendung von Proportional-Odds-Modellen zu unter-/überschätzten Gruppenmittelwerten (und folglich zu falschen Mittelwertdifferenzschätzungen) führen, wie in diesen Analysen zu sehen ist. Bemerkenswert ist, dass die Annahme der proportionalen Quoten mithilfe des (eingeschränkten) partiellen proportionalen Quotenmodells [45] gelockert werden kann, obwohl dies die Komplexität sowohl der Modellierung als auch der Interpretation weiter erhöht.
Zusätzlich zum verwendeten statistischen Gesamtmodell ist eine detaillierte grafische Darstellung der gesamten und täglichen Rohdaten sowie eine Darstellung der Wahrscheinlichkeiten der Mindest-/Höchstwerte und der Gesamtmortalität für denselben Nachbeobachtungszeitraum ratsam, um die Interpretation zu erleichtern und sicherzustellen, dass gegensätzliche Richtungen vorliegen Auswirkungen auf die Mortalität und die Anzahl der Überlebenstage liegen nicht vor, da die kombinierte Schätzung in diesem Fall möglicherweise nicht klinisch aussagekräftig ist [17]. Es stehen verschiedene Visualisierungsmöglichkeiten zur Verfügung; Methoden, die die Verteilungen von DAWOLS visualisieren (z. B. die beiden oberen Teildiagramme in Abb. 4), sind relativ einfach zu interpretieren und geben schnell einen Überblick und einen Eindruck darüber, ob unterschiedliche Richtungseffekte vorliegen. Mithilfe komplexerer Diagramme können mehr Details vermittelt werden (z. B. das untere Unterdiagramm in Abb. 4, das die Anteile der Patienten in unterschiedlichen Zuständen pro Tag veranschaulicht), die zusätzliche Komplexität erfordert jedoch eine genauere Prüfung, um sie vollständig interpretieren zu können.
Diese Studie weist mehrere Stärken auf. Zunächst haben wir einen Überblick (Abb. 2) über die zentralen methodischen Überlegungen und Entscheidungen gegeben, einschließlich der technischen, theoretischen, praktischen und interpretatorischen Aspekte jedes Modells. Dies ist in der Praxis wichtig, da die Interpretierbarkeit ein triftiger Grund dafür sein kann, ein Modell einem anderen vorzuziehen, insbesondere wenn keine individuellen Vorhersagen erforderlich sind. Zweitens haben wir Bayes'sche Methoden und grafische Posterior-Predictive-Checks verwendet, um eine intuitive und visuelle Interpretation darüber zu liefern, wie gut Modelle zu den komplexen Verteilungen passen, und um eine einfache Berechnung abgeleiteter, kombinierter Effektschätzungen (einschließlich Unsicherheit) für mehrteilige Modelle zu ermöglichen. Während diese Analysen in einem Bayes'schen Kontext durchgeführt wurden, gelten die meisten in diesem Manuskript diskutierten Überlegungen gleichermaßen für die frequentistische Umgebung.
Auch die Studie weist Einschränkungen auf. Erstens haben wir nur Modelle in einem einzigen Datensatz verglichen; Wir haben daher ein Beispiel bereitgestellt, aber die relative Modellleistung und die Anpassungsgüte in anderen Datensätzen können etwas abweichen. Der Vergleich der Modellleistung in mehreren realen Datensätzen wäre für die Zukunft wertvoll und wahrscheinlich einem simulationsbasierten Modellvergleich vorzuziehen, da die Komplexität der Verteilungen von DAWOLS und DAOH eine Herausforderung darstellt und die Ergebnisse wahrscheinlich erheblich vom verwendeten datengenerierenden Modell abhängen in solchen Simulationen. Zweitens haben wir eine begrenzte Anzahl von Modellen berücksichtigt und uns nur auf Regressionsmodelle konzentriert, ohne nichtparametrische Tests aufgrund der im Hintergrund dargelegten Einschränkungen zu berücksichtigen. Zeit-zu-Ereignis-/Überlebensmodelle wurden in einigen RCTs verwendet, die Varianten von DAWOLS verwenden (z. B. RCTs mit Schwerpunkt auf mechanischer Beatmung, bei denen alle Patienten zu Beginn beatmet werden [46]), aber diese Methoden wurden hier nicht behandelt, da sie vorhanden sind oft nicht geeignet, z. B. wenn nicht alle Patienten mit lebenserhaltenden Maßnahmen beginnen oder wenn eine erhebliche Anzahl von Patienten während der Aufnahme mehrmals lebenserhaltende Maßnahmen ein-/ausschalten oder wenn eine Wiedereinweisung ins Krankenhaus nach der ersten Entlassung üblich oder relevant ist. Es könnten komplexere Modelle wie Gauß-Prozesse und Kerndichteschätzer in Betracht gezogen werden, die möglicherweise eine bessere Anpassung an die Daten ermöglichen, sowie longitudinale Markov-/Zustandsübergangsmodelle, die alle alle täglich verfügbaren Informationen nutzen, ohne die Ergebnisse auf eine einzige Anzahl von Tagen zusammenzufassen . Wichtig ist, dass die betrachteten Modelle alle gut dokumentiert, relativ einfach zu verwenden und zu interpretieren sind und in stabilen und gut dokumentierten Softwarepaketen implementiert sind [25]. Schließlich haben wir die allgemeinen Vor- und Nachteile von DAWOLS oder ähnlichen Arten von Ergebnissen und deren unterschiedliche Definitionen nicht im Detail erörtert; Dies wurde an anderer Stelle getan [2, 8, 17, 46] und geht über den Rahmen des vorliegenden Manuskripts hinaus.
Da alle Modelle, die zur Analyse von DAWOLS und ähnlichen Zählergebnissen verwendet werden, potenzielle Vor- und Nachteile haben, ist es von größter Bedeutung, vorab einen statistischen Analyseplan festzulegen, der auf sorgfältigen Überlegungen zu den erwarteten Datenverteilungen, klinisch relevanten Effektmaßen von Interesse und wichtigen Faktoren basiert Vorteile und Kompromisse mit dem gewählten Modell. Wie bereits dargestellt, kann die Wahl unterschiedlicher Verteilungen Auswirkungen auf die Ergebnisse und deren Interpretation haben [40]. Daher muss der Ansatz vorab spezifiziert werden und idealerweise einen primären Plan und einen Plan zur Bewertung der Modellannahmen und der Eignung mit alternativen Ansätzen enthalten, die angewendet werden sollen, wenn sich der primäre Ansatz als ungeeignet erweist [34, 40]. Darüber hinaus können Sensitivitätsanalysen mit unterschiedlichen Ansätzen in Betracht gezogen werden, um den Einfluss der Modellwahl zu bewerten. Abschließend empfehlen wir dringend, detaillierte Ergebnisdaten darzustellen und zu betrachten (grafisch und/oder als separate Komponenten), um die Interpretation zu erleichtern und irreführende Schlussfolgerungen zu vermeiden, wenn gegensätzliche Effekte auf verschiedene Komponenten ganz oder teilweise aufgehoben werden [17]. Besonders wichtig ist die Darstellung separater Mortalitätsdaten zum gleichen Nachbeobachtungszeitpunkt [2].
Abschließend haben wir wichtige methodische Überlegungen bei der Analyse von DAWOLS und ähnlichen Zählergebnissen erörtert. Wir haben mehrere Regressionsmodelle diskutiert und bewertet, die erweiterbar und sowohl für einfache als auch komplexe RCTs geeignet sind, eine Abschätzung der Behandlungseffekte unabhängig von der Anzahl der Behandlungsarme ermöglichen und eine Anpassung für mehrere Kovariaten ermöglichen. Die besprochenen Modelle haben alle Vor- und Nachteile, und obwohl kein Modell allgemein empfohlen wird, soll dieses Manuskript klinischen Prüfern, Statistikern und anderen Forschern helfen, eine fundierte Entscheidung zu treffen.
Vollständig anonymisierte Daten einzelner Teilnehmer aus der COVID-STEROID-2-Studie werden nach Genehmigung durch das Studienmanagementkomitee auf begründete Anfrage an das Studienmanagementkomitee weitergegeben. Der Analysecode für dieses Projekt ist auf Anfrage beim entsprechenden Autor erhältlich.
Gaudry S, Messika J, Ricard JD, Guillo S, Pasquet B, Dubief E, et al. Patientenrelevante Ergebnisse in randomisierten kontrollierten Studien bei kritisch kranken Patienten: eine systematische Überprüfung. Ann Intensivpflege. 2017;7(1):28.
Artikel PubMed PubMed Central Google Scholar
Granholm A, Anthon CT, Kjær MN, Maagaard M, Kaas-Hansen BS, Sivapalan P, et al. Andere für den Patienten wichtige Ergebnisse als die Mortalität in aktuellen Studien auf der Intensivstation: eine Scoping-Überprüfung. Crit Care Med. 2022;50(10):e759–71.
Artikel PubMed Google Scholar
Harrell F. Informationsgewinn durch die Verwendung ordinaler statt binärer Ergebnisse. Statistisches Denken. 2018. Verfügbar unter: https://www.fharrell.com/post/ordinal-info/. Zugriff am 7. Februar 2023.
Harhay MO, Wagner J, Ratcliffe SJ, Bronheim RS, Gopal A, Green S, et al. Ergebnisse und statistische Aussagekraft in randomisierten Studien zur Intensivpflege für Erwachsene. Am J Respir Crit Care Med. 2014;189(12):1469–78.
Artikel PubMed PubMed Central Google Scholar
Aberegg SK, Richards DR, O'Brien JM. Delta-Inflation: Eine Verzerrung im Design randomisierter kontrollierter Studien in der Intensivmedizin. Kritische Pflege. 2010;14(2):R77.
Artikel PubMed PubMed Central Google Scholar
Myles PS, Shulman MA, Heritier S, Wallace S, McIlroy DR, McCluskey S, et al. Validierung der Tage zu Hause als Ergebnismaß nach der Operation: eine prospektive Kohortenstudie in Australien. BMJ offen. 2017;7(8): e015828.
Artikel PubMed PubMed Central Google Scholar
Jerath A, Austin PC, Wijeysundera DN. Tage am Leben und außerhalb des Krankenhauses: Validierung eines patientenzentrierten Ergebnisses für die perioperative Medizin. Anästhesiologie. 2019;131(1):84–93.
Artikel PubMed Google Scholar
Auriemma CL, Taylor SP, Harhay MO, Courtright KR, Halpern SD. Krankenhausfreie Tage: ein pragmatisches und patientenzentriertes Ergebnis für Studien mit kritisch und schwer erkrankten Patienten. Am J Respir Crit Care Med. 2021;204(8):902–9.
Artikel PubMed PubMed Central Google Scholar
Jakobsen JC, Tamborrino M, Winkel P, Haase N, Perner A, Wetterslev J, et al. Zähldatenanalyse in randomisierten klinischen Studien. J Biom Biostat. 2015;6:2
Google Scholar
Granholm A, Alhazzani W, Derde LPG, Angus DC, Zampieri FG, Hammond NE, et al. Randomisierte klinische Studien in der Intensivpflege: Vergangenheit, Gegenwart und Zukunft. Intensivmedizin. 2022;48(2):164–78.
Artikel CAS PubMed Google Scholar
Dunkler D, Haller M, Oberbauer R, Heinze G. Testen oder schätzen? P-Werte versus Effektgrößen. Transpl Int. 2020;33(1):50–5.
Artikel PubMed Google Scholar
Kahan BC, Morris TP. Unsachgemäße Analyse von Studien, die mithilfe stratifizierter Blöcke oder Minimierung randomisiert wurden. Stat Med. 2012;31(4):328–40.
Artikel PubMed Google Scholar
Hernández AV, Steyerberg EW, Habbema JDF. Die Kovariatenanpassung in randomisierten kontrollierten Studien mit dichotomen Ergebnissen erhöht die statistische Aussagekraft und verringert den Bedarf an Stichprobengröße. J Clin Epidemiol. 2004;57(5):454–60.
Artikel PubMed Google Scholar
Zampieri FG, Casey JD, Shankar-Hari M, Harrell FE, Harhay MO. Verwendung von Bayes'schen Methoden zur Verbesserung der Interpretation von Studien zur Intensivpflege. Ein Überblick über die Theorie und beispielhafte Neuanalyse der alveolären Rekrutierung für die Studie zum akuten Atemnotsyndrom. Am J Respir Crit Care Med. 2021;203(5):543–52.
Artikel PubMed PubMed Central Google Scholar
COVID STEROID 2-Studiengruppe. Wirkung von 12 mg gegenüber 6 mg Dexamethason auf die Anzahl der Tage, die ohne lebenserhaltende Maßnahmen bei Erwachsenen mit COVID-19 und schwerer Hypoxämie leben. JAMA. 2021;326(18):1807–17.
Artikel Google Scholar
Schoenfeld, Bernard GR, ARDS Network. Statistische Auswertung beatmungsfreier Tage als Wirksamkeitsmaß in klinischen Studien zur Behandlung des akuten Atemnotsyndroms. Crit Care Med. 2002;30(8):1772–7.
Artikel PubMed Google Scholar
Yehya N, Harhay MO, Curley MAQ, Schoenfeld DA, Reeder RW. Neubewertung beatmungsfreier Tage in der Intensivpflegeforschung. Am J Respir Crit Care Med. 2019;200(7):828–36.
Artikel PubMed PubMed Central Google Scholar
Zeileis A, Kleiber C, Jackman S. Regressionsmodelle für Zähldaten in R. J Stat Softw. 2008;27(8):1–25.
Artikel Google Scholar
Liu F, Kong Y. zoib: Ein R-Paket für Bayes'sche Inferenz für Beta-Regression und Zero/One Inflated Beta-Regression. RJ. 2015;7(2):34–51.
Artikel Google Scholar
Ospina R, Ferrari SLP. Eine allgemeine Klasse von um null oder eins aufgeblasenen Beta-Regressionsmodellen. Statistikdaten berechnen Analysieren. 2012;56(6):1609–23.
Artikel Google Scholar
Harrell FE. Regressionsmodellierungsstrategien. 2. Aufl. New York: Springer; 2015.
Buchen Sie Google Scholar
Bürkner PC, Vuorre M. Ordinale Regressionsmodelle in der Psychologie: ein Tutorial. Adv Methods Pract Psychol Sci. 2019;2:77–101.
Artikel Google Scholar
Guyatt GH, Oxman AD, Kunz R, Brozek J, Alonso-Coello P, Rind D, et al. GRADE-Richtlinien: 6. Bewertung der Qualität der Beweise – Ungenauigkeit. J Clin Epidemiol. 2011;64(12):1283–93.
Artikel PubMed Google Scholar
Carpenter B, Gelman A, Hoffman MD, Lee D, Goodrich B, Betancourt M, et al. Stan: eine probabilistische Programmiersprache. J Stat Softw. 2017;76:1.
Artikel PubMed PubMed Central Google Scholar
Bürkner-PC. brms: ein R-Paket für Bayes'sche Mehrebenenmodelle unter Verwendung von Stan. J Stat Softw. 2017;80(1):1–28.
Artikel Google Scholar
Vehtari A, Gelman A, Simpson D, Carpenter B, Bürkner PC. Rangnormalisierung, Faltung und Lokalisierung: eine verbesserte Methode zur Beurteilung der Konvergenz von MCMC (mit Diskussion). Bayesianischer Analsex. 2021;16(2):667–718.
Artikel Google Scholar
Daniel R, Zhang J, Farewell D. Aus Orangen Äpfel machen: Vergleich nicht kollabierbarer Effektschätzer und ihrer Standardfehler nach Anpassung für verschiedene Kovariatensätze. Biom J. 2021;63(3):528–57.
Artikel PubMed Google Scholar
Vehtari A. Häufig gestellte Fragen zur Kreuzvalidierung. Modellauswahl. 2022. Verfügbar unter: https://avehtari.github.io/modelselection/CV-FAQ.html. Zugriff am 7. Februar 2023.
Google Scholar
Gabry J, Simpson D, Vehtari A, Betancourt M, Gelman A. Visualisierung im Bayes'schen Workflow. JR Stat Soc A. 2019;182:389–402.
Artikel Google Scholar
Schreibausschuss für die REMAP-CAP-Ermittler. Wirkung von Hydrocortison auf Mortalität und Organunterstützung bei Patienten mit schwerem COVID-19: Die randomisierte klinische Studie REMAP-CAP COVID-19 Corticosteroid Domain. JAMA. 2020;324(13):1317–29.
Artikel Google Scholar
Munch MW, Granholm A, Myatra SN, Vijayaraghavan BKT, Cronhjort M, Wahlin RR, et al. Höhere vs. niedrigere Dosen von Dexamethason bei Patienten mit COVID-19 und schwerer Hypoxie (COVID STEROID 2)-Studie: Protokoll und statistischer Analyseplan. Acta Anaesthesiol Scand. 2021;65(6):834–45.
Artikel CAS PubMed PubMed Central Google Scholar
Maitland K, Kiguli S, Olupot-Olupot P, Hamaluba M, Thomas K, Alaroker F, et al. Randomisierte kontrollierte Studie zur Sauerstofftherapie und High-Flow-Nasentherapie bei afrikanischen Kindern mit Lungenentzündung. Intensivmedizin. 2021;47(5):566–76.
Artikel CAS PubMed PubMed Central Google Scholar
Nørskov AK, Lange T, Nielsen EE, Gluud C, Winkel P, Beyersmann J, et al. Bewertung der Annahmen statistischer Analysemethoden in randomisierten klinischen Studien: das Was und Wie. BMJ Evid Based Med. 2021;26(3):121–6.
Artikel PubMed Google Scholar
Nielsen EE, Nørskov AK, Lange T, Thabane L, Wetterslev J, Beyersmann J, et al. Bewertung von Annahmen für statistische Analysen in randomisierten klinischen Studien. BMJ Evid Based Med. 2019;24(5):185–9.
Artikel PubMed Google Scholar
Bland JM, Altman DG. Statistikhinweise: Bootstrap-Resampling-Methoden. BMJ. 2015;350: h2622.
Artikel PubMed Google Scholar
Lumley T, Diehr P, Emerson S, Chen L. Die Bedeutung der Normalitätsannahme in großen Datensätzen zur öffentlichen Gesundheit. Annu Rev Public Heal. 2002;23:151–69.
Artikel Google Scholar
Deke J. Verwendung des linearen Wahrscheinlichkeitsmodells zur Abschätzung der Auswirkungen auf binäre Ergebnisse in randomisierten kontrollierten Studien. Mathematica. 2014. Verfügbar unter: https://www.mathematica.org/publications/using-the-linear-probability-model-to-estimate-impacts-on-binary-outcomes-in-randomized. Zugriff am 7. Februar 2023.
Koenker R, Hallock KF. Quantilregression. J Econ-Perspektive. 2001;15(4):143–56.
Artikel Google Scholar
Rodriquez RN, Yao Y. Fünf Dinge, die Sie über Quantilregression wissen sollten. SAS Institute Inc. 2017. Verfügbar unter: https://support.sas.com/resources/papers/proceedings17/SAS0525-2017.pdf. Zugriff am 7. Februar 2023.
Wagner B, Riggs P, Mikulich-Gilbertson S. Die Bedeutung der Verteilungswahl bei der Modellierung von Substanzkonsumdaten: ein Vergleich von negativen Binomial-, Beta-Binomial- und Null-inflationierten Verteilungen. Bin J Drogen-Alkohol-Missbrauch. 2015;41(6):489–97.
Artikel PubMed PubMed Central Google Scholar
Liu CF, Burgess JF, Manning WG, Maciejewski ML. Beta-binomiale Regression und bimodale Nutzung. Gesundheitsdienst Res. 2013;48(5):1769–78.
PubMed PubMed Central Google Scholar
Najera-Zuloaga J, Lee DJ, Arostegui I. Vergleich von Beta-binomialen Regressionsmodellansätzen zur Analyse gesundheitsbezogener Daten zur Lebensqualität. Statistische Methoden Med Res. 2018;27(10):2989–3009.
Artikel PubMed Google Scholar
Kubinec R. Ordered Beta Regression: Ein sparsames, gut passendes Modell für kontinuierliche Daten mit Unter- und Obergrenzen. Polit-Analyse. 2022;1–18. https://doi.org/10.1017/pan.2022.20.
Harrell F. Ein Verstoß gegen die proportionalen Quoten ist nicht tödlich. Statistisches Denken. 2020. Verfügbar unter: https://www.fharrell.com/post/po/ . Zugriff am 7. Februar 2023.
Google Scholar
Petersen B, Harrell FE Jr. Partielle proportionale Quotenmodelle für ordinale Antwortvariablen. JR Stat Soc Ser C (Angewandte Statistik). 2019;39:205–17.
Google Scholar
Bodet-Contentin L, Frasca D, Tavernier E, Feuillet F, Foucher Y, Giraudeau B. Ergebnisse von beatmungsfreien Tagen können irreführend sein. Crit Care Med. 2018;46(3):425–9.
Artikel PubMed Google Scholar
Referenzen herunterladen
Die Autoren möchten allen an der COVID STEROID 2-Studie Beteiligten danken [15].
Open-Access-Finanzierung durch die Königliche Bibliothek der Universitätsbibliothek Kopenhagen. Dieses Projekt wurde im Rahmen des Forschungsprogramms Intensive Care Platform Trial (INCEPT) (www.incept.dk) durchgeführt, das darauf abzielt, einen adaptiven Plattformversuch zu etablieren, der in einer breiten Bevölkerungsgruppe durchgeführt wird akut erkrankter Erwachsener auf teilnehmenden Intensivstationen aufgenommen. Das INCEPT-Programm wurde von Sygeforsikringen „danmark“, dem Grosserer Jakob Ehrenreich og Hustru Grete Ehrenreichs Fond und dem Dagmar Marshalls Fond finanziert. Die COVID STEROID 2-Studie wurde von der Novo Nordisk Foundation finanziert und vom Forschungsrat des Rigshospitalet unterstützt. MOH wird von den United States National Institutes of Health, dem National Heart, Lung, and Blood Institute (Fördernummer R01-HL168202) finanziert.
Keiner der Geldgeber hatte Einfluss auf irgendeinen Aspekt dieser Studie.
Abteilung für Intensivmedizin 4131, Universitätskrankenhaus Kopenhagen – Rigshospitalet, DK-2100, Kopenhagen, Dänemark
Anders Granholm, Benjamin Skov Kaas-Hansen, Marie Warrer Munch, Anders Perner und Morten Hylander Møller
Abteilung für Biostatistik, Abteilung für öffentliche Gesundheit, Universität Kopenhagen, Kopenhagen, Dänemark
Benjamin Skov Kaas-Hansen, Theis Lange & Aksel Karl Georg Jensen
Labor für Methoden und Ergebnisse klinischer Studien, Palliative and Advanced Illness Research Center, Perelman School of Medicine an der University of Pennsylvania, Philadelphia, USA
Michael O. Harhay
Abteilung für Biostatistik, Epidemiologie und Informatik, Perelman School of Medicine der University of Pennsylvania, Philadelphia, USA
Michael O. Harhay
HCor Research Institute, São Paulo, Brasilien
Fernando G. Zampieri
Abteilung für Intensivmedizin, Fakultät für Medizin und Zahnmedizin, University of Alberta, Alberta, Kanada
Fernando G. Zampieri
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Konzeptualisierung: AG, BSKH, MHM, AKGJ. Datenkuration: AG, MWM. Formale Analyse: AG. Finanzierungseinwerbung: AG, TL, MWM, AP, MHM. Untersuchung: AG, TL, MWM, AP, MHM. Methodik: AG, BSKH, MHM, AKGJ. Aufsicht: MHM, AKGJ. Visualisierung: AG. Schreiben – Originalentwurf: AG. Schreiben – Rezension und Bearbeitung: alle Autoren.
Unzutreffend.
Korrespondenz mit Anders Granholm.
Die COVID-STEROID-2-Studie wurde von den Ethikausschüssen für Gesundheitsforschung in der Hauptstadtregion Dänemarks (H-20051056) und allen weiteren relevanten nationalen/lokalen Behörden genehmigt und im Einklang mit der Deklaration von Helsinki sowie allen Patienten oder ihren gesetzlichen Stellvertretern durchgeführt gab eine Einverständniserklärung. Weitere Einzelheiten zu Zulassungen und dem Verfahren der Einwilligung nach Aufklärung finden Sie in der primären Studienpublikation [15].
Unzutreffend.
Die Abteilung für Intensivmedizin am Universitätskrankenhaus Kopenhagen – Rigshospitalet hat Fördermittel für andere Forschungsprojekte von der Novo Nordisk Foundation, Pfizer und Fresenius Kabi erhalten und führte Auftragsforschung für AM-Pharma durch.
Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.
Eine Tabelle mit einer Zusammenfassung der berücksichtigten Modelle und zusätzlicher Diagramme, einschließlich der Bewertung der Annahme der proportionalen Quoten für das kumulative Logistikmodell und späterer Vorhersageprüfungen für alle Modelle, finden Sie in der Zusatzdatei 1.pdf.
Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/. Der Creative Commons Public Domain Dedication-Verzicht (http://creativecommons.org/publicdomain/zero/1.0/) gilt für die in diesem Artikel zur Verfügung gestellten Daten, sofern in einer Quellenangabe für die Daten nichts anderes angegeben ist.
Nachdrucke und Genehmigungen
Granholm, A., Kaas-Hansen, BS, Lange, T. et al. Verwendung von Tagen am Leben ohne lebenserhaltende Maßnahmen und ähnliche Zählergebnisse in randomisierten klinischen Studien – ein Überblick und ein Vergleich der methodischen Entscheidungen und Analysemethoden. BMC Med Res Methodol 23, 139 (2023). https://doi.org/10.1186/s12874-023-01963-z
Zitat herunterladen
Eingegangen: 15. Februar 2023
Angenommen: 03. Juni 2023
Veröffentlicht: 14. Juni 2023
DOI: https://doi.org/10.1186/s12874-023-01963-z
Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:
Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.
Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt