Análisis Interino en Ensayos Clínicos: Una Guía Metodológica (Italiano)

Análisis Interino en Ensayos Clínicos: UNA GUÍA Metodológica

Analisi intermedia in studi clinici: A
Guida metodologica

Sergio R Muñoz N, Shrikant I Bangdiwala

Analisi intermedia dei dati accumulati in studi clinici è un aspetto del monitoraggio dei progressi dello studio . Di solito è fatto per valutare se vi sono differenze significative nell’efficacia tra i gruppi di trattamento sperimentale e di controllo, al fine di decidere se interrompere o non lo studio prematuramente. Tra molte ragioni per l’interruzione precoce di un processo è la considerazione etica che i soggetti non dovrebbero essere esposti a un trattamento non sicuro, inferiore o inefficace. Metodi statistici adatti per aver fatto analisi intermedia, che consentono di controllare la probabilità di rifiutare erroneamente l’ipotesi nullo di differenze di trattamento, spesso non sono ben compresi dai ricercatori. In questo articolo presentiamo una spiegazione e revisione intuitiva e non matematica dei metodi statistici per aver effettuato l’analisi intermedia in studi clinici insieme a un esempio illustrativo dell’applicazione dei metodi su un set da dati ipotetico (Rev Méd Chile 2000; 128: 935- 41).
(parole chiave: protocolli clinici; Progettazione di ricerca; Statistiche & Dati numerici.

Recibido El 27 de Erio, 2000. ACTADO EL 23 DE MARZO , 2000.
Financiardo en Parte di Grants # 1980373 Y 7980063 De Fondo Nacional de Ciencias y Tec-
Nología (Festorecyt) de Cile.
Facultad de Medicina, Universidad de la Frontera, Temuco, Cile.
Parcheentamento della Biostatistica, Università della Carolina del Nord a Chapel Hill, Stati Uniti d’America.

Este artículo presenta la metodología y los aspectos relacionados al término anticipato de ensyos clínicos denro del contexto de la visión de un investigatore clínico. el Objetivo Principal de Este Artículo Es Ayudur al Investigador Clínico A Enertene Los Principio Estadísticos de monitoración Y Loss Aspectos Que Beftan La Interpretazione de los Risultados de un ensayo clínico.

un ensayo clínico es estudio sperimentale disonado paravaluar la eficicacia de un tratamiento en seres humanos a tra Vés de la comparazione de los Risultatos en un grupo de pacientes a tal modo un tratamiento sperimentale con otro Grupo de pacientes queciben non tratamiento de controllo. It Generale, El Diseño De Un Ensayo Clínico Prenota Aspectos Éticos Que Se Relacionan con El Paciente, Y por Lo Tanto Involutra Análisis Interinos Previos Al Término de la Recolección Totale de los Datos Definiido Para El estudio. El Análisis Interino Realizado Sobre los DATOS ACUMULADOS A Un Tiempo DADO, SE Realiza con El Fin de Determinar La Existencia de Diferencias Significativas Entre Los Tratamientos IT Compartión de Modo de Determinar La Posibilidad de Detoten El estudio it forma anticipazione1.

Razoni PARA UNA DETENCIÓN ANTICIPADA DE UN ESSYO CLÍNICO. Entre Las Múltiples Razonis Para Realizar El Análisis de Datos Interino, SE Encuentra La Posible Evidencia de encontrar Diferencias de Eficiacia Entre Los Tratamientos en Etapas Tempranas de la Conducción del estudio, como a la vez la considerazione Ética de que los pacientes no deberían Estar Expestos a Un Tratamiento Que Seaguro, inferiore o inefectivo2.

Las Razones PARA UNS TÉRMINO ANTICIPATO DE UN ESSYO CLÍNICO PUEDEN AGRAPRASSE EN LAS SIGUENTISS Categorías: (i) Considerazione relacionatas A La Conduttión Generale del Estudio; (ii) considerazioni relacionatas a la respuesta clínica que se acumula durante el estudio; y (iii) información externa al estudio (tabla 1).

la considerazione primeria es que los pacientes que partecipazione de un ESTUDIO DE ESTA NATURALEZA, CONFÍAN EN QUE EL ESTUDIO NO SE CONDURÍA UNA EL ESTUSIO NO SE ECUENTREN EVENCIAS RAZONABILS DE TOXICIDAD inaccettabile, o si la diferencia entre la eficiacia de los tratamientos se ha stabilimento más allá de la debida a variaciones producto del azar, o si SE EVIDIDENZIA UN FINAL DEL ESTUDIO SIN CONCLUSIONS CONCLUITOSS CLARASS. UN ESTUDIIO MAL CONDUCIDO DEBIDO A UN POBRE RECLUTAMIENTO DE PACIENTES, MALA ASIGNACIÓN DE PACIENTES, PROMAZIONI DE SEGUIMITONO, DE ENMASCARAMENTO, DE ADHESIÓN A LOS Tratamientos, O DE MANEJO DE DATOS, HACE QUE MUY PROBABLEMENTE SE PRODUZCA UN SESGO EN LA FAFFARIÓN Hacia El Efecto Nulo Y De Este MODO RISULTATO UN ESTUDIIO CON UNA POENCIA ESTADÍSTICA SUB-Valorada. Generalmente, Este Tito De Consenso Se Valúan Durante La Etapa de Diseño del ESTUDIO, Pero También Deben ser Contrastadas Durante La Ejecuzione del Mismo. SE considerano factors externos a Aquellos Que Están Más Allá del Control de Los Investigadores, Pero Estore Entran en las deliberaciones del llamado comité de monitoración de datos y de seguridad (scheda di monitoraggio dei dati e sicurezza).Gli aspetti relativi alla risposta ai trattamenti sono quelli che ricevono considerazione statistica e corrispondono a quelle presentate in questo lavoro.

implicazioni del primo termine di uno studio clinico. Il termine previsto di una sperimentazione clinica (prima del termine programmato) ha implicazioni sia di tipo statistico, sia nella diffusione dei suoi risultati. Tra le implicazioni statistiche, abbiamo il potenziale fatto che le differenze tra i trattamenti sono piccole, e in questo modo i valori P dei test di rilevanza statistica, le stime del punto e gli intervalli di confidenza devono essere regolati3-5 a causa di queste analisi Chiama gli intermedi. Un arresto anticipato di uno studio aumenta la variabilità della stima dovuta al numero più piccolo di eventi osservati, rendendo improbabile lo studio degli effetti a lungo termine. Il termine di uno studio prevede decisioni complesse che vanno dalla detenzione del reclutamento dei pazienti, dell’assegnazione dell’intervento ai pazienti già randomizzati a uno dei rami dello studio, fino alla completa detenzione dello studio. Ciò porta anche difficoltà nella decisione di come, quando ea chi diffondere i risultati; Le procedure del termine normale specificate nel protocollo dovrebbero essere accelerate e se non sono fatte di modo adeguato, può influire sulla credibilità dei risultati dello studio agli occhi della comunità scientifica e dei partecipanti allo studio, che ovviamente accettati partecipano in lui.

Termine anticipo e il ruolo del comitato di monitoraggio dei dati. Le considerazioni di tipo statistico corrispondono a una delle tante coinvolte nel processo di decidere per un potenziale arresto anticipato di una sperimentazione clinica. Il monitoraggio dei progressi di uno studio riposa nelle mani del cosiddetto comitato di monitoraggio dei dati esterni. Questo comitato è generalmente composto da medici clinici, epidemiologi, biostatistiche, etiche e altri professionisti correlati, si riuniscono periodicamente durante la condotta di studio e sono responsabili sia per la sicurezza del paziente, nonché le raccomandazioni sul potenziale termine previsto dallo studio6.

Disegni statistici. La maggior parte degli studi epidemiologici richiede un design statistico che include una dimensione fissa del campione, che viene calcolata in modo che lo studio abbia un potere statistico sufficiente per rilevare le differenze che sono state determinate come clinicamente significative. Tuttavia, questo tipo di design non è adatto per gli studi clinici, essenzialmente dovuti a problemi etici. È considerato non etico aspettare fino alla fine di uno studio quando si osservano reazioni avverse che garantiscono un arresto anticipato dello studio.

Un’alternativa ai disegni con dimensioni del campione fissa, sono i cosiddetti disegni sequenziali , nel che non è specificato in anticipo il numero totale di pazienti da studiare. In questo tipo di design, viene reclutato un gruppo di pazienti, i trattamenti sono randomizzati, e dopo un follow-up, l’ipotesi viene valutata in studio. Se non si ottengono risultati significativi, viene reclutato un secondo gruppo di pazienti, randomizzato, il suo follow-up è testato e l’ipotesi viene nuovamente testata. Da un punto di vista etico, questi classici disegni sequenziali sono migliori delle dimensioni del campione fisso perché consentono un potenziale arresto anticipato dello studio quando uno dei trattamenti è chiaramente superiore all’altro. Il più grande svantaggio di questo tipo di design sequenziale è che sia il costo totale che la durata dello studio sono sconosciuti, e in teoria la dimensione massima del campione non è limitata. Questo design può essere utilizzato negli studi con risposta immediata7.

Durante gli ultimi due decenni, sono state proposte diverse procedure statistiche alternative che consentono la realizzazione di analisi statistiche provvisorie basate sull’accumulo di dati e allo stesso tempo che ti permettono di mantenere il livello di significatività specificato. L’analisi intermedia è definita come una valutazione dei dati effettuata durante la fase di iscrizione del paziente e nella fase del follow-up, e il cui principale scopo (tra gli altri) è valutare l’effetto dei trattamenti. Un’analisi intermedia, possibilmente, possibilmente, alla decisione di fermare lo studio.

Se uno studio si ferma presto perché il trattamento sperimentale aumenta l’incidenza della risposta negativa, non dovrebbe essere considerata per continuare ad accumulare più dati , e non dovrebbero esserci altre considerazioni statistiche che non vanno oltre la stima dell’incidenza. Tuttavia, anche quando lo studio non viene arrestato in anticipo, entrambe le ipotesi che gli intervalli fidati richiedono un aggiustamento per queste analizzazioni precedenti.

Aspetti statistici in analisi interne e disegni sequenziali raggruppati. La soluzione ai problemi sopra riportati è fornita dal design chiamato “Design sequenziale raggruppato” 8. Questo tipo di design è particolarmente destinato alle analisi provvisorie perché consente di controllare la probabilità di errore di tipo I, che è noto come conseguenza della successione di test statistici effettuati sui dati che accumulano9. L’uso dei metodi basati su campioni di dimensioni fisse non è adatto perché non consentono la correzione del livello di significato. La decisione statistica di interrompere o continuare lo studio si basa sulla sequenza di prova statistica sui dati accumulati dopo la valutazione effettuata una volta effettuata il reclutamento di ciascun gruppo di pazienti. In questo modo, uno studio che mostra un imprevisto vantaggio precoce o effetti avversi, obbliga la considerazione di una detenzione precoce del processo.

La procedura generale dell’analisi sequenziale raggruppata richiede che la valutazione del trattamento sperimentale contro il trattamento sperimentale contro il trattamento sperimentale contro il trattamento sperimentale contro il trattamento sperimentale Controllo in un campione totale di n soggetti, viene effettuato in un numero pre-specificato di k volte e che i soggetti n sono stati randomizzati in k gruppi di 2n pazienti ciascuno (n = 2nk). Supponiamo che lo studio inizia con 2N pazienti in modo che siano randomizzati a ciascuno dei due rami del test. La decisione statistica di interrompere lo studio si basa sulla realizzazione di test statistici utilizzando i dati che si accumulano dopo la valutazione di ciascun gruppo di 2N pazienti. Il problema è che questo requisito è molto restrittivo poiché i dati si ottengono continuamente. D’altra parte, questa forma di raccolta e analisi dei dati prevede avere una risposta immediata ai trattamenti.

LAN e DEMETS10 ha proposto un metodo basato su ciò che hanno chiamato “funzione di spesa”, che consente di avere più test statistici flessibili di quelli sopra descritti. La procedura si basa sulla scelta di una funzione A (T), chiamata “funzione di spesa”, che specifica il tasso a cui è desiderato spendere la probabilità totale dell’errore di tipo I. Supponendo che lo studio inizia al tempo 0 e tempo È terminato, è scala in modo tale da t = 1, in modo che la funzione A (T) sia costruita in modo tale da A (0) = 0 ya (l) = a. Questa funzione fornisce la probabilità accumulata dell’errore di tipo I e consente di impostare la quantità di errore che si desidera spendere in ogni analisi. Aumentare A (TK) – A (TK-1) rappresenta il livello di significato aggiuntivo utilizzato a TK.

Esistono vari criteri di selezione di detta funzione di spesa11-13 che soddisfano la condizione di tale probabilità totale di Tipo I è un. Alcune delle elezioni più comuni sono presentate sotto.

Esempio numerico dell’applicazione delle funzioni di analisi intermedia e spesa. La prima considerazione è la statistica da utilizzare. Si presume che l’ipotesi di nullità sia l’assenza di differenze tra i trattamenti, e che l’ipotesi alternativa è che c’è una differenza. L’ipotesi alternativa è chiamata come “una coda” se è specificata la direzione della differenza, e come di “due code” se la direzione della differenza non è specificata. La statistica utilizzata è quella di Logrank13, che è equivalente alle statistiche standardizzate Z. Nella K-questa analisi interim, zk viene calcolata (k = 1.2, …., k). Per illustrare la metodologia, assumiamo che abbiamo uno studio di 24 mesi a lungo termine, con possibili analisi interim ogni tre mesi.

Le funzioni di spesa considerate in questo lavoro includono le procedure più comuni per l’analisi sequenziale Raggruppato, adattato dalla metodologia delle funzioni di spesa proposte da LAN e DEMETs10. Pocock14 ha suggerito una regolazione costante per i punti critici fissi delle Nazioni Unite relativi ai ripetuti test statistici delle analisi provvisorie pianificate. I punti critici proposti da O’Brien – Fleming15 diminuiscono monotono con K. Questo è più intuitivo, ed è stato che questa procedura è abbastanza popolare, poiché non è auspicabile per finire lo studio nelle fasi chiude all’inizio dello studio a meno che le differenze tra i gruppi siano confrontate siano sostanziali. Demes e LAN16 propongono una classe generale di funzioni di spesa ATP, dove P 0 è una costante che < 1 corrisponde alle spese precoci, Se = 1 è per spesa lineare o costante e se 1 corrisponde alla spesa tardiva del totale AAA. La Tabella 2 confronta le funzioni di Pocock, O’Brien e Fleming Spese e le funzioni di spesa per P = 0,5; 1.0; 1.5, in termini di requisiti necessari nel look intermedio K per soddisfare il controllo del livello del significato globale di uno A = 0,05.

della tabella 2 Mostra che la procedura di Pocock riguarda i livelli di spese che riducono la procedura di O’Brien e le spese di Fleming Livelli che aumentano da un livello molto basso e che le spese di spesa AAATP spendono ad aumentare a seconda che P 1 OP < 1.

Esempio dell’applicazione dell’analisi sequenziale raggruppata in studi clinici. Considerare una sperimentazione clinica in cui i partecipanti sono assegnati a caso a un trattamento sperimentale o un controllo. Supponiamo che vi sia un numero precedentemente specificato di analisi interne di K durante il periodo di studio e che la decisione di fermare lo studio si basa su test di significatività statistiche. Inoltre, presuppone che la decisione di interrompere in anticipo lo studio sia basato su ripetuti test di significatività delle statistiche dopo aver valutato ciascun gruppo. Se T denota il tempo di studio, le analisi intermedi vengono eseguite in T1 volte, …, TK, dove K non è specificato, e 0 < T1 < … < TK “£ 1. Tabella 3 presenta valori ipotetici dei numeri degli eventi osservati in ciascun gruppo durante il corso dello studio, il valore di Le statistiche del Logrank in ogni momento, così come il valore del non impostato nominale per le statistiche. È importante notare che in uno studio reale, al momento TK ha solo informazioni preventive in quel momento.

I gruppi di trattamento sono costantemente diversi durante tutti i periodi dello studio e raggiungono il significato statistico nominalmente nel tempo T = 12. alla misura in cui il tempo del Lo studio ha luogo, i numeri di eventi in entrambi i gruppi si stanno avvicinando e il valore delle statistiche di Lografs diminuisce. La decisione statistica di se si raggiungesse il significato. Basato sul valore del tempo nominale TK, che viene confrontato con il valore dell’aumento della funzione di spesa della Tabella 2, per una particolare funzione di spesa prescelta e prescelta. Si noti che se non vi è alcuna regolazione da parte dei test ripetuti, il significato statistico è raggiunto nell’analisi intermedia al tempo T = 12. Tuttavia, a seconda di quale funzione di spesa viene scelta, e quando viene deciso di eseguire analisi intermedia, il significato statistico è raggiunto in momenti diversi, come illustrato nella tabella 4.

Sotto lo scenario A, in cui le analisi intermedi sono ogni 6 mesi in modo uniforme, si raggiunge il significato nella terza analisi, al tempo T = 18 se utilizza le funzioni di spesa (B) o (e) Ciò “mantieni” l’A per analisi tardiva, ma non raggiunge il significato con le funzioni della spesa (A), (c), o (d), che “accoppiata” all’inizio. Con lo scenario B, uno sguardo precoce viene effettuato all’inizio dello studio, ma gli sguardi successivi sono fatti ogni 6 mesi; Tutte le funzioni di spesa eccetto (c) raggiungere il significato per la terza analisi, al tempo T = 15; La funzione di spesa (c) è una “manager anticipata” e quindi non raggiunge il significato statistico. Infine, in fase c, in cui la prima analisi provvisoria non viene eseguita fino al nono mese di studio di avvio, e quindi ogni 3 mesi per due periodi e un’analisi finale a 2 anni, i risultati non raggiungono il significato per le funzioni delle spese precoci A), (c) e (d); Trovare un significato statistico solo alla fine dello studio per le funzioni di spesa di O’Brien-Fleming (B) e definito in (E). Si noti che se le analisi interne vengono eseguite ogni tre mesi (tabella 2), il significato non viene mai ottenuto. La scelta, sia la funzione di spesa che la frequenza e la periodicità delle analisi interne influenzano il significato.

Discussione

In questo lavoro cerchiamo di fornire una spiegazione della necessità di trasportare Effettuato analisi intermedi in studi clinici, nonché per illustrare l’attuazione delle analisi statistiche. Oltre alle considerazioni dell’etica, le analisi provvisorie possono comportare importanti aumenti dell’efficienza e pertanto, in diminuzione dei costi di condurre studi clinici. Se non gestiscono correttamente dal punto di vista statistico, il risultato dell’analisi multipla delle informazioni accumulate potrebbe essere la possibilità di respingere falsamente l’ipotesi di nullità di qualsiasi differenza tra i trattamenti confrontati.

il Colpo di decisioni del comitato di monitoraggio dello studio esterno per una possibile cessazione anticipata di una sperimentazione clinica, utilizza informazioni statistiche come una delle diverse considerazioni che vengono valutate per arrivare a questa decisione difficile e complessa.Sono state le intenzioni di questo lavoro da fornire in modo chiaro e accessibile le considerazioni metodologiche statistiche in modo che la comunità medica che opera sulla ricerca clinica sperimentale possa essere apprezzata.

Corrispondenza A: Sergio R Muñoz Navarro. Unità epidemiologia clinica. Dipartimento della salute pubblica. Scuola di Medicina. Università del confine. M. Montt 112, Temuco. Chili. Telefono: (56) 45-325744. Fax: (56) 45-325741. E-mail: [email protected].

Riferimenti

1. Eerson SS, Fleming TR. Interim Analizza in studi clinici, oncologia 1990; 4: 126-36.

2. Jennison C, Turnbull B. Test di gruppo sequenziali e intervalli di confidenza ripetuti. Manuale di analisi sequenziale Vol 12 (Ghosh BK e SEN PK, EDS), Marcel Dekker LNC, New York, 1991; 283-311.

3. Eerson SS, Fleming TR. Estrazione dei parametri dopo il test di ipotesi sequenziale del gruppo. BIOMETRIKA 1990; 77: 875-92.

4. Siegmund D. stima seguendo i test sequenziali. BIOMETRIKA 1978; 65: 341-49.

5. TSIA AA, ROSNAR GL, MEHTA CR. Esatti intervalli di confidenza seguendo un test sequenziale di gruppo. Biometria 1984; 40: 797-803.

6. Whitehead J. su essere lo statistico sul pannello di monitoraggio dei dati e della sicurezza. Statistiche in medicina 1999; 18: 3425-34.

7. Whitehead J. La progettazione e analisi di studi clinici sequenziali. Halsted Press, New York 1983.

8. Di Mets DL. Aspetti pratici nel monitoraggio dei dati: una breve revisione. Statistiche in medicina 1987; 6: 753-60.

9. Armitage P, McPherson CK, Rowe BC. Ripetuti test significativi sui dati accumulanti. Journal of the Royal Statistical Society 1969; 132: 235-44.

10. LAN KKG, Mets DL. Bordi sequenziali discreti per le sperimentazioni cliniche. BIOMETRIKA 1983; 70: 659-63.

11. Kim K, Mets DL. Progettazione e analisi dei test sequenziali di gruppo in base alla frequenza della funzione di spesa errori tipo I. BIOMETRIKA 1987; 74: 149-54.

12. Hwang Ik, Shih WJ, da Cani Js. Disegni sequenziali di gruppo utilizzando una famiglia di errori di tipo L di errori Funzioni di spesa di probabilità. Statistiche in medicina 1990; 9: 1439-45.

13. Peto R, Pike MC, Armitage P, Breslow in, Cox Dr, Howard Sv, Tovaglia, McPherson K, Peto J, Smith PG. Progettazione e analisi di studi clinici randomizzati che richiedono un’osservazione prolungata di ciascun paziente. I. Introduzione e design. B cancio B J 1976; 34: 585-612.

14. Pocock SJ. Metodi sequenziali del gruppo nella progettazione e analisi degli studi clinici. BIOMETRIKA 1977; 64: 1919.

15. O’Brien PC, Fleming Th. Una procedura di test multipli per gli studi clinici. Biometria 1979; 35: 549-56.

16. Di Mets DL, LAN KKG. Analisi intermedia: l’approccio della funzione di spesa alfa, statistiche in medicina 1994; 13: 1341-52.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *