Análisis Interino en Ensayos Clínicos: Una Guía Metodológica

Análisis Interino en Ensayos Clínicos: Una Guía Metodológica

Analyse intermédiaire en essai cliniques: A Guide méthodologique

Sergio R Muñoz N, Shrikant I Bangdiwala

L’analyse intermédiaire des données accumulées dans des essais cliniques est l’un des aspects de la surveillance du progrès de l’étude . Il est généralement fait pour déterminer s’il existe des différences importantes d’efficacité entre les groupes de traitement expérimental et de contrôle, afin de décider de s’arrêter ou de ne pas le procès prématurément. Parmi les nombreuses raisons d’interruption anticipée d’un procès, la considération éthique ne devrait pas être exposée à un traitement dangereux, inférieur ou inefficace. Méthodes statistiques adaptées à une analyse intermédiaire, qui permettent de contrôler la probabilité de rejeter de manière incorrecte l’hypothèse nulle d’aucune différence de traitement, ne sont souvent pas bien comprises par des chercheurs. Dans cet article, nous présentons une explication intuitive et non mathématique et une révision des méthodes statistiques pour effectuer une analyse intermédiaire dans les essais cliniques, ainsi qu’un exemple illustratif de l’application des méthodes sur un jeu de données hypothétiques (Rev Médy Chili 2000; 128: 935- 41).
(mots-clés: protocoles cliniques; conception de la recherche; statistiques & données numériques.

Recibido el 27 de Enero, 2000. Aceptado el 23 de Marzo , 2000.
FinanciaDo EN Parte POR de bourses # 1980373 Y 7980063 de Fondo Nacional de CIENCIAS Y TEC-
Nología (Fondecyt) de Chili.
Faculdad de Medicina, Université de la Frontera, Temuco, Chili.
Département de la biostatistique, Université de Caroline du Nord à Chapel Hill, États-Unis.

Este Artículo Presence La Métodología Y Los Aspectie Relacionados Al Término AnruptAdo de Ensayos Clínicos Dentro del Context de la Visión de Nations Unies Investigador Clínico. El OBJETIVO PRINCIPAL DE ESTE Artículo es Pedagógico Y Su Intención es Ayudar Al Investigador Clínico Un entendeur Los Princios Estadísticos de Montinasación Y Los Aspectie Que Afectan La Interprète de l’Interprète de l’UNSAYO DE LOS RUESTADOS DE UNE ENSAYO CLÍNICO.

UNSAYO CLÍNICO ES UNESUDIO Expérimental Diseñado Para Evaluar La Eficacia de Nations Tratamiento en Seres Humanos A TRA Vés de la comparaison de los résultant de la GRUPO DE PACIENTES SOMMESTIDOS UN TRATAMIENTO EXPERIMENT CONCORE GRUPO DE PACIENTES QUE RECIBEN UN TRATAMIENTO DE CONTROL. En général, El Disño de Un Ensayo Clínico Considéa Aspectifos Éticos QUE SE Relacionan Con El Paciente, Y Per Lo Tanto Invucucra Análisis Interinos Previos Al Término de la Recolección Total de Los Datos Definido Para El Estudio. El Análisis Interino Realino Realizado Sobre Los Datos Acumulados A ONU TIEMPO DADO, SE REALIZA CON el FIN DE DIRECINAIRE LAISCIA DE DIAMENTENIE SIGNALATIVAS ENTRE LOS TRATAMIENTOS EN COMÉLION DE MODO DE DÉTERNAIRE EL Estudio en forma anticipéeA1.

RAZONES PARA UNA DÉCENTIÓN PROPOSEADA DE UN ENSAYO CLÍNICO. Entre Las Múltiples Razones Para Realizar El Análisis de Datos Interino, SE Encuentra la posable Evidencia de Encontrar Différencias de Eficacia Entre Los Tratamientos en Etica aîné à La Vez la Conduucción Ética de Que Los Pacientes No Deberían Estar Expuestos A ONU TRATAMIENTO que la mer Inseguro, inférieure O Infectivo2.

Las RAZONES PARA UNE TÉRMINO PARA PUREDO DE UNE ENSAYO CLÍNICO PUREDEN AGRUPARSE EN LAS SIGUIENTES CATÉGORÍAS AGRACIONADAS A LA CONDUCCIÓN Général Del Estudio; (ii) les considérations relacionadas a la respesta clínica que SE acumula Durante El Estudio; y (III) información externa al estudio (tabla 1).

La Considération PRIMARIA ES QUE LOS PACIENTES QUE PACIENTES Estudio de Esta Naturaleza, Confían en Quet Se Continuaría Una Vez Que SE Encuencias de Toxicidad Inaceptable, O SI La Diferencia Entre La Eficacia de los Tratamientos Se Headecido Más Allá de la Debida A Variaciones Producto Del Azar, O SI SE Evidencia ONUAL Del Estudio SIN Concluses ConcluseSe Claras. Un estudio mal concides debido A NU POBRE RECLUTAMIENTO DE PACIENTES, Mala Asignación de Paciennes, Problèmes de Seguimiento, de Enmascaramiento, O de Manejo de Datos, Hace que Muy PROBABILLEE SE PRODUZCA UN SESGO EN LA COMPARAIÓN HACIA EL EFECTO nulo y de este modo résultant UN ESTUDIO CONC UNA POTENCIA ESTADÍSTICA SOUS-VALORADA. Généralmente, Este Tipo de Considéciones SE Evaleure de Durante La Etapa de Disño del Estudio, Pero También Deben Ser Contrastadas Durante La Ejecución del Mismo. SE Considéraux Factories Externos A Aquellos que Están Más Allá del Control de los Investigadores, Pero Estos Entran en Las Deliberaciones del Llamado Comité de Monitorización de Datos Y de Seguridad (tableau de surveillance des données et de sécurité).Les aspects liés à la réponse aux traitements sont ceux qui reçoivent une contrepartie statistique et correspondent à ceux présentés dans ce travail.

implications de la durée précoce d’un essai clinique. La durée anticipée d’un essai clinique (avant le terme programmé) a des implications du type statistique et de la diffusion de leurs résultats. Parmi les implications statistiques, nous avons le fait potentiel que les différences entre les traitements sont petites et, de cette manière, les valeurs p des tests statistiques de signification, les estimations des points et par intervalles de confiance doivent être ajustées3-5 en raison de ces analyses. Appelle les intérêts provisoires. Une arrestation anticipée d’une étude augmente la variabilité des estimations en raison du plus petit nombre d’événements observés, ce qui rend l’étude sur les effets à long terme improbable. La durée d’une étude concerne des décisions complexes allant de la détention du recrutement de patients, de l’allocation d’intervention aux patients déjà randomisée à l’une des branches de l’étude, jusqu’à la détention complète de l’étude. Cela entraîne également des difficultés dans la décision de la manière dont, quand et à qui de la diffusion des résultats; Les procédures de termes normales spécifiées dans le protocole doivent être accélérées et si elles ne sont pas faites de manière suffisante, cela peut affecter la crédibilité des résultats de l’étude aux yeux de la communauté scientifique et des participants à l’étude, qui ont évidemment accepté de participer dans lui.

terme préalable et rôle du comité de suivi des données. Les considérations de type statistique correspondent à l’un des nombreux impliqués dans le processus de décider d’une arrestation potentielle anticipée d’un essai clinique. La surveillance des progrès d’une étude repose entre les mains du comité de surveillance de données externe. Ce comité est généralement composé de médecins cliniques, d’épidémiologistes, de biostatistiques, d’éthique et d’autres professionnels liés, se réunirait périodiquement lors de la conduite des études et sont responsables de la sécurité des patients, ainsi que des recommandations sur la durée potentielle prévue de l’étude6.

conceptions statistiques. La plupart des études épidémiologiques nécessitent une conception statistique comprenant une taille d’échantillon fixe, calculée de sorte que l’étude ait suffisamment de puissance statistique pour détecter des différences déterminées comme cliniquement significatives. Cependant, ce type de conception ne convient pas aux essais cliniques, essentiellement en raison de problèmes éthiques. Il est considéré comme non éthique d’attendre la fin d’une étude lorsque des réactions indésirables sont observées garantissant une arrestation anticipée de l’étude.

une alternative aux conceptions avec une taille d’échantillon fixe, sont les conceptions dits séquentielles , dans le ce qui n’est pas spécifié à l’avance, le nombre total de patients à étudier. Dans ce type de conception, un groupe de patients est recruté, les traitements sont randomisés et après un suivi, l’hypothèse est évaluée à l’étude. Si aucun résultat significatif n’est obtenu, un deuxième groupe de patients est recruté, randomisé, son suivi est testé et l’hypothèse est à nouveau testée. D’un point de vue éthique, ces conceptions séquentielles classiques sont meilleures que la taille de l’échantillon fixe, car elles permettent une arrestation potentielle anticipée de l’étude lorsqu’un des traitements est clairement supérieur à l’autre. Le plus grand inconvénient de ce type de conception séquentielle est que le coût total et la durée de l’étude sont inconnus et en théorie, la taille maximale des échantillons n’est pas limitée. Cette conception peut être utilisée dans des études avec une réponse immédiate7.

Au cours des deux dernières décennies, plusieurs procédures statistiques alternatives ont été proposées permettant la réalisation d’analyses statistiques intermédiaires basées sur l’accumulation de données, et au même temps ils vous permettent de maintenir le niveau de signification spécifié. L’analyse intermédiaire est définie comme une évaluation des données effectuée au cours de la phase de scolarisation du patient ainsi qu’au stade du suivi et dont l’objectif principal (entre autres) est d’évaluer l’effet des traitements. Une analyse provisoire, éventuellement, éventuellement, à la décision d’arrêter l’étude.

Si une étude s’arrête tôt, car le traitement expérimental augmente l’incidence de la réponse négative, il ne faut pas envisager de continuer à accumuler plus de données et il ne devrait y avoir aucune autre considération statistique qui ne dépasse pas l’estimation de l’incidence. Cependant, même lorsque l’étude n’est pas arrêtée tôt, les deux hypothèses et les intervalles de confiance exigent un ajustement pour ces analyses précédentes.

Aspects statistiques dans l’analyse interne et les conceptions séquentielles regroupées. La solution aux problèmes ci-dessus est fournie par la conception appelée « design séquentielle groupé » 8. Ce type de conception est particulièrement destiné aux analyses intermédiaires car elle permet de contrôler la probabilité d’erreur de type I, connue comme une conséquence de la succession des tests statistiques effectués sur des données accumulées9. L’utilisation de méthodes basées sur des échantillons de taille fixe ne convient pas car elles ne permettent pas de corriger le niveau de signification. La décision statistique d’arrêter ou de poursuivre l’étude est basée sur la séquence de test statistique sur les données accumulées après l’évaluation effectuée une fois que le recrutement de chaque groupe de patients a été effectué. De cette manière, une étude montrant un avantage précoce inattendu ou des effets indésirables inattendus oblige l’examen d’une détention précoce de l’essai.

La procédure générale de l’analyse séquentielle regroupée exige que l’évaluation du traitement expérimental contre la Contrôle dans un échantillon total de n sujets, il est effectué dans un nombre pré-spécifié de K fois K et que les n sujets ont été randomisés dans des groupes K de 2n patients de 2n (n = 2NK). Supposons que l’étude commence par des patients 2n afin qu’ils soient randomisés à chacune des deux branches du test. La décision statistique d’arrêter l’étude repose sur la réalisation des tests statistiques utilisant les données qui s’accumulent après l’évaluation de chaque groupe de patients de 2n. Le problème est que cette exigence est très restrictive car les données sont obtenues de manière continue. D’autre part, cette forme de collecte et d’analyse de données implique une réponse immédiate aux traitements.

LAN et Demets10 proposé une méthode basée sur ce qu’elles appelaient « fonction de dépenser », ce qui permet d’avoir des tests statistiques plus flexibles que ceux décrits ci-dessus. La procédure est basée sur le choix d’une fonction A (t), appelée « Fonction de dépense », qui spécifie la vitesse à laquelle il est souhaité de dépenser la probabilité totale de l’erreur de type I. En supposant que l’étude commence à temps 0 et heure est terminé, il est de telle sorte que t = 1, de sorte que la fonction a (t) soit construite de sorte qu’un (0) = 0 ya (l) = a. Cette fonction offre la probabilité accumulée de l’erreur de type I et vous permet de définir la quantité d’erreur que vous souhaitez dépenser dans chaque analyse. Augmenter A (TK) – A (TK-1) représente le niveau d’importance supplémentaire utilisée à TK.

Il existe différents critères de sélection de ladite fonction de dépenses11-13 qui satisfont à la condition de la probabilité totale de Tapez i est un. Certaines des élections les plus courantes sont présentées ci-dessous.

Exemple numérique de l’application des fonctions d’analyse et de dépenses provisoires. La première considération est la statistique à utiliser. On suppose que l’hypothèse de nullité est l’absence de différences entre les traitements et que l’hypothèse alternative est qu’il y a une différence. L’hypothèse alternative est appelée «une queue» si la direction de la différence est spécifiée et à partir de «deux files d’attente» si la direction de la différence n’est pas spécifiée. La statistique utilisée est celle de Logrank13, ce qui équivaut à des statistiques standardisées Z. Dans la K-cette analyse intermédiaire, ZK est calculé (K = 1.2, …., K). Pour illustrer la méthodologie, nous supposons que nous avons une étude de 24 mois à long terme, avec une éventuelle analyse provisoire tous les trois mois.

Les fonctions de dépenses considérées dans ces travaux incluent les procédures les plus courantes d’analyse séquentielle. groupé, adapté par la méthodologie des fonctions de dépenses proposées par LAN et Demets10. Pocock14 a suggéré un ajustement constant pour les points critiques fixes de l’ONU relatives aux tests statistiques répétés des analyses intermédiaires planifiées. Les points critiques proposés par O’Brien – Fleming15 diminuent monotonone avec k. Ceci est plus intuitif et il est possible que cette procédure soit assez populaire, car il n’est pas souhaitable de terminer l’étude dans les étapes proches au début de l’étude, à moins que les différences entre les groupes comparées ne soient substantielles. Demes et LAN16 proposent une classe générale de fonctions de dépense ATP, où p > 0 est une constante que si < correspond à une dépense précoce, Si = 1 est pour les dépenses linéaires ou constantes, et si > 1 correspond à des dépenses en retard du total AAA. Le tableau 2 compare les fonctions des dépenses de Pocock, O’Brien et Fleming, ainsi que les fonctions de dépenses pour p = 0,5; 1.0; 1.5, en termes de valeurs requises nécessaires dans le look intermédiaire K afin de relever le contrôle du niveau de signification mondiale d’un A = 0,05.

du tableau 2 Il montre que la procédure Pocock implique des niveaux de dépenses qui diminuent la procédure O’Brien et les propositions de flemation Les niveaux qui augmentent d’un niveau très bas et que les fonctions de dépenses AAATP dépensent en augmentant selon que p > 1 op < 1.

Exemple de l’application de l’analyse séquentielle regroupée en essais cliniques. Considérons un essai clinique où les participants sont attribués au hasard au traitement expérimental ou à un contrôle. Supposons qu’il existe un nombre précédemment spécifié d’une analyse interne de K au cours de la période d’étude et que la décision d’arrêter l’étude repose sur des tests statistiques de signification. En outre, il suppose que la décision d’arrêter à l’avance l’étude est basée sur des tests de signification répétés de statistiques après que chaque groupe soit évalué. Si t désigne le temps d’étude, les analyses intermédiaires sont effectuées dans T1 fois, …, TK, où k n’est pas spécifié, et 0 < T1 < … < tk « £ 1. Le tableau 3 présente des valeurs hypothétiques des numéros d’événement observés dans chaque groupe au cours de l’étude, la valeur de Les statistiques de Logrank à chaque fois, ainsi que la valeur de non définie nominale pour les statistiques. Il est important de noter que dans une étude réelle, à l’époque, TK n’a que des informations préalables à cette époque.

Les groupes de traitement sont toujours différents pendant toutes les périodes de l’étude et atteignent la signification statistique nominale dans le temps T = 12. À la mesure que le temps de la L’étude a lieu, les numéros d’événements dans les deux groupes abordent et la valeur des statistiques de Lograques diminue. La décision statistique de savoir si la signification est atteinte. Sur la base de la valeur de la chronologie TK nominale, comparée à la valeur de l’augmentation de la fonction de dépense du tableau 2, pour une fonction de dépenses particulière et choisie. Notez que s’il n’y a pas de réglage par des tests répétés, la signification statistique est atteinte dans l’analyse provisoire à l’heure t = 12. Toutefois, en fonction de la fonction de dépenses choisie, et lorsqu’il est décidé de faire une analyse provisoire, la signification statistique est atteinte à des moments différents, comme illustré dans le tableau 4.

/ div>

Dans le scénario A, où des analyses intermédiaires sont uniformément uniformément, on atteint la signification dans la troisième analyse, à l’instant t = 18 s’il utilise les fonctions de dépense (B) ou (e) Ça « garde » l’A pour des analyses tardives, mais cela n’atteint pas la signification des fonctions de dépenses (a), (c) ou (d), qui «montent» au début. Avec un scénario B, un look précoce est effectué au début de l’étude, mais les looks ultérieurs sont fabriqués tous les 6 mois; Toutes les fonctions de dépenses sauf (c) atteignent la signification de la troisième analyse, à l’instant t = 15; La fonction des dépenses (c) est une «managère précoce» et n’atteint donc pas une signification statistique. Enfin, sous l’étape C, où la première analyse provisoire n’est pas effectuée avant le neuvième mois d’études initiées, puis tous les 3 mois pour deux périodes et une analyse finale à 2 ans, les résultats n’attachent pas de signification des fonctions des premières dépenses A), c) et (d); Trouver une signification statistique uniquement à la fin de l’étude des fonctions de dépenses O’Brien-Fleming (B) et définie dans (E). Notez que si les analyses internes sont effectuées tous les trois mois (tableau 2), la signification n’est jamais obtenue. Le choix, à la fois la fonction de dépenses et la fréquence et la périodicité des analyses internes affectent la signification.

Discussion

Dans ce travail, nous essayons de fournir une explication de la nécessité de porter la nécessité de transporter Réalisé des analyses intermédiaires dans les essais cliniques, ainsi que pour illustrer la mise en œuvre d’analyses statistiques. Outre les considérations d’éthique, des analyses intermédiaires peuvent entraîner une augmentation importante de l’efficacité et, par conséquent, une diminution des coûts de conduite d’essais cliniques. S’ils ne traitent pas correctement du point de vue statistique, le résultat de l’analyse multiple des informations cumulées pourrait être la possibilité de rejeter faussement l’hypothèse de nullité de toute différence entre les traitements étant comparés.

le Coup de décisions du Comité de surveillance de l’étude externe pour une éventuelle résiliation anticipée d’un essai clinique, il utilise des informations statistiques comme l’une des nombreuses considérations évaluées pour arriver à cette décision difficile et complexe.Ce sont les intentions de ce travail de fournir de manière claire et accessible les considérations méthodologiques statistiques afin que la communauté médicale travaillant sur la recherche clinique expérimentale puisse être appréciée.

Correspondance A: Sergio R Muñoz Navarro. Unité d’épidémiologie clinique. Département de la santé publique. Faculté de medecine. Université de la frontière. M. Montt 112, Temuco. Le Chili. Téléphone: (56) 45-325744. Fax: (56) 45-325741. E-mail: [email protected].

références

1. Emerson SS, fleming tr. Analyse intermédiaire dans les essais cliniques, l’oncologie 1990; 4: 126-36.

2. Jennison C, Turnbull B. Tests de groupe séquentiel et intervalles de confiance répétés. Manuel de l’analyse séquentielle Vol 12 (GHOSH BK et SEN PK, EDS), Marcel Dekker LNC, New York, 1991; 283-311.

3. Emerson SS, fleming tr. Paramètre Extatation après le test d’hypothèse séquentielle de groupe. Biométrika 1990; 77: 875-92.

4. Siegmund D. Estimation après des tests séquentiels. Biométrika 1978; 65: 341-49.

5. Tsia AA, Rosnar Gl, Mehta Cr. Intervalles de confiance exacts après un test séquentiel de groupe. Biométrie 1984; 40: 797-803.

6. Whitehead J. sur le statisticien sur la carte de surveillance des données et de la sécurité. Statistiques en médecine 1999; 18: 3425-34.

7. Whitehead J. La conception et l’analyse d’essais cliniques séquentiels. Presse Harsted, New York 1983.

8. De Mets dl. Aspects pratiques de la surveillance des données: une brève revue. Statistiques en médecine 1987; 6: 753-60.

9. Armitage p, mcpherson ck, rowe bc. Des tests importants répétés sur l’accumulation de données. Journal de la Société statistique royale 1969; 132: 235-44.

10. LAN KKG, Mets DL. Limites séquentielles discrètes pour les essais cliniques. Biométrika 1983; 70: 659-63.

11. Kim K, Mets DL. Conception et analyse des tests séquentiels de groupe basés sur le taux de fonctionnement de la fonction de dépenser de type I. Biométrika 1987; 74: 149-54.

12. Hwang IK, Shih WJ, de Cani JS. Conceptions séquentielles de groupe utilisant une famille de fonctions de dépense de probabilité d’erreur de type L. Statistiques en médecine 1990; 9: 1439-45.

13. Peto R, Pike MC, Armitage P, Beslow in, Cox Dr, Howard Sv, Nappe, McPherson K, Peto J, Smith Pg. Conception et analyse d’essais cliniques randomisés nécessitant une observation prolongée de chaque patient. I. Introduction et conception. B J CANCER 1976; 34: 585-612.

14. Pocock SJ. Méthodes de groupe séquentielles dans la conception et l’analyse des essais cliniques. Biométrika 1977; 64: 1919.

15. O’Brien PC, Fleming th. Une procédure de test multiple pour les essais cliniques. Biométrie 1979; 35: 549-56.

16. De Mets DL, LAN KKG. Analyse intermédiaire: approche de la fonction de dépenses alpha, statistiques en médecine de 1994; 13: 1341-52.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *