Commentaires biostatistiques sur l’évaluation de nouvelles molécules
dans les LAM Vendredi 18 novembre 2016
Sylvie Chevret, Hôpital Saint Louis, Paris ECSTRA, inserm, université Paris Diderot
Objectifs
• Réfléchir aux stratégies de développement de nouvelles molécules dans les LAM
– Quel constat ?
– Quelles causes avancées et comment y répondre ?
• schémas expérimentaux
• critères de jugement
• analyses statistiques
Contexte général en Oncologie
• Constat de développement
– Malgré des coûts en augmentation
Contexte général en Oncologie
• Constat de développement • … la probabilité de succès est restée inchangée entre
1993-2004 et 2004-2010 – 5% en Oncologie contre 11% au total
Contexte général en oncologie
• Constat de développement – … malgré nombre croissant de molécules
Tipifarnib dans les LAM
Contexte particulier des LAM
• Même constat de développement
– Aucun médicament approuvé depuis 40 ans
• Une seule exception : GO
Quelles causes avancer ?
(1) Mise en défaut des essais précoces : Mauvais choix de dose
En pratique, schéma 3+3
Quelles causes avancer ?
(1) Mise en défaut des essais précoces : Mauvais choix de dose
Recommandations FDA et EMEA : Abandonner les ‘3+3’
• Ethiques
– Escalade même si dose trop toxique …
– ne pas sous-traiter ni sur-traiter trop de sujets
• Statistiques – Estimation (rarement faite) du
taux de toxicité très imprécise • ex : si 2/6 toxicités : 33% (IC95
exact : 6-73%)
– Pas de mémoire d’ordre >1
• Schéma de plus inadapté aux molécules ciblées
– Dogme « the more is better »
des cytotoxiques mis en défaut
– Intérêt de schémas I/II incorporant les mesures d’efficacité et de tolérance
Quelles causes avancer ?
(2) Mise en défaut des essais précoces : Efficacité surestimée
Nombreux essais de phase 2 non contrôlés • Revue de la littérature sur 20 ans
dans LAM en rechute
• 31 études
• 10 études rétrospectives
• 17 essais de phase II non contrôlés
- Taille médiane de l’essai : 26 patients
Quelles causes avancer ?
(2) Mise en défaut des essais précoces : Efficacité surestimée
= Effet traitement
+ effet observation
+ effet régression à la moyenne
+ effet placebo
Estimation biaisée liée à l’absence de groupe contrôle
We believe non-randomised phase II trials in oncology should be the exception, not the rule.
Quelles causes avancer ?
(3) Mise en défaut des essais précoces : Efficacité (mes)estimée
Ex Estimation CR2 : de 14% à 87%
Estimation de l’efficacité sur un critère clinique de réponse
• Avec seuil arbitraire
Complete remission usually defined in AML as <5% bone marrow blasts and more than 1 × 10E+9/l granulocytes and more than 100 × 10E+9/l platelets in the blood
Quelles causes avancer ?
(2) Mise en défaut des essais précoces : Efficacité (mes)estimée A surrogate endpoint of a clinical
trial is a laboratory measurement or physical sign used as a substitute for a clinically meaningful endpoint that measures directly how a patient feels, functions, or survives.
Changes induced by a therapy on
a surrogate endpoint are expected to reflect changes in a clinically meaningful endpoint.”
Temple. In Nimmo, Tucker, eds. 1995
Estimation de l’efficacité sur un critère clinique de réponse
• Dit “de substitution “
Quelles causes avancer ?
(2) Mise en défaut des essais précoces : Efficacité (mes)estimée
Estimation de l’efficacité sur un critère clinique de réponse
• Dit “de substitution “
mais souvent sans “corrélation” avec le bénéfice clinique
2 exemples
Quelles causes avancer ?
• The standard design is a randomized controlled trial, where each patient has 1:1 chance of being allocated to the experimental or the control
• Principle of equipoise: genuine uncertainty over whether a treatment will be beneficial
Rights and wrongs with clinical trials? Taylor Thompson
• Critère de jugement : Survie globale
… The principal criterion used by the FDA for approval of new drugs in acute myeloid leukemia (AML) remains an improvement in OS.
(3) Mise en défaut des Essais randomisés de Phase 3
Quelles causes avancer ?
• It involves a large number of patients, due to the often low expected benefits (“effect size”), while the statistic requirements of controlling missconclusions are bounded
Rights and wrongs with clinical trials? Taylor Thompson
• Critère de jugement : Survie globale
The use of a survival end point for drug approval in AML requires following subjects for a sufficient interval for a substantial number of events (deaths) to occur for a precise estimate
(3) Mise en défaut des Essais randomisés de Phase 3
Quelles causes avancer ?
• Incertitudes de planification
Souvent surestimation du bénéfice
Sources d’essais négatifs car de puissance insuffisante
– Review of 38 ICU trials: The mean predicted delta was 10.1% and the mean observed delta was 1.4%
– Negative trials lead to abandoning promising therapies
– Underpowered trials are unethical
(3) Mise en défaut des Essais randomisés de Phase 3
power 80% 85% 90% 95% 99%
D=0.9 20 23 27 33 46
D=0.3 175 200 235 290 409
D=0.1 1571 1796 2103 2600 3677
Quelles causes avancer ?
• EX : CLARA (ALFA0702)
Evaluation de la Clofarabine en consolidation dans les LAM du sujet jeune en RC1 sans donneur compatible (Thomas, soumis)
(3) Mise en défaut des Essais randomisés de Phase 3
• 3 CLARA or HDAC
consolidation cycles
Puissance fonction du nombre d’événements nécessaire
Planification HR control vs exp= 1/0.57=1.75
Effet moindre qu’escompté ?
• Exemple : ALFA0702
pas de différence sur DFS : HR = 1.34
(p= 0.12, test du log-rank)
Planification HR control vs exp= 1/0.57=1.75
• Exemple : ALFA0702
pas de différence sur OS: HR = 1.13
(p= 0.57, test du log-rank))
Effet moindre qu’escompté ?
Remarque 1
• Hypothèse – H0 : S1(t) = S2(t) (HR=1.0) – H1 : S1(t) S2(t) (HR=1.75)
– Suppose que la survie des
deux groupes ne se distingue que par le traitement appliqué lors de la randomisation
– Suppose aussi que le bénéfice de l’intervention sur le risque de décès est constant au cours du temps
• Schémas thérapeutiques complexes
– Multiples drogues
administrées successivement et/ou simultanément en des phases différentes
– Place de l’allogreffe de moelle en post-randomisation
• 3 CLARA or HDAC
consolidation cycles
• 110 allogreffes/221 inclus (49.8%) après la randomisation
Remarque 1
• Hypothèse – H0 : S1(t) = S2(t) (HR=1.0) – H1 : S1(t) S2(t) (HR=1.75)
– Suppose que la survie des
deux groupes ne se distingue que par le traitement appliqué lors de la randomisation
– Suppose aussi que le bénéfice de l’intervention sur le risque de décès est constant au cours du temps
• Conséquences (1)
L’analyse en intention de traiter a une puissance diminuée
Surv
ie
D
0.0 0.5 1.0 1.5
temps (unité fictive)
0.0
0.2
0.4
0.6
0.8
1.0
groupe contrôle (planifié)
groupe expérimental
Application du seul traitement
0.0 0.5 1.0 1.5
temps (unité fictive)
0.0
0.2
0.4
0.6
0.8
1.0
Surv
ie
groupe contrôle (observé)
groupe expérimental
D’
En présence de « contaminations »
Puissance effective pour une puissance calculée de 90%
Analyse précoce (Tx=60%) Analyse tardive (Tx=20%)
n=100 n=500 n=100 n=500
Tx événement
0 91.5 90.2 90.8 89.9
0.1 89.1 88.2 85.2 84.7
0.2 86.1 86.7 78.7 78.8
0.33 82.5 83.9 68.8 72.4
0.5 78.9 80.4 58.9 63.7
1.0 63.8 69.6 37.0 41.4
2.0 40.5 47.4 19.0 23.3
Remarque 1
• Hypothèse – H0 : S1(t) = S2(t) (HR=1.0) – H1 : S1(t) S2(t) (HR=1.75)
– Suppose que la survie des
deux groupes ne se distingue que par le traitement appliqué lors de la randomisation
– Suppose aussi que le bénéfice de l’intervention sur le risque de décès est constant au cours du temps
• Conséquences (2)
La prise en compte des traitements post-randomisation doit être faite de façon adaptée
Sinon …
These trials are more vulnerable to post-randomization confounding and selection bias
ITT censurant les allogreffes ITT ignorant les allogreffes
Suppose la censure non informative :
Exemple : ALFA0702 Comparaison des DFS
We assume that at any time patients who are censored have the same survival prospects as those who continue to be followed.
ITT censurant les allogreffes ITT ignorant les allogreffes
Suppose la censure non informative
Exemple : ALFA0702 Comparaison des OS
Conclusion 1
• La non prise en compte de ces censures informatives conduit à une estimation biaisée des RFS(OS)
– D’autant plus que la proportion de greffés est élevée et HR grand
Contre-Exemple ?
• Essai de Phase 3 dans les LAM
– Gentuzumab Ozogamicine (mylotarg®) dans les LAM du sujet âgé (Castaigne 2012)
• with or without 5 doses of intravenous gemtuzumab ozogamicin (3 mg/m² on days 1, 4, and 7 during induction and day 1 of each of the two consolidation chemotherapy courses).
• 2 consolidations • 11 allogreffes/280 inclus
(3.9%)
Remarque 2
Hypothèse – H0 : S1(t) = S2(t) (HR=1.0) – H1 : S1(t) S2(t) (HR=1.75)
– Suppose aussi que le bénéfice de
l’intervention sur le risque de décès est constant au cours du temps
(risques proportionnels)
– Suppose aussi que le bénéfice de l’intervention sur le risque de décès est constant au cours du temps
Validation : Estimation d’un effet traitement dépendant du temps
500 1000 1500 2000 2500
Time
-2-1
01
2
Beta
(t)
for
ag
• L’utilisation naïve de Cox peut conduire à une conclusion erronée
• Intérêt de mesures de bénéfice thérapeutique alternatives ? – Restricted mean survival
– Integrated difference of survival
Conclusion 2
• Il existe des formules de calcul plus complexes, qui modélisent les « contaminations » (ou les « perdus de vue » et les « non compliants »)
– Souvent dans le sens d’une inflation de n
• Utiliser les méthodes d’inférence causale pour corriger les sources de biais de confusion temps-dépendant
Quelles alternatives ?
Repenser le dogme de l’évaluation des traitements
Schémas adaptatifs • Proposés comme l’un des moyens
attractifs d’évaluation permettant de répondre à ces constats
Schémas adaptatifs
• Études prospectives pré-définissant la possibilité de modifications d’un ou plusieurs aspects de son plan expérimental et des hypothèses postulées, ou de son plan d’analyse – à partir de l’analyse (en
règle intermédiaire) des données de l’essai
• Aussi dits schémas “flexibles”
• Validité • Intégrité
– Planifiés
FDA Guidance for Industry- Adaptive Design Clinical Trials for Drugs and Biologics- DRAFT GUIDANCE (2010 Feb.)
Schémas adaptatifs: Essais précoces ?
• Taille de l’échantillon – Essais séquentiels groupés – Réévaluation (augmentation) du
nombre d’inclus
• Traitements (dose, durée,
fréquence, …) – Essais de recherche de dose
(phase I) – Essais de phase I/II combinés – Essais de sélection (screening)
• Critères d’éligibilité
– Schémas d’enrichissement de la population
Exemples dans les LAM
• Essai de phase I/II combiné
– Schéma adaptatif Bayesien
• Essai de phase II randomisé
– Schéma adaptatif (sur réponse) Bayesien
Essais Phase 3 : Critères de jugement ?
Enfin …
• Clinical trials are critical to improve AML treatment. Despite high accrual rates, patients enrolled in clinical trials had a favorable prognostic profile and a better survival than patients treated off-trial.
Conclusion
• Difficultés d’évaluation et d’enregistrement non spécifiques aux LAM
• Pondérer les enthousiasmes excessifs des essais précoces
• Réfléchir aux mesures d’intérêt – Place des méthodes statistiques pour données
observationnelles ?