42
Commentaires biostatistiques sur l’évaluation de nouvelles molécules dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital Saint Louis, Paris ECSTRA, inserm, université Paris Diderot

dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Embed Size (px)

Citation preview

Page 1: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Commentaires biostatistiques sur l’évaluation de nouvelles molécules

dans les LAM Vendredi 18 novembre 2016

Sylvie Chevret, Hôpital Saint Louis, Paris ECSTRA, inserm, université Paris Diderot

Page 2: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Objectifs

• Réfléchir aux stratégies de développement de nouvelles molécules dans les LAM

– Quel constat ?

– Quelles causes avancées et comment y répondre ?

• schémas expérimentaux

• critères de jugement

• analyses statistiques

Page 3: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Contexte général en Oncologie

• Constat de développement

– Malgré des coûts en augmentation

Page 4: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Contexte général en Oncologie

• Constat de développement • … la probabilité de succès est restée inchangée entre

1993-2004 et 2004-2010 – 5% en Oncologie contre 11% au total

Page 5: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Contexte général en oncologie

• Constat de développement – … malgré nombre croissant de molécules

Tipifarnib dans les LAM

Page 6: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Contexte particulier des LAM

• Même constat de développement

– Aucun médicament approuvé depuis 40 ans

• Une seule exception : GO

Page 7: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Quelles causes avancer ?

(1) Mise en défaut des essais précoces : Mauvais choix de dose

En pratique, schéma 3+3

Page 8: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Quelles causes avancer ?

(1) Mise en défaut des essais précoces : Mauvais choix de dose

Recommandations FDA et EMEA : Abandonner les ‘3+3’

• Ethiques

– Escalade même si dose trop toxique …

– ne pas sous-traiter ni sur-traiter trop de sujets

• Statistiques – Estimation (rarement faite) du

taux de toxicité très imprécise • ex : si 2/6 toxicités : 33% (IC95

exact : 6-73%)

– Pas de mémoire d’ordre >1

Page 9: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

• Schéma de plus inadapté aux molécules ciblées

– Dogme « the more is better »

des cytotoxiques mis en défaut

– Intérêt de schémas I/II incorporant les mesures d’efficacité et de tolérance

Page 10: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Quelles causes avancer ?

(2) Mise en défaut des essais précoces : Efficacité surestimée

Nombreux essais de phase 2 non contrôlés • Revue de la littérature sur 20 ans

dans LAM en rechute

• 31 études

• 10 études rétrospectives

• 17 essais de phase II non contrôlés

- Taille médiane de l’essai : 26 patients

Page 11: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Quelles causes avancer ?

(2) Mise en défaut des essais précoces : Efficacité surestimée

= Effet traitement

+ effet observation

+ effet régression à la moyenne

+ effet placebo

Estimation biaisée liée à l’absence de groupe contrôle

We believe non-randomised phase II trials in oncology should be the exception, not the rule.

Page 12: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Quelles causes avancer ?

(3) Mise en défaut des essais précoces : Efficacité (mes)estimée

Ex Estimation CR2 : de 14% à 87%

Estimation de l’efficacité sur un critère clinique de réponse

• Avec seuil arbitraire

Complete remission usually defined in AML as <5% bone marrow blasts and more than 1 × 10E+9/l granulocytes and more than 100 × 10E+9/l platelets in the blood

Page 13: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Quelles causes avancer ?

(2) Mise en défaut des essais précoces : Efficacité (mes)estimée A surrogate endpoint of a clinical

trial is a laboratory measurement or physical sign used as a substitute for a clinically meaningful endpoint that measures directly how a patient feels, functions, or survives.

Changes induced by a therapy on

a surrogate endpoint are expected to reflect changes in a clinically meaningful endpoint.”

Temple. In Nimmo, Tucker, eds. 1995

Estimation de l’efficacité sur un critère clinique de réponse

• Dit “de substitution “

Page 14: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Quelles causes avancer ?

(2) Mise en défaut des essais précoces : Efficacité (mes)estimée

Estimation de l’efficacité sur un critère clinique de réponse

• Dit “de substitution “

mais souvent sans “corrélation” avec le bénéfice clinique

2 exemples

Page 15: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Quelles causes avancer ?

• The standard design is a randomized controlled trial, where each patient has 1:1 chance of being allocated to the experimental or the control

• Principle of equipoise: genuine uncertainty over whether a treatment will be beneficial

Rights and wrongs with clinical trials? Taylor Thompson

• Critère de jugement : Survie globale

… The principal criterion used by the FDA for approval of new drugs in acute myeloid leukemia (AML) remains an improvement in OS.

(3) Mise en défaut des Essais randomisés de Phase 3

Page 16: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Quelles causes avancer ?

• It involves a large number of patients, due to the often low expected benefits (“effect size”), while the statistic requirements of controlling missconclusions are bounded

Rights and wrongs with clinical trials? Taylor Thompson

• Critère de jugement : Survie globale

The use of a survival end point for drug approval in AML requires following subjects for a sufficient interval for a substantial number of events (deaths) to occur for a precise estimate

(3) Mise en défaut des Essais randomisés de Phase 3

Page 17: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Quelles causes avancer ?

• Incertitudes de planification

Souvent surestimation du bénéfice

Sources d’essais négatifs car de puissance insuffisante

– Review of 38 ICU trials: The mean predicted delta was 10.1% and the mean observed delta was 1.4%

– Negative trials lead to abandoning promising therapies

– Underpowered trials are unethical

(3) Mise en défaut des Essais randomisés de Phase 3

power 80% 85% 90% 95% 99%

D=0.9 20 23 27 33 46

D=0.3 175 200 235 290 409

D=0.1 1571 1796 2103 2600 3677

Page 18: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Quelles causes avancer ?

• EX : CLARA (ALFA0702)

Evaluation de la Clofarabine en consolidation dans les LAM du sujet jeune en RC1 sans donneur compatible (Thomas, soumis)

(3) Mise en défaut des Essais randomisés de Phase 3

Page 19: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

• 3 CLARA or HDAC

consolidation cycles

Puissance fonction du nombre d’événements nécessaire

Planification HR control vs exp= 1/0.57=1.75

Page 20: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Effet moindre qu’escompté ?

• Exemple : ALFA0702

pas de différence sur DFS : HR = 1.34

(p= 0.12, test du log-rank)

Planification HR control vs exp= 1/0.57=1.75

Page 21: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

• Exemple : ALFA0702

pas de différence sur OS: HR = 1.13

(p= 0.57, test du log-rank))

Effet moindre qu’escompté ?

Page 22: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Remarque 1

• Hypothèse – H0 : S1(t) = S2(t) (HR=1.0) – H1 : S1(t) S2(t) (HR=1.75)

– Suppose que la survie des

deux groupes ne se distingue que par le traitement appliqué lors de la randomisation

– Suppose aussi que le bénéfice de l’intervention sur le risque de décès est constant au cours du temps

• Schémas thérapeutiques complexes

– Multiples drogues

administrées successivement et/ou simultanément en des phases différentes

– Place de l’allogreffe de moelle en post-randomisation

Page 23: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

• 3 CLARA or HDAC

consolidation cycles

• 110 allogreffes/221 inclus (49.8%) après la randomisation

Page 24: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Remarque 1

• Hypothèse – H0 : S1(t) = S2(t) (HR=1.0) – H1 : S1(t) S2(t) (HR=1.75)

– Suppose que la survie des

deux groupes ne se distingue que par le traitement appliqué lors de la randomisation

– Suppose aussi que le bénéfice de l’intervention sur le risque de décès est constant au cours du temps

• Conséquences (1)

L’analyse en intention de traiter a une puissance diminuée

Page 25: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Surv

ie

D

0.0 0.5 1.0 1.5

temps (unité fictive)

0.0

0.2

0.4

0.6

0.8

1.0

groupe contrôle (planifié)

groupe expérimental

Application du seul traitement

0.0 0.5 1.0 1.5

temps (unité fictive)

0.0

0.2

0.4

0.6

0.8

1.0

Surv

ie

groupe contrôle (observé)

groupe expérimental

D’

En présence de « contaminations »

Page 26: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Puissance effective pour une puissance calculée de 90%

Analyse précoce (Tx=60%) Analyse tardive (Tx=20%)

n=100 n=500 n=100 n=500

Tx événement

0 91.5 90.2 90.8 89.9

0.1 89.1 88.2 85.2 84.7

0.2 86.1 86.7 78.7 78.8

0.33 82.5 83.9 68.8 72.4

0.5 78.9 80.4 58.9 63.7

1.0 63.8 69.6 37.0 41.4

2.0 40.5 47.4 19.0 23.3

Page 27: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Remarque 1

• Hypothèse – H0 : S1(t) = S2(t) (HR=1.0) – H1 : S1(t) S2(t) (HR=1.75)

– Suppose que la survie des

deux groupes ne se distingue que par le traitement appliqué lors de la randomisation

– Suppose aussi que le bénéfice de l’intervention sur le risque de décès est constant au cours du temps

• Conséquences (2)

La prise en compte des traitements post-randomisation doit être faite de façon adaptée

Sinon …

These trials are more vulnerable to post-randomization confounding and selection bias

Page 28: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

ITT censurant les allogreffes ITT ignorant les allogreffes

Suppose la censure non informative :

Exemple : ALFA0702 Comparaison des DFS

We assume that at any time patients who are censored have the same survival prospects as those who continue to be followed.

Page 29: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

ITT censurant les allogreffes ITT ignorant les allogreffes

Suppose la censure non informative

Exemple : ALFA0702 Comparaison des OS

Page 30: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Conclusion 1

• La non prise en compte de ces censures informatives conduit à une estimation biaisée des RFS(OS)

– D’autant plus que la proportion de greffés est élevée et HR grand

Page 31: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Contre-Exemple ?

• Essai de Phase 3 dans les LAM

– Gentuzumab Ozogamicine (mylotarg®) dans les LAM du sujet âgé (Castaigne 2012)

Page 32: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

• with or without 5 doses of intravenous gemtuzumab ozogamicin (3 mg/m² on days 1, 4, and 7 during induction and day 1 of each of the two consolidation chemotherapy courses).

• 2 consolidations • 11 allogreffes/280 inclus

(3.9%)

Page 33: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Remarque 2

Hypothèse – H0 : S1(t) = S2(t) (HR=1.0) – H1 : S1(t) S2(t) (HR=1.75)

– Suppose aussi que le bénéfice de

l’intervention sur le risque de décès est constant au cours du temps

(risques proportionnels)

– Suppose aussi que le bénéfice de l’intervention sur le risque de décès est constant au cours du temps

Validation : Estimation d’un effet traitement dépendant du temps

500 1000 1500 2000 2500

Time

-2-1

01

2

Beta

(t)

for

ag

Page 34: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

• L’utilisation naïve de Cox peut conduire à une conclusion erronée

• Intérêt de mesures de bénéfice thérapeutique alternatives ? – Restricted mean survival

– Integrated difference of survival

Page 35: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Conclusion 2

• Il existe des formules de calcul plus complexes, qui modélisent les « contaminations » (ou les « perdus de vue » et les « non compliants »)

– Souvent dans le sens d’une inflation de n

• Utiliser les méthodes d’inférence causale pour corriger les sources de biais de confusion temps-dépendant

Page 36: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Quelles alternatives ?

Repenser le dogme de l’évaluation des traitements

Schémas adaptatifs • Proposés comme l’un des moyens

attractifs d’évaluation permettant de répondre à ces constats

Page 37: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Schémas adaptatifs

• Études prospectives pré-définissant la possibilité de modifications d’un ou plusieurs aspects de son plan expérimental et des hypothèses postulées, ou de son plan d’analyse – à partir de l’analyse (en

règle intermédiaire) des données de l’essai

• Aussi dits schémas “flexibles”

• Validité • Intégrité

– Planifiés

FDA Guidance for Industry- Adaptive Design Clinical Trials for Drugs and Biologics- DRAFT GUIDANCE (2010 Feb.)

Page 38: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Schémas adaptatifs: Essais précoces ?

• Taille de l’échantillon – Essais séquentiels groupés – Réévaluation (augmentation) du

nombre d’inclus

• Traitements (dose, durée,

fréquence, …) – Essais de recherche de dose

(phase I) – Essais de phase I/II combinés – Essais de sélection (screening)

• Critères d’éligibilité

– Schémas d’enrichissement de la population

Page 39: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Exemples dans les LAM

• Essai de phase I/II combiné

– Schéma adaptatif Bayesien

• Essai de phase II randomisé

– Schéma adaptatif (sur réponse) Bayesien

Page 40: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Essais Phase 3 : Critères de jugement ?

Page 41: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Enfin …

• Clinical trials are critical to improve AML treatment. Despite high accrual rates, patients enrolled in clinical trials had a favorable prognostic profile and a better survival than patients treated off-trial.

Page 42: dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Conclusion

• Difficultés d’évaluation et d’enregistrement non spécifiques aux LAM

• Pondérer les enthousiasmes excessifs des essais précoces

• Réfléchir aux mesures d’intérêt – Place des méthodes statistiques pour données

observationnelles ?