Download pdf - dans les LAM - aihemato.cluster013.ovh.netaihemato.cluster013.ovh.net/AIH/documents/DES 2016-11-18/S Chevret... · dans les LAM Vendredi 18 novembre 2016 Sylvie Chevret, Hôpital

Commentaires biostatistiques sur l’évaluation de nouvelles molécules

dans les LAM Vendredi 18 novembre 2016

Sylvie Chevret, Hôpital Saint Louis, Paris ECSTRA, inserm, université Paris Diderot

Objectifs

• Réfléchir aux stratégies de développement de nouvelles molécules dans les LAM

– Quel constat ?

– Quelles causes avancées et comment y répondre ?

• schémas expérimentaux

• critères de jugement

• analyses statistiques

Contexte général en Oncologie

• Constat de développement

– Malgré des coûts en augmentation

Contexte général en Oncologie

• Constat de développement • … la probabilité de succès est restée inchangée entre

1993-2004 et 2004-2010 – 5% en Oncologie contre 11% au total

Contexte général en oncologie

• Constat de développement – … malgré nombre croissant de molécules

Tipifarnib dans les LAM

Contexte particulier des LAM

• Même constat de développement

– Aucun médicament approuvé depuis 40 ans

• Une seule exception : GO

Quelles causes avancer ?

(1) Mise en défaut des essais précoces : Mauvais choix de dose

En pratique, schéma 3+3


(1) Mise en défaut des essais précoces : Mauvais choix de dose

Recommandations FDA et EMEA : Abandonner les ‘3+3’

• Ethiques

– Escalade même si dose trop toxique …

– ne pas sous-traiter ni sur-traiter trop de sujets

• Statistiques – Estimation (rarement faite) du

taux de toxicité très imprécise • ex : si 2/6 toxicités : 33% (IC95

exact : 6-73%)

– Pas de mémoire d’ordre >1

• Schéma de plus inadapté aux molécules ciblées

– Dogme « the more is better »

des cytotoxiques mis en défaut

– Intérêt de schémas I/II incorporant les mesures d’efficacité et de tolérance


(2) Mise en défaut des essais précoces : Efficacité surestimée

Nombreux essais de phase 2 non contrôlés • Revue de la littérature sur 20 ans

dans LAM en rechute

• 31 études

• 10 études rétrospectives

• 17 essais de phase II non contrôlés

- Taille médiane de l’essai : 26 patients


(2) Mise en défaut des essais précoces : Efficacité surestimée

= Effet traitement

+ effet observation

+ effet régression à la moyenne

+ effet placebo

Estimation biaisée liée à l’absence de groupe contrôle

We believe non-randomised phase II trials in oncology should be the exception, not the rule.


(3) Mise en défaut des essais précoces : Efficacité (mes)estimée

Ex Estimation CR2 : de 14% à 87%

Estimation de l’efficacité sur un critère clinique de réponse

• Avec seuil arbitraire

Complete remission usually defined in AML as <5% bone marrow blasts and more than 1 × 10E+9/l granulocytes and more than 100 × 10E+9/l platelets in the blood


(2) Mise en défaut des essais précoces : Efficacité (mes)estimée A surrogate endpoint of a clinical

trial is a laboratory measurement or physical sign used as a substitute for a clinically meaningful endpoint that measures directly how a patient feels, functions, or survives.

Changes induced by a therapy on

a surrogate endpoint are expected to reflect changes in a clinically meaningful endpoint.”

Temple. In Nimmo, Tucker, eds. 1995


• Dit “de substitution “


(2) Mise en défaut des essais précoces : Efficacité (mes)estimée


• Dit “de substitution “

mais souvent sans “corrélation” avec le bénéfice clinique

2 exemples


• The standard design is a randomized controlled trial, where each patient has 1:1 chance of being allocated to the experimental or the control

• Principle of equipoise: genuine uncertainty over whether a treatment will be beneficial

Rights and wrongs with clinical trials? Taylor Thompson

• Critère de jugement : Survie globale

… The principal criterion used by the FDA for approval of new drugs in acute myeloid leukemia (AML) remains an improvement in OS.

(3) Mise en défaut des Essais randomisés de Phase 3


• It involves a large number of patients, due to the often low expected benefits (“effect size”), while the statistic requirements of controlling missconclusions are bounded

Rights and wrongs with clinical trials? Taylor Thompson

• Critère de jugement : Survie globale

The use of a survival end point for drug approval in AML requires following subjects for a sufficient interval for a substantial number of events (deaths) to occur for a precise estimate



• Incertitudes de planification

Souvent surestimation du bénéfice

Sources d’essais négatifs car de puissance insuffisante

– Review of 38 ICU trials: The mean predicted delta was 10.1% and the mean observed delta was 1.4%

– Negative trials lead to abandoning promising therapies

– Underpowered trials are unethical


power 80% 85% 90% 95% 99%

D=0.9 20 23 27 33 46

D=0.3 175 200 235 290 409

D=0.1 1571 1796 2103 2600 3677


• EX : CLARA (ALFA0702)

Evaluation de la Clofarabine en consolidation dans les LAM du sujet jeune en RC1 sans donneur compatible (Thomas, soumis)


• 3 CLARA or HDAC

consolidation cycles

Puissance fonction du nombre d’événements nécessaire

Planification HR control vs exp= 1/0.57=1.75

Effet moindre qu’escompté ?

• Exemple : ALFA0702

pas de différence sur DFS : HR = 1.34

(p= 0.12, test du log-rank)

Planification HR control vs exp= 1/0.57=1.75

• Exemple : ALFA0702

pas de différence sur OS: HR = 1.13

(p= 0.57, test du log-rank))

Effet moindre qu’escompté ?

Remarque 1

• Hypothèse – H0 : S1(t) = S2(t) (HR=1.0) – H1 : S1(t) S2(t) (HR=1.75)

– Suppose que la survie des

deux groupes ne se distingue que par le traitement appliqué lors de la randomisation

– Suppose aussi que le bénéfice de l’intervention sur le risque de décès est constant au cours du temps

• Schémas thérapeutiques complexes

– Multiples drogues

administrées successivement et/ou simultanément en des phases différentes

– Place de l’allogreffe de moelle en post-randomisation

• 3 CLARA or HDAC

consolidation cycles

• 110 allogreffes/221 inclus (49.8%) après la randomisation

Remarque 1





• Conséquences (1)

L’analyse en intention de traiter a une puissance diminuée

Surv

ie

D

0.0 0.5 1.0 1.5

temps (unité fictive)

0.0

0.2

0.4

0.6

0.8

1.0

groupe contrôle (planifié)

groupe expérimental

Application du seul traitement

0.0 0.5 1.0 1.5

temps (unité fictive)

0.0

0.2

0.4

0.6

0.8

1.0

Surv

ie

groupe contrôle (observé)

groupe expérimental

D’

En présence de « contaminations »

Puissance effective pour une puissance calculée de 90%

Analyse précoce (Tx=60%) Analyse tardive (Tx=20%)

n=100 n=500 n=100 n=500

Tx événement

0 91.5 90.2 90.8 89.9

0.1 89.1 88.2 85.2 84.7

0.2 86.1 86.7 78.7 78.8

0.33 82.5 83.9 68.8 72.4

0.5 78.9 80.4 58.9 63.7

1.0 63.8 69.6 37.0 41.4

2.0 40.5 47.4 19.0 23.3

Remarque 1





• Conséquences (2)

La prise en compte des traitements post-randomisation doit être faite de façon adaptée

Sinon …

These trials are more vulnerable to post-randomization confounding and selection bias

ITT censurant les allogreffes ITT ignorant les allogreffes

Suppose la censure non informative :

Exemple : ALFA0702 Comparaison des DFS

We assume that at any time patients who are censored have the same survival prospects as those who continue to be followed.

ITT censurant les allogreffes ITT ignorant les allogreffes

Suppose la censure non informative

Exemple : ALFA0702 Comparaison des OS

Conclusion 1

• La non prise en compte de ces censures informatives conduit à une estimation biaisée des RFS(OS)

– D’autant plus que la proportion de greffés est élevée et HR grand

Contre-Exemple ?

• Essai de Phase 3 dans les LAM

– Gentuzumab Ozogamicine (mylotarg®) dans les LAM du sujet âgé (Castaigne 2012)

• with or without 5 doses of intravenous gemtuzumab ozogamicin (3 mg/m² on days 1, 4, and 7 during induction and day 1 of each of the two consolidation chemotherapy courses).

• 2 consolidations • 11 allogreffes/280 inclus

(3.9%)

Remarque 2

Hypothèse – H0 : S1(t) = S2(t) (HR=1.0) – H1 : S1(t) S2(t) (HR=1.75)

– Suppose aussi que le bénéfice de

l’intervention sur le risque de décès est constant au cours du temps

(risques proportionnels)


Validation : Estimation d’un effet traitement dépendant du temps

500 1000 1500 2000 2500

Time

-2-1

01

2

Beta

(t)

for

ag

• L’utilisation naïve de Cox peut conduire à une conclusion erronée

• Intérêt de mesures de bénéfice thérapeutique alternatives ? – Restricted mean survival

– Integrated difference of survival

Conclusion 2

• Il existe des formules de calcul plus complexes, qui modélisent les « contaminations » (ou les « perdus de vue » et les « non compliants »)

– Souvent dans le sens d’une inflation de n

• Utiliser les méthodes d’inférence causale pour corriger les sources de biais de confusion temps-dépendant

Quelles alternatives ?

Repenser le dogme de l’évaluation des traitements

Schémas adaptatifs • Proposés comme l’un des moyens

attractifs d’évaluation permettant de répondre à ces constats

Schémas adaptatifs

• Études prospectives pré-définissant la possibilité de modifications d’un ou plusieurs aspects de son plan expérimental et des hypothèses postulées, ou de son plan d’analyse – à partir de l’analyse (en

règle intermédiaire) des données de l’essai

• Aussi dits schémas “flexibles”

• Validité • Intégrité

– Planifiés

FDA Guidance for Industry- Adaptive Design Clinical Trials for Drugs and Biologics- DRAFT GUIDANCE (2010 Feb.)

Schémas adaptatifs: Essais précoces ?

• Taille de l’échantillon – Essais séquentiels groupés – Réévaluation (augmentation) du

nombre d’inclus

• Traitements (dose, durée,

fréquence, …) – Essais de recherche de dose

(phase I) – Essais de phase I/II combinés – Essais de sélection (screening)

• Critères d’éligibilité

– Schémas d’enrichissement de la population

Exemples dans les LAM

• Essai de phase I/II combiné

– Schéma adaptatif Bayesien

• Essai de phase II randomisé

– Schéma adaptatif (sur réponse) Bayesien

Essais Phase 3 : Critères de jugement ?

Enfin …

• Clinical trials are critical to improve AML treatment. Despite high accrual rates, patients enrolled in clinical trials had a favorable prognostic profile and a better survival than patients treated off-trial.

Conclusion

• Difficultés d’évaluation et d’enregistrement non spécifiques aux LAM

• Pondérer les enthousiasmes excessifs des essais précoces

• Réfléchir aux mesures d’intérêt – Place des méthodes statistiques pour données

observationnelles ?