26
Variations spatiales et spatio-temporelles de l’incidence des LA de l’enfant en France – 1990- 2003 Journées du GDR « statistique et santé » 26-27 novembre 2007 Hôpital Cochin – Paris 14 Stéphanie BELLEC – Jacqueline CLAVEL Inserm U754

Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Embed Size (px)

Citation preview

Page 1: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Variations spatiales et spatio-temporelles de l’incidence des LA de

l’enfant en France – 1990-2003

Journées du GDR « statistique et santé »

26-27 novembre 2007Hôpital Cochin – Paris 14

Stéphanie BELLEC – Jacqueline CLAVEL

Inserm U754

Page 2: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 2

Les cancers de l’enfant

• En France :– 1 enfant sur 500 est atteint avant l’âge de 15 ans

– 1500 nouveaux cas par an (la moitié avant 6 ans)

– 2ème cause de mortalité infantile

Source : Registre National des Tumeurs Solides de l’Enfant

Page 3: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 3

Enregistrement des cancers de l’enfant

• Deux registres à l’échelle nationale– Le Registre National des Hémopathies malignes de l’Enfant

(RNHE)

• http://www.u754.idf.inserm.fr/

• Créé en 1995 (U170/U754)

• Enregistrement des cas diagnostiqués depuis 1990 chez des enfants âgés de moins de 15 ans et résidant en France métropolitaine au moment du diagnostic

– Le Registre National des Tumeurs Solides de l’Enfant (RNTSE)

• http://www.chu-nancy.fr/rntse/

• Créé en 2000

Page 4: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 4

Les leucémies aiguës de l’enfant

• Environ 40 cas par million d’enfants et par an

• 80% des leucémies aiguës sont des leucémies aiguës

lymphoblastiques (LAL), dont une majorité de LAL

communes de la lignée B (LALBc)

• <20% de leucémies aiguës myéloblastiques (LAM)

• Les LAL présentent un pic d’incidence autour de 2 ans

• Les LAM ont une incidence plus élevée avant un an

Page 5: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 5

Facteurs de risque des LA

• Peu de facteurs de risque établis– Rayonnements ionisants à forte dose

– Certains traitements anti-cancéreux

– Certains syndromes génétiques

• Nombreuses pistes– Expositions environnementales in utero ou dans la petite

enfance (CEM-EBF, pesticides, tabagisme passif, consommation maternelle de tabac et d’alcool pendant la grossesse, agents infectieux ...)

– Facteurs génétiques prédisposants

Page 6: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 6

Le problème particulier des clusters

• Premiers signalements au début du 20ème siècle

• Cas de leucémies signalés au sein d’une population restreinte sur une période de temps assez courte

→ Hypothèse : présence d’un agent infectieux ?

→ Aucune information sur la population à risque

• 1960 : premier rapport statistique : tendance des LA à apparaître sous formes de petits groupes

• Depuis, de nombreuses études sur l’hétérogénéité spatiale et spatio-temporelle ont été réalisées

→ Légère tendance à l’agrégation spatio-temporelle

Page 7: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 7

Objectif de l’étude

• Étude des variations spatiales et spatio-temporelles des LA de l’enfant en France, sur la période 1990-2003

• Deux approches :– «clustering » : recherche d’une hétérogénéité globale

• Hétérogénéité spatiale globale (tests de Potthoff-Whittinghill et de Rogerson)

• Interaction spatio-temporelle (test de Knox)

– « détection de cluster » : localisation d’une zone/période à plus fort risque de LA

Page 8: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 8

Données

• 6281 cas de leucémies aiguës (LA) sur la période 1990-2003

0,0

10,0

20,0

30,0

40,0

50,0

60,0

70,0

80,0

0,0 2,0 4,0 6,0 8,0 10,0 12,0 14,0

TI (

*1E

6/an

)

LAL

LALBc

LAM

LA

< 1 an 1-4 ans 5-9 ans 10-14 ans

Les cas sont rattachés à leur commune de résidence au moment du diagnostic

Nb. cas

LAL 5 122 (82%)

LALBc 4 092 (65%)

LAM 1 069 (17%)

Autre LA 90 (1,4%)

LA 6 281

Page 9: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 9

Méthodes – Notations

• Oi le nombre de cas observés dans la commune i

(O le nombre total de cas observés)

• Ei le nombre de cas attendus, dans la commune i, sous l’hypothèse de non hétérogénéité spatiale de l’incidence des LA

(E le nombre total de cas attendus)

• m le nombre d’unités géographiques considérées (36344 communes ou 3644 cantons)

Page 10: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 10

Méthodes – Hétérogénéité globale (1)

• Hétérogénéité spatiale globale– Test de surdispersion (Potthoff-Whittinghill)

Hypothèse: Oi suit une loi binomiale négative V(Oi)/E(Oi) = 1+β

– Test d’hétérogénéité spatiale globale (Rogerson)

m

i i

ii OE

OOA

1

)1(1*

2

1 et

O

OmC

)1(*)1(*

2

1

m

i

m

ijj ji

jjiiij

m

i i

ii

pp

prprw

p

prR

1 11

)(*)()²(avec

O

Or ii ,

E

Ep ii

C

A

Page 11: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 11

Méthodes – Hétérogénéité globale (2)

• Interaction spatio-temporelle (test de Knox)– Sous H0 (absence d’interaction), la survenue des cas dans

l’espace est indépendante de leur survenue dans le temps

– Statistique de test basée sur les nombres, observés et attendus, de paires de cas proches dans l’espace et dans le temps ( te

ObsP , et teAttP

, )

etotPttotP

 : nombre total observé de paires de cas proches dans l’espace

: nombre total observé de paires proches dans le temps.

teAtt

teAtt

teObs

P

PPS

,

,, )( avec t

tot

etotte

Att POO

PP *

2/)1(,

Paramètres de proximité : - espace (communes de résidence au diag) : 0, 5, 10, 15, 20, 30, 50 km- temps (dates de diag) : 1, 3, 6, 9, 12 mois

Page 12: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 12

Méthodes – Détection de clusters (1)

• Test de Kulldorff– Le territoire est parcouru par une fenêtre mobile circulaire, pour

la détection de clusters spatiaux, ou cylindrique, pour la détection de clusters spatio-temporels.

– Fenêtre centrée sur une commune, de taille variable

– Tailles limites (dans l’espace et le temps) fixées arbitrairement (espace :10% de la population, temps : 50%)

y

x x

y

t

Page 13: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 13

Méthodes – Détection de clusters (2)

• A chaque fenêtre est associée une zone z composée des communes dont les centres sont inclus dans la fenêtre

• Pour chaque zone, rapport de vraisemblance sous l’hypothèse d’une distribution poissonnienne des cas, avec un risque p à l’intérieur de la zone, q à l’extérieur

• Localisation de la zone de cluster la plus probable définie par:

0

1 )(max

L

zLz

=

z

z

z

z

oO

z

z

o

z

z

z eE

oO

e

o

eE

oO

e

ozz

1max

oz et ez les nombres de cas observés et attendus dans la zone z

Page 14: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 14

Simulations de Monte Carlo (1)

• P-values déterminées par simulations sous H0

• A chaque simulation, répartition du nombre total de cas LA dans les communes à l’aide d’une distribution multinomiale de paramètres Ei/E (Tests de Potthoff-Whittinghill, Rogerson, Kulldorff version spatiale)

OU

• A chaque simulation, permutations des dates de diagnostic (conservation des structures spatiale et temporelle observées)

(Tests de Knox, Kulldorff version spatio-temporelle)

Page 15: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 15

Simulations de Monte Carlo (2)

• Pour chaque jeu de données simulé, calcul de la statistique de test Sk

p-value =

K

SS obsk

K

k

1

1

Sobs : valeur de la statistique calculée sur les données observées

K : Nombre de simulations réalisées

1{..} : fonction indicatrice

Page 16: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 16

Etapes d’analyses

• Analyse sur l’ensemble des données (LA, 0-14 ans, 1990-2003)

• Analyse par diagnostic (LAL, LALBc, LAM)

• Analyse par groupe d’âges (0-4 ans, 5-9 ans, 10-14 ans, 1-6 ans)

• Analyses sur 3 sous-périodes (1990-1994, 1995-1999, 2000-2003)

Page 17: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 17

Résultats – Hétérogénéité globale (1)

• Test de Potthoff-Whittinghill sur 1990-2003

  Période LA LAL LALBc LAM

âge au diagnostic O β (p-value) O β (p-value) O β (p-value) O β (p-value)

0-14 ans 6 281 0,3% (0,33) 5 122 0,4% (0,29) 4 092 0,4% (0,26) 1 069 -0,8% (0,92)

0-4 ans 3 137 -0,1% (0,52) 2 599 0,0% (0,43) 2 325 0,4% (0,24)

5-9 ans 1 842 0,9% (0,91) 1 558 -0,8% (0,91) 1 114 -0,5% (0,74)

10-14 ans 1 300 0,9% (0,11) 963 1,5% (0,03) 652 -0,8% (0,95)

1-6 ans 3 725 0,1% (0,43) 3 234 0,0% (0,42) 2 780 0,3% (0,33)

Quel que soit le diagnostic, quel que soit l’âge, aucune surdispersion mise en évidence sur la période 1990-2003

m

i i

ii OE

OOA

1

)1(1*

2

1 et

O

OmC

)1(*)1(*

2

1

C

A

Page 18: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 18

Résultats – Hétérogénéité globale (2)

• Test de Potthoff-Whittinghill par périodes (LA)

  Période 1990-2003 1990-1994 1995-1999 2000-2003

âge au diagnostic O β (p-value) O β (p-value) O β (p-value) O β (p-value)

0-14 ans 6 281 0,3% (0,33) 2 234 1,3% (0,05) 2 227 0,7% (0,14) 1 820 -0,8% (0,88)

0-4 ans 3 137 -0,1% (0,52) 1 138 0,5% (0,21) 1 108 -0,5% (0,79) 891 -0,4% (0,66)

5-9 ans 1 842 -0,9% (0,91) 668 -0,3% (0,55) 660 0,1% (0,29) 514 -0,3% (0,57)

10-14 ans 1 300 0,9% (0,11) 427 -0,1% (0,50) 459 -0,3% (0,57) 414 -0,1% (0,44)

1-6 ans 3 725 0,1% (0,43) 1 368 0,5% (0,20) 1 309 -0,5% (0,71) 1 048 -0,5% (0,75)

Légère surdispersion sur la période 1990-1994, pour les 0-14 ans uniquement (retrouvée pour les LAL et LALBc)

Page 19: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 19

Résultats – Hétérogénéité globale (3)

• Tests de Rogerson sur la période 1990-2003

  Période LA LAL LALBc LAM

âge au diagnostic

O R (p-value) O R (p-value) O R (p-value) O R (p-value)

0-14 ans 6 254 0,62 (0,26) 5 100 0,75 (0,30) 4 073 0,97 (0,26) 1 064 3,02 (0,77)

0-4 ans 3 123 1,25 (0,26) 2 587 1,46 (0,37) 2 314 1,62 (0,39)

5-9 ans 1 834 2,07 (0,35) 1 552 2,39 (0,40) 1 109 3,77 (0,14)

10-14 ans 1 297 2,80 (0,46) 961 3,53 (0,63) 650 5,66 (0,37)

1-6 ans 3 710 0,91 (0,64) 3 220 1,10 (0,50) 2 767 1,23 (0,59)

m

i

m

ijj ji

jjiiij

m

i i

ii

pp

prprw

p

prR

1 11

)(*)()²(avec

O

Or ii ,

E

Ep ii

Quel que soit le diagnostic, quel que soit l’âge, aucune hétérogénéité spatiale mise en évidence globalement sur la période 1990-2003

Page 20: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 20

Résultats – Hétérogénéité globale (4)

• Tests de Rogerson par périodes

Période 1990-2003 1990-1994 1995-1999 2000-2003

âge au diagnostic

O R P-value O R p-value O R p-value O R p-value

0-14 ans 6 254 0,62 (0,26) 2 224 1,83 (0,18) 2 216 1,42 (0,78) 1 814 2,54 (0,05)

0-4 ans 3 123 1,25 (0,26) 1 134 4,38 (0,02) 1 102 3,09 (0,61) 887 3,58 (0,28)

5-9 ans 1 834 2,07 (0,35) 664 4,73 (0,79) 657 6,55 (0,11) 513 7,77 (0,23)

10-14 ans 1 297 2,80 (0,46) 426 9,24 (0,26) 457 6,38 (0,89) 414 8,82 (0,44)

1-6 ans 3 710 0,91 (0,64) 1 362 3,33 (0,05) 1 304 2,16 (0,92) 1 044 3,39 (0,49)

• Hétérogénéité spatiale sur la période 1990-1994, pour les plus jeunes enfants (retrouvée pour les LAL et LALBc)

• et sur 2000-2003 pour les 0-14 ans uniquement (et LAL)

Page 21: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 21

Résultats – Interaction spatio-temporelle

• Test de Knox

teAtt

teAtt

teObs

P

PPS

,

,, )( avec t

tot

etotte

Att POO

PP *

2/)1(,

0-14 ans : aucune interaction mise en évidence

0-4 ans : 3 mois – 15 et 30 km (+ LAL et LALBC et retrouvée sur 1995-99)

5-9 ans : uniquement pour les LALBc (et sur 2000-2003)

10-14 ans : 9 et 12 mois – 0 et 5 km (+ LAL et retrouvée sur 1990-94)

LAM 0-14 ans : interaction significative (1 à 12 mois – 15 et 20 km)

Page 22: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 22

Résultats – Détection de clusters (1)

• Test de Kulldorff1990-2003 1995-1999

LA   0-14 0-4 5-9 10-14 0-14 0-4 5-9 10-14

Analyses spatiales

NS 1 60 30 1  442  8 554 2

OS 5 14 5 2  76 2 35 2

ES0,35 3,37 0,24 <0,01  39,2 0,02 13,2 0,01

PS 0,96 0,67 0,34 0,24  0,02 1,00 0,04 0,80

Analyses spatio-temp.

NST442  833 1344 886    

T 1996-99 1998 1996-99 1993    

OST  65 9 50 5    

EST  31,7 1,54 25,9 0,41    

PST 0,78 0,71 0,40 0,57    

LAM   0-14 0-4 5-9 10-14 0-14 0-4 5-9 10-14

Analyses spatiales

NS142 1077 87 24 3994 3462 504 20

OS12 20 3 4 50 24 9 3

ES2,45 6,77 0,11 0,24 24,85 8,75 1,76 0,07

PS0,51 0,70 0,96 0,92 0,20 0,34 0,69 0,59

Analyses spatio-temp.

Nst 4302 645 913 2712  

T 1994-97 1992 1996-98  1995  OST

44 5 11  5  

EST19,18 0,58 2,21  0,43    

PST0,83 0,81 0,01  0,16    

- Deux clusters de LA sur 1995-99, 0-14 ans et 5-9 ans

- Aucun cluster de LAL significatif

- Un cluster de LAM, 5-9 ans sur 1996-1998

→ clusters « emboîtés »

→ cluster de LAM 5-9 ans sur 96-98 (11 cas, 2,21 attendus)

Page 23: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 23

Résultats – Détection de clusters (2)

Représentation du cluster de cas de LAM observé sur la période 1996-1998

Page 24: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 24

Synthèse des résultats

• Très légère hétérogénéité des LA sur la période 1990-1994 (LALBc, plus jeunes enfants)

• Interaction spatio-temporelle des LAL 0-4 ans, 5-9 ans et 10-14 ans, ainsi que pour les cas de LAM. Mais résultats instables selon les périodes

• Cluster de cas de LA de 5-9 ans sur la période 1995-1999 (pas d’hypothèse actuellement)

Page 25: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 25

Critiques

• Méthodes soumises à des limites importantes– PW : contribution des communes ayant au moins deux cas

– Knox : Forte influence de l’évolution de la population au cours du temps. Test adapté à une application à l’échelle individuelle

• Multiplicité des tests– 4 familles de diagnostic, 5 groupe d’âges, 4 périodes

– Paramètres de proximités définis arbitrairement

→ Augmentation du risque de faux-positifs

Page 26: Variations spatiales et spatio- temporelles de lincidence des LA de lenfant en France – 1990-2003 Journées du GDR « statistique et santé » 26-27 novembre

Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 26

Conclusion

• Concordance avec la littérature concernant l’existence d’une hétérogénéité spatiale des LA (en particulier LALBc) MAIS de très faible amplitude

• Résultats à approfondir– Données plus précises (adresses des cas)

– Echelle géographique différente ?

– Autres méthodes ?