82
Laboratoire de Mathématiques Appliquées Par NTAHDUI NGUENDJIO Ronnel Matricule : 10V126 Mémoire Présenté en vue de l’obtention du Diplôme de Master Recherche Option Statistique Appliquée Sous la codirection de Pr. Henri GWÉT Dr. Josiane Désirée ETANG TOUKO Maître de Conférences Chargée de Cours Devant le jury composé de Président : Pr. Noël HOUÉDOUGBÉ FONTON, Professeur Rapporteur : Pr. Henri GWÉT, Maître de Conférences Membres : Dr. Josiane ETANG, Chargée de Cours Dr. Wilson TOUSSILÉ, Assistant Examinateur : Dr. Eugène-Patrice NDONG NGUÉMA, Chargé de Cours Année académique 2012-2013 UNIVERSITÉ DE YAOUNDÉ I ****************** ÉCOLE NATIONALE SUPÉRIEURE POLYTECHNIQUE ****************** DÉPARTEMENT DE LA COORDINATION ET DE LA VALORISATION DE LA RECHERCHE ****************** B.P. 8390 Yaoundé Tel/Fax : 22.22.45.47 UNIVERSITY OF YAOUNDE I ***************** NATIONAL ADVANCED SCHOOL OF ENGINEERING ****************** DEPARTMENT OF COORDINATION AND RESEARCH VALORISATION ***************** P.O. Box 8390 Yaounde Phone/Fax: 22.22.45.47 ANALYSE DE LA DISTRIBUTION SPATIALE DE LA RÉSISTANCE À LA DELTAMÉTRHINE CHEZ Anopheles gambiae s.l. DANS TROIS DISTRICTS DE SANTÉ DE LA RÉGION DU NORD CAMEROUN

ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

  • Upload
    phamnhu

  • View
    216

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

Laboratoire de Mathématiques Appliquées

Par

NTAHDUI NGUENDJIO Ronnel

Matricule : 10V126

Mémoire

Présenté en vue de l’obtention du

Diplôme de Master Recherche

Option

Statistique Appliquée

Sous la codirection de

Pr. Henri GWÉT Dr. Josiane Désirée ETANG TOUKO

Maître de Conférences Chargée de Cours

Devant le jury composé de

Président : Pr. Noël HOUÉDOUGBÉ FONTON, Professeur

Rapporteur : Pr. Henri GWÉT, Maître de Conférences

Membres : Dr. Josiane ETANG, Chargée de Cours Dr. Wilson TOUSSILÉ, Assistant

Examinateur : Dr. Eugène-Patrice NDONG NGUÉMA, Chargé de Cours

Année académique 2012-2013

UNIVERSITÉ DE YAOUNDÉ I

******************

ÉCOLE NATIONALE SUPÉRIEURE POLYTECHNIQUE

******************

DÉPARTEMENT DE LA

COORDINATION ET DE LA

VALORISATION DE LA RECHERCHE

******************

B.P. 8390 Yaoundé

Tel/Fax : 22.22.45.47

UNIVERSITY OF YAOUNDE I

*****************

NATIONAL ADVANCED SCHOOL

OF ENGINEERING

******************

DEPARTMENT OF COORDINATION

AND RESEARCH VALORISATION

*****************

P.O. Box 8390 Yaounde

Phone/Fax: 22.22.45.47

ANALYSE DE LA DISTRIBUTION SPATIALE DE LA RÉSISTANCE À LA DELTAMÉTRHINE CHEZ

Anopheles gambiae s.l. DANS TROIS DISTRICTS DE SANTÉ DE LA RÉGION DU NORD CAMEROUN

Page 2: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

DÉDICACES i

Dédicaces

Je dédie ce travail à mes bien aimés parents :

M. NTAHDUI Michel et Mme. NTAHDUI née KWEKAM Justine.

À toute la famille NTAHDUI.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 3: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

REMERCIEMENTS ii

Remerciements

La réalisation de ce document a nécessité la contribution d’un bon nombre de personnesà qui nous témoignons notre profonde et sincère gratitude. Nous pensons :

– Au Pr. Henri GWÉT, responsable du Master de statistique appliquée et Chef deDépartement de Mathématiques et Sciences Physiques de l’École Nationale SupérieurePolytechnique.

– Aux membres du jury :• Pr. Noël Houédougbé FONTON ;• Pr. Henri GWÉT ;• Dr. Josiane ETANG ;• Dr. Wilson TOUSSILÉ ;• Dr. Eugène-Patrice NDONG NGUÉMA.

– Au Sécrétaire Général de l’OCEAC, qui a permis que nous puissions effectuernotre stage dans la structure qu’il dirige.

– Au Dr. Parfait AWONO, pour sa collaboration pendant notre stage.Nous pensons à tout le corps enseignant et administratif du MASTAT :

– Dr. Eugène-Patrice NDONG NGUÉMA, pour ses enseignements de qualité, sesorientations plurielles et le sens pratique des mathématiques qu’il a su implanter ennous, pour notre édification tout au long de notre formation.

– Dr J. TAGOUDJEU, Dr J.J. TEWA, Dr. W. TOUSSILE, Dr. J. TAD-JUIDJE, Dr. Guy MAHIANE, Dr. Brice TCHATCHUENG, Dr. SolangeWHEGANG, Dr. Patrice TAKAM, Dr. NDOUMBE, Pr. Robert NGONTHE,Mme MAGOUA, M. NASHIPU, M. Ebénezer KUNATSE, M. NGUETAGérard, pour leur support académique.

À papa et maman NKOINLA.Mes remerciements vont aussi à l’endroit des familles : FAMBO, YOMI, NJAKO,NGUENDJIO et NANYOU, dont le support est inestimable.Je ne pourrai oublier mes camarades du MASTAT : Ateba François, Bell Bell YvesA., Bell-Hadji Y., Sandie Arsène B. et Tchamdou Tchatat Jules ; mes promotion-

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 4: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

REMERCIEMENTS iii

naires depuis Dschang ainsi que mes co-stagiaires à l’OCEAC et M. FESUH Betrandpour ses conseils et sa supervision continue.BEUNANG Carter, FAMBO Jaures, mes partenaires de tous les jours.

Je pense aussi à la grande famille et chorale Amour et Foi de l’Aumônerie ProtestanteUniversitaire du Cameroun-Yaoundé, pour la joie du vivre ensemble, pour la croissancespirituelle dont je bénéficie dans ses rangs et pour tout autre support.

Je pense à tous mes voisins sans distinction et toute personne qui aurait, de près ou deloin, participé à la réalisation de ce document et dont le nom a été oublié.

Le plus important pour moi est cette action de grâce que je rends à DIEU, lePère tout-puissant sans qui nous n’existerions même pas et sans qui tout ceci n’aurait étépossible.Ma prière permanente est qu’il bénisse et guide particulièrement chaque personne mentionnéeou non ci-dessus.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 5: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

TABLE DES MATIÈRES iv

Table des matières

Dédicaces i

Remerciements ii

Table des figures vii

Liste des tableaux viii

Abréviations ix

Lexique des termes techniques x

Avant-propos xii

Résumé xiii

Abstract xiv

Introduction xv

Résumé Exécutif xviii

1 PRÉSENTATION ET ANALYSE DES DONNÉES 11.1 Présentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 La zone d’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1.2 Procédure du test de résistance et collecte des données . . . . . . . . 31.1.3 Données finales retenues . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2 Analyse descriptive des données . . . . . . . . . . . . . . . . . . . . . . . . . 61.2.1 Analyse Descriptive Univariée . . . . . . . . . . . . . . . . . . . . . . 61.2.2 Analyse Descriptive Bivariée . . . . . . . . . . . . . . . . . . . . . . . 81.2.3 Description spatiale du TM24 . . . . . . . . . . . . . . . . . . . . . . 11

1.3 Description de la distribution spatiale des niveaux de résistance . . . . . . . 13

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 6: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

TABLE DES MATIÈRES v

1.3.1 Configuration globale de la résistance dans les trois districts de santé 141.3.2 Cas des localités où les moustiques sont résistants . . . . . . . . . . . 141.3.3 Cas des localités où les moustiques sont sensibles . . . . . . . . . . . 151.3.4 Cas des localités avec résistance probable . . . . . . . . . . . . . . . . 151.3.5 Étude de l’autocorrélation spatiale du TM24 . . . . . . . . . . . . . . 15

2 MÉTHODOLOGIE 202.1 Tests statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.1.1 Test de normalité de Shapiro-Wilk . . . . . . . . . . . . . . . . . . . 202.1.2 Test de rang de Kruskal-Wallis . . . . . . . . . . . . . . . . . . . . . 21

2.2 Outils d’aide à la description en analyse spatiale . . . . . . . . . . . . . . . . 212.2.1 L’ellipse de déviation standard . . . . . . . . . . . . . . . . . . . . . . 222.2.2 Indice de Moran et test d’indépendance spatiale . . . . . . . . . . . . 23

2.3 Interpolation spatiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252.3.1 Éléments sur les processus stochastiques . . . . . . . . . . . . . . . . 262.3.2 Analyse variographique . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.4 L’interpolation optimale : krigeage . . . . . . . . . . . . . . . . . . . . . . . 312.4.1 Introduction et Généralités . . . . . . . . . . . . . . . . . . . . . . . . 312.4.2 Krigeage simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332.4.3 Krigeage ordinaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332.4.4 Krigeage universel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.4.5 Mise en oeuvre du krigeage . . . . . . . . . . . . . . . . . . . . . . . 362.4.6 Conclusion du chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3 INTERPOLATION SPATIALE DANS LES TROIS DISTRICTS 383.1 Analyse variographique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393.2 L’interpolation du TM24 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.3 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

CONCLUSION 47

ANNEXE : Instructions R 49

Bibliographie 57

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 7: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

TABLE DES FIGURES vi

Table des figures

1 Répartition spatiale de la résistance des A. gambiae s.l. dans les trois districtsde santé en 2012. Échelle : pourcentage de mortalité des moustiques à ladeltaméthrine (TM24). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxi

2 Représentation des localités par niveau de résistance observée. . . . . . . . . xxii

1.1 Localisation de la zone d’étude. . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Histogramme et densité estimée des variables TM24, CouvMILDA et N. . . . 71.3 Histogramme et densité estimée des variables TempCl, Hydrométrie, Tkd95

et Tkd50. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.4 Distribution de TM24, Tkd50 et Tkd95 par rapport à Desc. . . . . . . . . . 111.5 Schéma de disposition des localités où les moustiques sont résistants (gauche) ;

table des distance entre ces localités (droite). . . . . . . . . . . . . . . . . . . 121.6 Schéma de disposition des localités où les moustiques sont sensibles (gauche) ;

table des distance entre ces localités (droite). . . . . . . . . . . . . . . . . . . 131.7 Schéma de disposition des localités avec résistance probable (gauche) ; table

des distance entre ces localités (droite). . . . . . . . . . . . . . . . . . . . . . 131.8 Représentation en 3D du taux de mortatité dans les 25 localités selon leur

niveau de résistance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.9 Distribution spatiale globale des niveaux de résistance observée. . . . . . . . 181.10 Distribution spatiale du TM24 par niveau de résistance observée. . . . . . . 19

2.1 Caractéristiques d’un semi-variogramme. . . . . . . . . . . . . . . . . . . . . 282.2 Quelques modèles de semi-variogramme. . . . . . . . . . . . . . . . . . . . . 31

3.1 Comportement du TM24. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383.2 Semi-variogrammes empiriques pour krigeages simple, ordinaire et universel. 403.3 Modélisation du semi-variogramme expérimental pour krigeage simple et or-

dinaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403.4 Modélisation du semi-variogramme expérimental pour krigeage universel. . . 413.5 Carte des niveaux de résistance des 38 localités. . . . . . . . . . . . . . . . . 45

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 8: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

TABLE DES FIGURES vii

3.6 Répartition spatiale de la résistance (en %) dans la zone d’étude. . . . . . . 46

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 9: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

LISTE DES TABLEAUX viii

Liste des tableaux

1 Résumé des valeurs krigées du taux de mortalité pour les localités non échan-tillonnées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xx

2 Valeurs du taux de mortalité krigées pour les localitées restantes. . . . . . . xx

1.1 Échantillon des 38 localités dans les 3 districts d’étude . . . . . . . . . . . . 11.2 Critères d’interprétation des résultats des tests de sensibilité selon l’OMS

(2013b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.3 Distribution de la variable Desc (milieu urbain, semi-urbain, rural) . . . . . 61.4 Résumé des variables quantitatives. . . . . . . . . . . . . . . . . . . . . . . . 61.5 Test de normalité de Shapiro-Wilk des variables quantitatives. . . . . . . . . 81.6 Coefficients de corrélation de Spearman entre les variables quantitatives . . . 91.7 Test de Kruskal-Wallis sur la liaison entre la variable Desc et les variables

quantitatives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.8 Répartition des 25 localités par niveau de résistance selon les critères de l’OMS

(2013b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.9 Valeurs de l’indice de Moran par niveau de résistance. . . . . . . . . . . . . . 16

3.1 Résumé des valeurs krigées du TM24 pour les localités non échantillonnées. . 413.2 Valeurs krigées du TM24 pour les localités non échantillonnées. . . . . . . . 423.3 Estimation des niveaux de résistance des moustiques dans les 13 localités

restantes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 10: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

ABRÉVIATIONS ix

Abréviations

A.gambiae s.l. : Anopheles gambiae sensu lactoDDT : Dichloro-diphenyl-trichloroethaneDEF : sss-tributyl-phosphotrithioateMILDA : Moustiquaire Imprégnée à Longue Durée d’ActionOCEAC : Organisation de Coordination pour la lutte contre les Endémies en Afrique Cen-traleENSP : École Nationale Supérieure PolytechniqueOMS : Organisation Mondiale de la SantéPBO : piperonyl butoxideTkd : Temps de knock-down

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 11: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

LEXIQUE DES TERMES TECHNIQUES x

Lexique

Nous présentons, dans cette section, quelques mots et expressions utilisés dans ce docu-ment.

Analyse spatiale : C’est l’étude formalisée de la configuration et des propriétés del’espace produit et vécu par les sociétés humaines, ou bien l’ensemble des méthodes ma-thématiques et statistiques visant à préciser la nature, la quantité et la qualité attachéesaux lieux et aux relations qu’ils entretiennent (l’ensemble constituant l’espace) en étudiantsimultanément attributs et localisation (Y. SOME, 2000).

Anophèle : Moustique (de la famille des culicidés) dont la femelle transmet le paludisme.

Anopheles gambiae s.l. (A.gambiae s.l.) : C’est un complexe d’espèces d’anophèlescomprenant : A. arabiensis, A. melas, A. merus, A. bwambe, A. quadriannulatus, A. amha-ricus, A. coluzzii, A. gambiae sensu stricto (A.gambiae s.s.).

Insecticide : Substance active de la famille des pesticides ayant la propriété de tuer lesinsectes, leur larve et/ou leurs oeufs.

Lutte anti-vectorielle : Méthode de lutte contre les maladies à transmission vectorielle.Pour le cas du paludisme, elle consiste à diminuer le contact moustique-Homme, à diminuerla densité du vecteur (lutte anti larvaire).

Moustique : En entomologie, insecte diptère à longues ailes et longues pattes fines dontle mâle se nourrit du nectar des fleurs et dont la femelle se nourrit du sang de l’homme et decertains animaux qu’elle pique. On y retrouve les genres Culex, Anophèles, Aedes, Mansonia,Haemagogus, Psorophora à l’origine de différentes maladies dont le paludisme, la dengue,la fièvre jaune, etc.

Paludisme : Maladie infectieuse parasitaire transmise par piqûre de moustique de l’es-

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 12: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

LEXIQUE DES TERMES TECHNIQUES xi

pèce Anophèle et qui se caractérise par de fortes fièvres.Synonyme : malaria.

Plasmodium : Parasite responsable du paludisme chez l’Homme.

Résistance : Développement chez un individu, d’une capacité de tolérer des doses d’in-secticides qui seraient létales pour la majorité des individus d’une population normale de lamême espèce (OMS, 1970). On distingue :

– la résistance métabolique. Elle apparaît lorsque des changements surviennent dansle système des enzymes du moustique. Une désintoxification accrue a lieu par rapportà la normale, prévenant ainsi l’insecticide d’arriver à la zone d’action.

– la résistance par modification de la cible. Elle apparaît lorsque la protéine récep-trice (celle que l’insecticide est supposée atteindre) est altérée par une mutation.

Synergist : Substance qui, en elle-même, ne possède pas les propriétés d’un insecticide(appartenant à une certaine classe), mais qui, une fois associée à ce dernier, augmente satoxicité vis-à-vis des moustiques.

Vecteur : Organisme qui ne provoque pas lui-même une maladie, mais qui disperse l’in-fection en transportant les agents pathogènes d’un hôte à l’autre.Exemple : L’Anophèle pour le paludisme.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 13: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

AVANT-PROPOS xii

Avant-propos

Ce travail représente le résultat de six mois de stage académique dans les locaux del’OCEAC (Organisation de Coordination pour la lutte contre les Endémies en Afrique Cen-trale), au laboratoire de recherche sur le paludisme (LRP) à Yaoundé.

Il porte sur le thème "ANALYSE DE LA DISTRIBUTION SPATIALE DE LA RÉ-SISTANCE Á LA DELTAMÉTHRINE CHEZ Anopheles gambiae s.l. DANS TROIS DIS-TRICTS DE SANTÉ DE LA RÉGION DU NORD CAMEROUN", ceci dans le but del’obtention du Master de Statistique Appliquée. Il a été supervisé par le Pr. Henri GWÉT,ENSP Yaoundé et le Dr. Josiane ETANG, Chercheur à l’OCEAC.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 14: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

RÉSUMÉ xiii

Résumé

Le travail que nous avons effectué pendant notre stage à l’OCEAC consistait à analyserla distribution spatiale de la résistance des populations d’A. gambiae s.l. à la deltaméthrinedans trois districts de santé du Nord Cameroun. Il s’agissait, en fait, d’étudier toute tendancede forme, d’allure, de regroupement d’une part, et de modéliser la configuration observée dela résistance dans les trois districts. Pour ce faire, nous avons utilisé des outils statistiquespour les analyses univariée, bivariée et spatiale des variables qui ont retenu notre attention.Il s’agit, entre autres, des histogrammes, des courbes de densité, des boîtes à moustache,l’indice de Moran, l’ellipse de déviation standard, des tests de normalité de Shapiro-Wilk,de corrélation de Spearman, d’autocorrelation spatiale. Pour la modélisation, nous avonsfait recours aux notions de fonction aléatoire, processus stationnaire et intrinsèque, de va-riogramme et d’analyse variographique. Pour l’interpolation spatiale, le krigeage universelpar surface de réponse s’est avéré être le mieux adapté à notre situation. On retient pre-mièrement de ce travail que le sud de notre zone d’étude, en particulier par son fort tauxd’urbanisation, est le lieu avéré de résistance des A. gambiae s.l. à la deltaméthrine. Deuxiè-mement, seul l’espace ne peut totalement expliquer son niveau de résistance. En effet, onnote la contribution d’autres facteurs (le relief, la végétation, l’urbanisation) qui sont propresà chaque localité. Ces résultats ont permis de faire quelques estimations et de construire unecarte relative à la répartition spatiale de la résistance des A. gambiae s.l. à la deltaméthrinedans les trois districts en question.

Mots clés : Analyse spatiale, résistance, paludisme, A.gambiae s.l., deltaméthrine, va-riogramme, interpolation spatiale, distribution, krigeage.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 15: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

ABSTRACT xiv

Abstract

The work we were to embark on the course of our internship at OCEAC consisted inthe analysis of the spatial distribution of deltamethrin resistance in A. gambiae s.l. popu-lations from three health districts in North Cameroon. The work focused on the study ofpatterns, behaviour, groupings, and modelling the observed configuration of that resistancein the three districts. We used statistical tools for univariate and bivariate analyses, andspatial description of the variables retained in our study. The tools included histograms,density curves, box plots, Moran’s index, directional ellipses, Shapiro’s tests for normality,Spearman’s correlation tests and Moran’s tests for spatial auto-correlation. With respectto statistical modelling, we employed notions of random functions, stationary and intrinsicprocesses, variogram and variographic analysis. For spatial interpolation, universal krigingseemed to be better adapted to our situation. Results proof in this study showed that theSouth of our study zone, in relation with its high urbanization rate, indicated the highestrate of deltamethrin resistance in A. gambiae s.l. Also, the spatial location of a given localitywas not the only factor which can be used to determine the level of resistance of the loca-lity. Other factors such as altitude, vegetation and urbanization can also be considered. Ourresults also permitted us to perform spatial predictions and cartography, showing the spa-tial distribution of A. gambiae s.l.’s resistance to deltamethrin in those three health districts.

Key words : resistance, malaria, A gambiae s.l., deltamethrin, variogram, spatial inter-polation, spatial distribution, spatial analysis, kriging.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 16: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INTRODUCTION xv

Introduction

Contexte

Une des maladies à transmission vectorielle les plus connues dans le monde et qui sévittoujours en Afrique est le paludisme. Il est causé par des parasites du genre Plasmodiumqui sont transmis aux humains par les piqûres de moustiques ou vecteurs infectés (des fe-melles uniquement) appartenant à l’espèce Anopheles (OMS, 2013a). Parmi les cinq espècesde parasites causant le paludisme chez les êtres humains, Plasmodium falciparum est le plusdangereux.

D’après l’Organisation Mondiale de la Santé (OMS, 2013a), environ 3, 3 milliards de per-sonnes dans le monde sont exposées au risque de paludisme. En 2010, on a enregistré environ216 millions de cas et quelque 660.000 décès dus à cette maladie, et les habitants des paysles plus pauvres sont les plus vulnérables. Pour cette même année de 2010, 90% des décès dusau paludisme sont survenus en Afrique ; les femmes enceintes et les enfants agés de moins decinq ans en sont les victimes les plus récurrentes. Pour ce qui est du Cameroun, le paludismereste une préoccupation gouvernementale continue, vu que ce dernier est à l’origine de prèsde 50% de morbidité infantile, près de 40 à 45% de consultations médicales (B. Fesuh, 2012).

Au vu de de cette situation, la communauté internationale conduit une lutte anti-vectorielleet anti-plasmodiale qui, depuis l’an 2000, a permis de faire baisser le taux de mortalité liée aupaludisme de plus de 33% dans la région africaine (OMS, 2013a). Malgré ces efforts considé-rables, cette maladie ne cesse de se répandre. Ceci s’explique en partie par le développementde mécanismes de résistance des vecteurs de paludisme (A. gambiae, A. funestus et A. ara-biensis) aux insecticides. En effet, l’utilisation régulière des moustiquaires imprégnées auxinsecticides à longue durée d’action (MILDA), les pulvérisations d’insecticides à l’intérieurdes locaux et l’utilisation abusive des pesticides en santé publique comme en agriculture,sont non seulement les moyens réguliers de lutte anti-vectorielle, mais aussi des facteurs desélection de la résistance des vecteurs (OMS, 2013b).

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 17: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INTRODUCTION xvi

Dans le cadre du projet "impact of insecticide resistance on the effectiveness of LLINsin the north of Cameroon", un test de sensibilité d’A. gambiae s.l. à la deltaméthrine a étéeffectué dans la dite région, où trois districts de santé (Garoua, Mayo-Oulo et Pitoa) étaientconcernés. Le protocole de test est celui prescrit par l’OMS (2013b) à travers son plan globalde gestion de la résistance des vecteurs de paludisme aux insecticides.

Problématique

L’état actuel des connaissances quasi-insuffisantes sur l’écologie des anophèles ne per-met pas la mise en place de mesures efficaces de contrôle vectoriel. Par exemple, les causesde répartition à grande échelle surfacique de la résistance observée et la distribution desmembres du complexe Anopheles gambiae s.l. sont encore méconnues. L’analyse spatiale in-tervient donc ici non seulement comme une nouvelle orientation d’étude, mais aussi commeun cadre de méthodes. Ici, on considère l’espace à la fois comme support d’existence etcomme produit de l’action. À ce titre, l’espace peut servir d’outil de justification et d’expli-cation scientifique autonome. En tant qu’ensemble de méthodes, l’analyse spatiale regorgede moyens (procédures, modèles, techniques d’analyse) qui permettent à la fois l’analysedes données et leur interprétation (Y. SOME, 2000). La question de la résistance à laquellenous sommes confrontés nécessite, de ce fait, une exploration conséquente.

Dans la perspective du contrôle de la population des vecteurs, il s’agira d’utiliser l’ana-lyse spatiale dans cette étude à la fois comme méthode d’analyse et comme technique detraitement de données (choix des techniques d’estimation, interpolation) pour résoudre effi-cacement le problème central qui est de caractériser l’organisation, la répartition spatiale dela résistance observée dans le Nord Cameroun.

Objectif général

L’objectif général de ce travail est d’analyser, d’un point de vue spatial, la répartition dela résistance à la deltaméthrine chez A. gambiae s.l. du Nord Cameroun en vue de prévenirl’échec des interventions contre les vecteurs du paludisme.

Objectifs spécifiques

Les objectifs spécifiques de l’étude sont les suivants :

1. Cartographier les districts cibles en fonction des niveaux de résistance d’A. gambiaes.l. à la deltaméthrine.

2. Décrire, sur le plan géostatistique, les tendances et les dispositions du phénomène dela résistance précédemment observé.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 18: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INTRODUCTION xvii

3. Dresser une carte prévisionnelle de la répartition spatiale de la résistance dans la zoned’étude.

Pour atteindre nos objectifs, nous avons adopté le plan suivant.

Plan de travail

Notre travail est globalement divisé en trois chapitres. Le premier est consacré à l’analyseexploratoire des données et à la description spatiale de la variable d’intérêt que nous auronsà préciser. Le deuxième chapitre présente brièvement l’ensemble d’outils statistiques etd’analyse spatiale utilisés dans notre travail. Le dernier présente la mise oeuvre des méthodesd’interpolation spatiale décrites au chapitre d’avant, méthodes qui nous conduiront à laformulation mathématique de notre variable et à une carte prévisionnelle de cette dernièresur toute la zone d’étude.

Nous terminerons par une conclusion et une annexe qui indique l’ensemble des instruc-tions utilisées dans le logiciel R 2.15.1, pour tous les calculs effectués dans ce mémoire.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 19: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

RÉSUMÉ EXÉCUTIF xviii

Résumé Exécutif

ProblématiqueIl a été observé une certaine résistance des vecteurs de transmission du paludisme au contactavec des insecticides. En effet, les mécanismes de résistance de type métabolique, modifica-tion de la cible sont les plus rencontrés chez ces vecteurs et dont la prise en charge pour lutterefficacement contre cette maladie suscite un intérêt particulier. Nous nous sommes intéressésà la région du Nord Cameroun et aux populations d’A. gambiae s.l, dont des échantillons,dans le cadre de l’année 2012, ont été testées à la deltaméthrine dans 25 localités de la ditezone. Des résultats obtenus, des niveaux de résistance ont été attribuées aux localités, selonla nomenclature établie par l’OMS. Notre problème est de pouvoir caractériser et formaliser,d’un point de vue spatial, la répartition ou distribution spatiale de la résistance des popu-lations d’A. gambiae s.l sur les trois districts de santé étudiés dans la région (i.e. Garoua,Pitoa et Mayo-Oulo).

MéthodologieLes données que nous avons retenues pour la résolution de ce problème tiennent compte descoordonnées géographiques (longitude et latitude) des localités où ont été mesurés les tauxde mortalité des moustiques exposés à la deltaméthrine. Ce type de données fait partie de laclasse des données de type géostatistique dans le secteur de l’analyse spatiale. La démarcheméthodologique mise en oeuvre dans ce mémoire s’y identifie et est structurée ainsi qu’ilsuit :

1. Une analyse exploratoire et descriptive des données. Il s’agit, premièrement, d’uneanalyse univariée des variables. Des histogrammes et courbes de densité ont été utiliséspour les variables quantitatives, ainsi que des tests de normalité de Shapiro-Wilk. Pourla description bivariée, le test de rang de Kruskall-Wallis et des boîtes à moustache ontété utilisés pour étudier le lien entre le niveau d’urbanisation (seule variable qualitative)de la localité et les autres variables quantitatives, dont notre variable d’intérêt : letaux de mortalité des moustiques au contact de la deltaméthrine. Nous terminons parune description spatiale de cette dernière variable : des graphes de voisinage à sadépendance spatiale globale (indice d’autocorrelation de Moran), en passant par sa

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 20: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

RÉSUMÉ EXÉCUTIF xix

structure de forme et de tendanace globale et par niveau de résistance.

2. Dans le but de répondre au principal objectif de la géostatistique qui est l’interpolationspatiale, nous avons procédé à une analyse variographique de notre variable ainsi qu’à lamodélisation de sa structure de dépendance spatiale. Des modèles d’interpolation parkrigeage simple, ordinaire et universel sont ensuites étudiés. Ce choix se justifie déjà parleur optimalité (vu les contraintes de prédiction) et leur mise en oeuvre simple etpratique, aussi pour le principal fait de tenir compte de la structure de variabilitéspatiale. Chacun est ainsi étudié pour des modèles correspondants de tendance de lafonction aléatoire rattachée à notre variable d’intérêt.

3. L’application de la validation croisée par "leave-one-out" nous permet de choisir nonseulement le modèle variographique adapté à chaque type de krigeage, mais aussil’outil d’interpolation qui s’adapte le mieux à notre contexte.

Ces analyses et représentations ont été effectuées à l’aide des logiciels R 2.15.1, ArcGis10.1. Les packages R suivants ont été d’une très grande nécessité : ade4, ape, gstat, spdep.

Résultats

Nous obtenons premièrement la carte de la Figure 2. Elle nous permet essentiellementde s’approprier de la situation pour les 25 localités échantillonées. Le test d’autocorrélationglobal nous permet de conclure qu’on ne peut déduire l’absence totale d’autocorrélation decette variable sur la zone d’étude. Nous notons du moins une orientation et configurationobservable de la résistance dans nos trois districts.

En effet, cette carte nous permet de nous rendre compte de l’orientation particulièredes localités avec résistance suivant la direction nord-est sud-ouest. Elles ont leur centre degravité situé en plein Garoua et elles diminuent en nombre lorsqu’on se dirige vers l’ouest etle nord de la zone d’étude. Le district de Garoua correspond ainsi à la zone de concentrationdes localités où les populations d’A. gambiae s.l. sont plus résistantes à la deltaméthrine.

Les localités où les populations d’A. gambiae s.l. sont sensibles apparaissent beaucoupplus vers Mayo-Oulo et ont tendance à s’étirer dans la direction nord-ouest sud-est. Leslocalités montrant une résistance probable sont beaucoup plus regroupées dans le district dePitoa et se confondent presqu’aux localités avec résistante du district de Garoua.

L’analyse variographique nous permet d’obtenir des semi-variogrammes tous bornés aveceffet de pépite, dont la structure de dépendance à modèle exponentiel de palier 230.5 et deportée 0.0029 est sélectionné par validation croisée par "leave-one-out", pour les krigeagessimple et ordinaire. Celui exponentiel de palier 239.67 et de portée 0.0036 est sélectionnépour le krigeage universel. Après interpolation, on a la description des valeurs krigées dansla Table 1.

Le krigeage universel est sélectionné comme méthode mieux adaptée pour la formalisation

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 21: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

RÉSUMÉ EXÉCUTIF xx

Table 1 – Résumé des valeurs krigées du taux de mortalité pour les localités non échan-tillonnées.

Méthodes d’interpolation Min Quartile1 Médiane Moyenne Quartile3 MaxKrigeage simple 43.64 71.93 79.09 79.19 90.72 100

Krigeage ordinaire 43.64 71.93 79.89 79.45 90.72 100Krigeage universel 43.64 70.77 81.33 80.09 95.10 100

de notre variable. Suivant ce modèle, on peut estimer pour les localités non échantillonnéesles valeurs du taux de mortalité des moustiques.

Table 2 – Valeurs du taux de mortalité des A. gambiae s.l. (TM) krigées pour les localitéesrestantes.

District Localité TM estimé Niveau de résistanceKirambo 82.77 Résistant

Pitoa Banaye 80.87 RésistantBoussa 97.1 Résistant probable

Bossoum 98.86 SensibleBotoun 99.23 Sensible

Mayo-Oulo Doumo 79.70 RésistantMatara 78.02 RésistantMaboni 81.79 Résistant

Mboum-aviation 71.80 RésistantBocki 73.05 Résistant

Garoua Laindé I 73.70 RésistantLaindé II 73.54 RésistantNassarao 74.81 Résistant

Du fait de l’absence d’autocorrélation globale entre les localités avec résistance et cellesavec résistance probable, il apparaît que seul l’espace ne suffit pas pour expliquer les ob-servation faites ci-dessus. En effet, on remarque que le taux de mortalité observé en zoneurbaine est très inférieur à celui des zones rurale et semi-urbaine. Ceci est caractérisé par untemps de knock-down élevé. Nous avons aussi relevé la contribution du relief, la pression destraitements insecticides, de la végétation, du taux d’utilisation des MILDA et la répartitiondes espèces du complexe (Y. Some, 2000 ; Ibemba, 2012).

Conclusion

La résistance observée au niveau des localités dans nos trois districts présente bien unestructuration. Cette structure spatiale décrite ne peut s’expliquer totalement par l’espace. Ilaurait été nécessaire de décrire un certain nombre de propriétés liées aux localités à tenir encompte dans la mise en oeuvre des outils de prédiction. Cela demande qu’on puisse en tenircompte pendant la récolte des données sur le terrain, sans toutefois oublier d’augmenter,autant que faire se peut, le nombre de points d’observation. On obtient au final la carte de

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 22: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

RÉSUMÉ EXÉCUTIF xxi

la Figure 1, en remarquant que, plus la zone est rouge, plus les moustiques y sont résistants.

Figure 1 – Répartition spatiale de la résistance des A. gambiae s.l. dans les trois districts desanté en 2012. Échelle : pourcentage de mortalité des moustiques à la deltaméthrine (TM24).

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 23: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

RÉSUMÉ EXÉCUTIF xxii

Figure 2 – Représentation des localités par niveau de résistance observée.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 24: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 1

Chapitre 1

PRÉSENTATION ET ANALYSE DESDONNÉES

Nous présentons, en premier, la zone d’étude. Il s’agira, dans la suite, de présenter laprocédure du test d’évaluation de la résistance à la deltaméthrine, telle que prescrite parl’OMS. Il s’agira, ensuite, d’analyser les variables observées et les liens qui pourraient existerentre elles. En effet, une compréhension complète et contextuelle de celles-ci par rapportà la problématique qui leur est associée nous guidera dans le choix optimal des méthodes etoutils adéquats pour parvenir à résoudre les problèmes ci-dessus énoncés.

1.1 Présentation

1.1.1 La zone d’étude

Les données mises à notre disposition ont été collectées au Cameroun, plus précisementdans la région du Nord. Celle-ci est répartie en treize districts de santé parmi lesquels troisont été sélectionnés pour l’étude. Il s’agit des districts de Garoua, Pitoa et Mayo-Oulo, dontl’échantillon des 38 localités est présenté dans la Table 1.1, avec les codes qui leur ont étéassignés.

Table 1.1 – Échantillon des 38 localités dans les 3 districts d’étude.District Population Localités

du district

Guizigaré (GUI), Boulgou (BOL), Lombou (LOM), Boussa (BOUS)Pene (PEN), Kirambo (KIR), Be Centre (BEC), Mbolom (MBO)

Pitoa 108.611 Bouba-Ibbi (BOI), Mayo Lebri (MAL), Banaye (BAN), Nassarao-Be (NAB)Bocki (BOK), Ouro Lawan (OUL), Plateau (PLA), Mboum-Aviation (MBA)Kanadi I (KAN), Kanadi II (KAD), Kollere (KOL), Lounderou (LOU), Mbilga (MBI)

Garoua 316.957 Nassarao (NAS), Ouro-Garga (OUR), Ouro-Hourso I (ORH), Djamboutou I (DJA)Laindé I (LAI), Laindé II (LAN), Djamboutou II (DJM), Ouro-Hourso II (OUH)Mayo-Oulo (MAY), Botoum (BOT), Boyoum (BOU), Dourbaye (DOR), Bala (BAL)

Mayo-Oulo 91.501 Doumo (DOM), Matara (MAT), Bossoum (BOS), Maboni (MAB)

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 25: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 2

Figure 1.1 – Localisation de la zone d’étude.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 26: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 3

1.1.2 Procédure du test de résistance et collecte des données

Procédure du test d’évaluation de la résistance à la deltaméthrine (OMS,2013b)

Il s’agit ici d’un test de sensibilité des moustiques adultes, selon le protocole de l’OMS(2013b). Les moustiques de terrain sont récoltés dans une localité d’intérêt au stade larvaireet élevés jusqu’au stade adulte. Seules les femelles à jeûn, agées de 3 à 5 jours sont utiliséeset un nombre de cent moustiques doivent être testés pour garantir la fiabilité du test.

Pour le test, des lots de 25 femelles n’ayant jamais pris de repas de sang sont déposéesdans un tube d’observation et maintenues à une température de 27 C et 80% d’humiditérelative pendant une heure. Elles sont ensuite transférées dans un tube d’exposition muni depapier imprégné d’insecticide (n’ayant pas été utilisé plus de six fois), où elles sont isoléespendant une heure. Les moustiques subissant un effet "knocked-down" (tombé sous l’effetde l’insecticide mais pas encore mort) sont décomptés à intervalles de temps réguliers.

Après exposition, les moustiques sont réintroduis dans les tubes d’observation avec bou-chon d’aération vers le haut sur lequel on a fixé du coton imbibé de jus sucré, pendant 24

heures dans l’obscurité à 27 C et 80% d’humidité relative. Chaque test est ainsi réalisé avecun lot témoin. La mortalité observée est calculée ainsi :

mortalité observée = Nombre total de moustiques mortsNombre total de moustiques collectés × 100.

Un calcul similaire nous permet aussi d’avoir le taux de mortalité du lot témoin. Si celui-ciest supérieur à 20%, alors le test dans cette zone doit être écarté ou repris.Si, par contre, il est compris entre 5% et 20%, alors le taux de mortalité (TM) doit êtrecorrigé suivant la formule (Abbot, 1925) :

TM = %mortalité observée−%mortalité témoin100−%mortalité témoin × 100.

Si, enfin, il est inférieur à 5%, alors le résultat du test est validé.Une fois le taux de mortalité calculé, on définit les niveaux de résistance ainsi qu’il suit :

Table 1.2 – Critères d’interprétation des résultats des tests de sensibilité selon l’OMS(2013b).

Taux de mortalité Niveau de résistance24h après associé98%−100% Sensible90%−97% Résistance probable< 90% Résistant

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 27: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 4

Ainsi, plus le taux de mortalité est grand, moins la population de moustique est résistantedans la localité.Le test continue en laboratoire par la détection des mécanismes de résistance développéspar ces moustiques et par une analyse moléculaire pour déterminer les différentes espècesimpliquées dans les phénomènes de résistance.

Collecte des données

Une équipe est allée sur le terrain pour la période allant d’octobre à novembre 2012, à lafin de la saison des pluies. L’équipe s’est divisée en trois : une à Garoua, une autre à Pitoaet la dernière à Mayo-Oulo. Elles ont procédé à la collecte des moustiques par "ramassage"des larves dans des gîtes variants : flaque d’eau, sillons de culture, bras de cours d’eau mort,puits, rigoles de déversement de déchets industriels (SODECOTON), champs de culture (riz,macabo, maïs, patate) et ce entre quartiers résidentiels, administratifs, ainsi qu’en zonesrurales et péri-urbaines.

Le trajet de ces équipes n’était pas fixé à l’avance, tout s’est donc fait de façon aléatoiredans les localités concernées. Les larves obtenues ont été élevées jusqu’au stade adulte dansles conditions de laboratoire, le test a été effectué suivant le protocole normalisé de l’OMSdécrit plus haut.

Contrairement au test de 2011, où les moustiques ont été testés à trois insecticides (DDT4%, deltaméthrine 0.05% et la perméthrine 1%), l’accent a été mis sur la deltaméthrine0.05% comme insecticide pour l’année 2012. Vingt-cinq localités ont ainsi été concernées surles 38 sites d’étude. Les indicateurs suivants ont été mesurés :

– le nombre de knock-down par intervalle de temps ;– le taux de mortalité par localité.Un des problèmes a été que le nombre de moustiques requis n’était pas toujours atteint

(en zones montagneuses en particulier), ce qui obligeait les équipes à essayer de nouveau lacollecte les jours suivants pour compléter l’échantillon de test.

1.1.3 Données finales retenues

L’étude porte sur le suivi de la résistance, dans les différentes localités. L’unité ici estdonc la localité. La résistance ici fait référence au taux de mortalité des moustiques aprèscontact avec l’insecticide. Deuxièmement, sur les 38 localités dénombrées pour les trois dis-tricts, seules 25 ont été retenues dans le cadre de nos travaux tandis que certaines localitésn’ont pas été prises en compte en raison du faible nombre de moustiques utilisés pour effec-tuer le test décrit plus haut. Il s’agit de Bocki, Nassarao (Garoua), Laïndé I et Laïndé II.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 28: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 5

Les variables

Le tableau de données est constitué de 25 unités pour 11 variables parmi lesquellesune seule est qualitative et le reste quantitatif. Les différentes variables et leur modalitésrespectives sont les suivantes :

1. TM24 : le taux de mortalité des moustiques par localité après 24 heures, défini pré-cédemment ;

2. Desc : la description du milieu, variable catégorielle à trois modalités (urbain, semi-urbain et rural) ;

3. Tempcl : la température (en dégré celcius) ambiante au moment du test ;

4. Hydrométrie : le dégré d’humidité (en pourcentage) de l’environnement au momentdu test ;

5. Latitude : Composante Nord-Sud des coordonnées géographiques de chaque localité(sous la forme X :Y :ZN) ;

6. Longitude : Composante Est-Ouest des coordonnées géographiques de chaque localité(sous la forme X :Y :ZE) ;

7. CouvMILDA : le pourcentage en couverture de MILDA (proportion de personnesayant au moins une moustiquaire imprégnée). Cette variable provient d’une autre étuderéalisée en 2011. Nous l’avons donc extraite d’une autre table de données. Elle est jusqu’alors indisponible en ce qui concerne l’année 2012.

8. N : Nombre de moustiques collectés au niveau de chaque localité ;

9. Tkd50, Tkd95 : variables quantitaives continues exprimées en minutes et désignantrespectivement le temps nécessaire pour que 50%, 95% de l’effectif des moustiques soit"knocked-down".

Chacune des variables ci-dessus mentionnées est complètement observée sur chaque localité.Nous n’avons donc aucune donnée manquante.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 29: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 6

1.2 Analyse descriptive des données

Il sera question ici de présenter des résumés statistiques des variables par des histo-grammes, des courbes de densité, des boxplots. Ceci nous permettra d’avoir quelques pre-mières caractéristiques sur chacune d’entre elles et même les éventuels liens entre variables.

1.2.1 Analyse Descriptive Univariée

Nous débutons notre analyse par la seule variable qualitative Desc. Le tri à plat de cettevariable est résumé dans le tableau suivant :

Table 1.3 – Distribution de la variable Desc (milieu urbain, semi-urbain, rural).

Modalité Effectif Proportionsemi 14 0.56

urbain 5 0.2

rural 6 0.24

La Table 1.3 nous indique que le mode de cette variable est "semi", 56% des 25 localitéséchantillonnées sont semi-urbaines. Elles sont plus nombreuses que les localités rurales (24%de l’échantillon) et urbaines (20%).

Table 1.4 – Résumé des variables quantitatives.Variable Min Quartile 1 Médiane Moyenne Quartile 3 MaxTM24 43.64 62.79 89.56 79.09 95.30 100

CouvMILDA 0 55.6 68.9 61.9 77.8 97.8N 41 67 82 76 87 110

TempCl 25 26 28 27.36 28 29Hydrométrie 45 59 65 62.12 67 73

Tkd50 11.6 18.8 21.6 28.24 38.4 56.6Tkd95 39.1 46.7 68.1 101.8 137.2 328.1

Nous pouvons dire, d’après la Table 1.4, que le nombre de moustiques testés par localitévarie entre 41 et 110, en moyenne 76 moustiques ont été testés. Le taux de mortalité observése situe entre 43% et 100%. Ceci nous indique la présence, dans notre échantillon, des localitésdont le niveau de résistance est décrit selon les critères de l’OMS (2013b). En moyenne 62%de personnes possèdent une moustiquaire imprégnée ; on note tout de même un minimumde possession de moustiquaire nul (Mayo Lebri) pour cette variable. Nous notons aussi le

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 30: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 7

fait qu’il faille en moyenne 28 minutes pour que 50% de l’effectif des moustiques testés soit"knocked-down", et il en faut 101 pour que ce soit le cas pour les 95% de l’effectif. Lepourcentage d’humidité, avec une valeur moyenne de 62.12%, se situe entre 45 et 73%.

Nous présentons, dans la Figure 1.2, un histogramme et les courbes de densité estimée(trait continu) et normale (trait interompu) de même caractéristiques que chacune des va-riables TM24, CouvMILDA et N dans cet ordre.

Figure 1.2 – Histogramme et densité estimée des variables TM24, CouvMILDA et N.

Les histogrammes de fréquence et les courbes de densité estimées (en trait continu) dé-crivent une distribution asymétrique en ce qui concerne le taux de mortalité et la couvertureen MILDA. Celles-ci diffèrent relativement de la distribution normale. En effet, le test denormalité de Shapiro-Wilk (§ 2.1.1) le confirme. Les p-value valent respectivement 0.003696et 0.001986, toutes deux inférieures à 5% (seuil du test).

Par contre, la p-value du même test est de 0.3068 en ce qui concerne le nombre demoustiques testés. On peut donc considérer sa distribution comme normale. On constateaussi que les médianes et les moyennes respectives du taux de mortalité, de la couverture

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 31: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 8

en MILDA, se rapprochent des valeurs maximales. La Table 1.5 suivant résume les valeursde la statistique du test de normalité de Shapiro-Wilk (W ) et de la p-value, représentant lerisque de rejeter en se trompant l’hypothèse de normalité.

Table 1.5 – Test de normalité de Shapiro-Wilk des variables quantitatives.TM24 CouvMILDA N TempCl Hydrométrie Tkd50 Tkd95

Valeurs de W 0.8666 0.8527 0.9539 0.8783 0.9224 0.8236 0.7668p -value 0.003696 0.001986 0.3068 0.00638 0.05797 0.0005781 6.68e-05

Pour ce qui est des variables TempCl, Hydrométrie, Tkd50 et Tkd95, il s’agit commeprécédement de l’histogramme, la courbe d’une estimation de la densité (trait continu) et dela distribution normale (trait interompu) de mêmes caractéristiques que chaque variable.

Il ressort de la Figure 1.3 que la courbe de densité estimée du pourcentage d’humi-dité (Hydrométrie) apparaît significativement proche de la distribution normale. Ceci estconfirmé par le test de normalité de la Table 1.5 où la p-value correspondante vaut 0.05797(supérieurement proche du seuil 5%).

Les histogrammes du Tkd95 et du Tkd50 décrivent une distribution asymétrique, for-tement regroupée vers les valeurs minimales. Ce qui nous permet de comprendre que pourque 95% des moustiques soient tombés, il faudrait en moyenne 101 minutes. Les courbes dedensité de ces variables nous permettent de voir la distribution asymétrique décrite par leshistogrammes. Les p-value (cf. Table 1.5) du test de normalité de Shapiro-Wilk, confirmentla distribution non gausienne de ces deux variables. Il en est de même pour la température,dont la p-value du même test vaut 0.00638, inférieure à 5%.

1.2.2 Analyse Descriptive Bivariée

Ce qui nous intéresse dans cette section, c’est la relation qui existerait entre deux ouplusieurs variables.

Analyse de corrélation entre les variables quantitatives

Il s’agit ici de quantifier et tester les liaisons entre nos variables quantitatives. Il ne s’agitpas de tester l’influence d’une variable sur une ou plusieurs autres. Pour quantifier la liaisonentre ces variables, on utilise le coefficient de corrélation (ρ) de Spearman, en construisantune matrice symétrique. On rappelle que, ce n’est pas parce que ρ est proche de 1 ou −1

qu’il y a une relation linéaire entre les deux variables en question. Non plus, ce n’est pasparce que ce coefficient de corrélation est proche de 0, qu’il n’existe pas de relations entre

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 32: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 9

Figure 1.3 – Histogramme et densité estimée des variables TempCl, Hydrométrie, Tkd95 etTkd50.

les variables. Il peut cependant exister une relation qui n’est pas linéaire.

Table 1.6 – Coefficients de corrélation de Spearman entre les variables quantitatives.TM24 TempCl Hydrométrie CouvMILDA N Tkd50 Tkd95

TM24 1 -0.46 0.256 0.007 -0.071 -0.758 -0.73TempCl 1 0.063 -0.12 -0.011 0.407 0.459

Hydrométrie 1 -0.228 -0.121 -0.213 -0.101CouvMILDA 1 -0.070 -0.163 -0.062

N 1 0.202 0.322Tkd50 1 0.86Tkd95 1

Il apparaît dans la Table 1.6, une liaison entre le TM24, le Tkd50 et le Tkd95. Les

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 33: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 10

valeurs négatives du ρ correspondant (-0.758, -0.73 respectivement) nous indiquent que cesdeux dernières variables (Tkd50 et Tkd95) évoluent chacune, comme c’était prévisible, ensens inverse avec le TM24 (cf. Figure 1.4). Ces liaisons sont significatives. En effet, les tests designificativité de ces relations nous donnent une p-value (risque de rejeter à tort l’hypothèsenulle de l’absence de la relation entre les deux variables ⇔ ρ = 0) égale à 1.104e-05 pour leTkd50 et égale à 2.367e-05 pour le Tkd95. Ces p-value sont toutes les deux inférieures auseuil (5%).

On observe aussi une liason du TM24 avec les variables TempCl et Hydrométrie. Cetteliaison est négative et signifiative (p-value=0.01882), positive, faible et non sigificative (p-value=0.2165) avec la variable TempCl et la variable Hydrométrie respectivement.

Lien entre la variable Desc (milieu urbain, semi-urbain ou rural) et les va-riables quantitatives

Nous effectuons un test de rang de Kruskal-Wallis pour déterminer si les différences demédianes observées à travers les différentes valeurs des variables quantitatives sont statisti-quement liées au type de la localité pour le seuil de 5%.

L’hypothèse nulle est l’indépendance entre la variable quantitative et celle catégorielle(égalité des médianes de la variable quantitative dans les différents groupes de la variablecatégorielle). L’hypothèse alternative est la dépendance entre la variable quantitative et cellecatégorielle. En d’autres termes, ce test nous permettra, par exemple, de répondre avec undégré de confiance de 95%, si l’exposition à la deltaméthrine est plus meutrière en zoneurbaine ou ailleurs. H désignant la statistique de test, on obtient le tableau suivant :

Table 1.7 – Test de Kruskal-Wallis sur la liaison entre la variable Desc et les variablesquantitatives.

TM24 CouvMILDA TempCl Hydrométrie N Tkd50 Tkd95Valeurs de H 6.005 1.549 3.753 2.976 1.883 7.821 8.529

p-value 0.0497 0.461 0.153 0.226 0.39 0.02 0.014

Nous pouvons déduire de la Table 1.7 que les variables TM24, Tkd50 et Tkd95 sontsignificativement dépendantes du type de la localité. En effet, les p-value respectives 0.0497,0.02 et 0.014 sont toutes inférieures au seuil (5%). Les dépendances peuvent être observéesà partir des boîtes à moustaches de la Figure 1.4, où l’on peut observer que le taux demortalité des moustiques reste plus élevé en zone rurale et semi-urbaine.

Ceci signifie que les populations de moustiques en zone urbaine sont bien plus résistantesà la deltaméthrine. Cela va en relation directe avec le Tkd95. En effet, le temps qu’il faut

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 34: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 11

pour qu’une proportion considérable et comparable de moustiques en milieu rural, semiurbain et urbain soit affectée va croissant selon qu’on quitte d’un milieu rural pour un milieusemi-urbain et d’un milieu semi-urbain pour un milieu urbain. Les moustiques tombent plusvite sous l’effet de la deltaméthrine en milieu rural (60 minutes au maximum) qu’en milieusemi urbain (160 minutes). En milieu urbain, le temps est encore plus élevé (jusqu’à 250minutes).

Figure 1.4 – Distribution de TM24, Tkd50 et Tkd95 par rapport à Desc.

1.2.3 Description spatiale du TM24

Il s’agira dans cette section d’étudier d’un point de vue spatial la variable d’intérêt quiici est le taux de mortalité des moustiques après 24 heures. Tout d’abord, nous présentonsles graphes de voisinage (Chessel et Dray, 2010) par niveau de résistance.

Il s’agit ici de présenter les deux plus proches voisins de chaque localité ainsi qu’une carac-térisation de la distance entre les localités du même type. La Table 1.8 donne la répartitiondes 25 localités par niveau de résistance selon les critères de l’OMS (2013b).

Dans les Figure 1.5, 1.6 et 1.7, les deux traits provenant de chaque localité relient celle-cià ses deux plus proches localités voisines. Les cercles sur la table de distances quantifient,par la proportion des cercles, la distance qui sépare deux à deux les localités. Plus le cercleest grand, plus les localités sont distantes.

La Figure 1.5 nous donne (à gauche) la disposition des localités où les moustiques sontrésistants. Nous pouvons donc observer que ces localités sont beaucoup plus regroupées.Ce qui nous renseigne sur leur proximité géographique, même si on se rend compte que leslocalités Guizigaré et Mbolom se démarquent du regroupement observé.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 35: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 12

Table 1.8 – Répartition des 25 localités par niveau de résistance selon les critère de l’OMS(2013b).

Localité Niveau de résistance Localité Niveau de résistanceGuizigaré Résistant Pene Résistant ProbableBoula-ibib Sensible Nassarao-Be Résistant ProbableLombou Résistant probable Be-centre Résistant ProbableMayo-lebri Sensible Boussa Résistant ProbableMbolom Résistant Boulgou SensiblePlateau Résistant Ouro Garga RésistantOuro-Hourso II Résistant Ouro-Hourso I RésistantKanadi I Résistant Kanadi II RésistantMbilga Résistant Probable Kollere RésistantOuro Lawan Résistant Lounderou Résistant ProbableDjamboutou I Résistant Djamboutou II RésistantMayo-Oulo Résistant Probable Dorbeye SensibleBala Sensible

Figure 1.5 – Schéma de disposition des localités où les moustiques sont résistants (gauche) ;table des distance entre ces localités (droite).

La Figure 1.6 nous présente le cas des localités où les moustiques sont sensibles. Onobserve deux regroupements (Boula Ibib-Mayo-Lebri et Bala-Dorbeye) et un cas isolé (Boul-gou).

La Figure 1.7, quant à elle, permet de voir que, parmi les localités avec résistance pro-bable, on a un regroupement de deux à trois. Une d’entre elles est considérablement éloignéedes autres (Mayo-Oulo).

Les 25 localités sont représentées dans l’espace à la Figure 1.8. Là , on peut bien observercette tendance au regroupement des localités en fonction de leur niveau de résistance.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 36: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 13

Figure 1.6 – Schéma de disposition des localités où les moustiques sont sensibles (gauche) ;table des distance entre ces localités (droite).

Figure 1.7 – Schéma de disposition des localités avec résistance probable (gauche) ; tabledes distance entre ces localités (droite).

1.3 Description de la distribution spatiale des niveaux derésistance

Les données auxquelles nous avons à faire rentrent dans un type particulier : elles sontdites géostatistiques. En effet, notre échantillon est constitué d’un ensemble dee points refé-rencés par leurs coordonnées (longitude, latitude), d’une surface continue, pour lesquels unattribut Z (taux de mortalité des A. gambiae s.l.) a été mesuré. Ce qui retient notre atten-tion ici, c’est l’organisation, la disposition, toute tendance au regroupement, la façon aveclaquelle les niveaux de résistance se disposent dans la zone d’étude. Pour commencer, nous

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 37: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 14

Figure 1.8 – Représentation en 3D du taux de mortatité dans les 25 localités selon leurniveau de résistance.

allons nous attarder sur la forme/structure, des différents niveaux de résistance en utilisantl’ellipse de déviation standard (§ 2.2.1).

1.3.1 Configuration globale de la résistance dans les trois districtsde santé

Le barycentre de la distribution des points de mesure du TM24 (étoile violette) de laFigure 1.9 se situe à proximité de Boulgou, dans la partie sud de la zone d’étude, à la limiteentre Garoua et Pitoa. On observe deuxièmement que l’ellipse violette décrivant l’orientationglobale des différents niveaux de résistance selon le positionnement des localités sur la zoned’étude est légèrement orientée dans la direction nord-est sud-ouest. Cette ellipse recouvre 19des 25 localités échantillonnées, soit 76%, contre 24% des localités se trouvant en périphérie.On peut donc considérer comme normale la distribution des points de mesure. On essayerade savoir s’il en est de même pour les différents niveaux de résistance mis en exergue à laFigure 1.10.

1.3.2 Cas des localités où les moustiques sont résistants

Le barycentre de celles-ci (étoile rouge) se situe dans un voisinage du centre de Garoua,près de Ouro-Lawan. Le positionnement de celles-ci, du fait de leur regroupement, a in-fluencé la position du dit barycentre. Ce décalage met également en exergue une tendance

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 38: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 15

à leur concentration dans Garoua urbain 2. L’ellipse de déviation standard rouge est par-ticulièrement étirée et orientée dans la direction nord-est sud-ouest. Ces localités tendentà diminuer selon que l’on se dirige dans cette direction, mais aussi en allant vers le nord dela zone d’étude. Cette ellipse recouvre 10/13 points d’observation, soit 76.92% de la distribu-tion. Cette répartition des points d’observation par rapport à l’ellipse de déviation standardmontre une distribution plus ou moins normale.

1.3.3 Cas des localités où les moustiques sont sensibles

Elles sont peu nombreuses et leur barycentre (étoile verte) se situe en dehors de la zoned’étude. On observe également une tendance à se disperser dans Pitoa et Mayo-Oulo. L’el-lipse de déviation est particulièrement orientée et étirée dans la direction nord-ouest sud-est(ce qui nous indique leur direction de propagation).

1.3.4 Cas des localités avec résistance probable

Le barycentre de leur distribution spatiale se situe dans le district de Pitoa, mais prèsde la frontière avec Garoua. Cette position ne met pas immédiatementmet en exergue unetendance à leur concentration. L’ellipse de déviation est particulièrement orientée dans ladirection est-ouest. Ceci nous indique la présence dans Garoua et Pitoa d’un bon nombre delocalités dont le statut reste encore à confirmer. Ces localités sont densément contenues dansl’ellipse de déviation standard, même si l’on observe une distribution plus ou moins aléatoirede ces dernières. Celles-ci diminuent aussi en densité selon qu’on se dirige vers Mayo-Oulo.

1.3.5 Étude de l’autocorrélation spatiale du TM24

D’après ce qui précède, chaque niveau de résistance présente un certain nombre de carac-téristiques : d’orientation, de dispersion par rapport à chaque barycentre, de regroupement.Leur distribution plus ou moins normale a particulièrement retenu notre attention. En effetl’existence d’une orientation mise en exergue par l’ellipse de déviation standard nous ren-seigne également sur l’existence d’une anisotropie (variance du niveau de résistance selonune direction particulière).

Cependant, le rôle de l’espace (en termes de voisinage et positionnement) dans l’ob-servation des valeurs du taux de mortalité en différents lieux et même sur l’existence desconfigurations particulières nécessite des éclaircissements.

Nous allons dans la suite nous pencher sur la question de l’autocorrélation spatiale globale(§ 2.2.2). Dans le cadre de ces travaux, nous avons retenu l’indice de Moran et le testd’indépendance spatial correspondant pour la caractériser. En rappel, le type de distance

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 39: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 16

utilisé dans le calcul de cet indice est la distance euclidienne. La matrice d’influence entreles points de mesure s’appuie sur la distance inverse.

Le calcul dans le logiciel R, à l’aide du package ape (Paradis et al., 2004), de l’indiced’autocorrélation de Moran pour les 25 localités et les taux de mortalité observés en ceslocalités donne les résultats suivants :

Valeur observée : −0.189 Valeur attendue : −0.042 Ecart-type : 0.0286

L’indépendance observée (valeur observée de l’indice proche de 0) peut être un fruit duhasard et ne peut correspondre qu’à l’échantillon qui a servi à son calcul (Y. SOME, 2000).Il est donc nécessaire de vérifier la validité de cette indépendance spatiale dans son entièreté(sur l’étendue de la zone d’étude). Il s’agit de tester l’hypothèse nulle de l’absence d’autocor-rélation globale, contre l’hypothèse alternative de l’existence d’une autocorrélation globale(Thomas-Agnan, 2012). La p-value ici est le risque de rejeter, en se trompant, l’hypothèsenulle au seuil de 5%.

Comme la p-value correspondante (2.243e − 07) est très inférieure au seuil (5%), on nepeut pas déduire l’absence totale d’autocorrélation spatiale sur l’ensemble de la zone d’étude.Cela signifie qu’en nous basant sur la distance entre localités, que le taux de mortalité enune localité n’est pas seulement influencé par celui observé en une autre localité voisine.

On observe cependant des agrégats spatiaux pouvant exprimer l’existence locale d’auto-corrélation spatiale à l’échelle des niveaux de résistance selon l’OMS (2013b). En effet, lesorientations mises en exergue par les ellipses de déviation de la Figure 1.10 décrivent biencette situation. Nous étudions dans la suite, l’autocorrélation spatiale entre les localités quipartagent un même niveau de résistance.

Table 1.9 – Valeurs de l’indice de Moran par niveau de résistance.Observé Attendu Ecart-type p-value

Résistant -0.026 -0.083 0.063 0.361Résistant probable -0.312 -0.167 0.132 0.270

Sensible -0.107 -0.25 0.073 0.049

Pour ce qui est des localités où les moustiques sont résistants à la deltaméthrine, decelles avec résistance probable, les p-value sont plus grandes que le seuil, pour des valeursde l’indice de Moran proches de 0. Cela nous permet de conclure qu’on peut déduire l’ab-sence totale d’autocorrélation spatiale des valeurs du TM24 dans chacun de ces groupes.Les regroupements observés dans chacun de ces deux groupes ne trouvent pas les raisonsexhaustives dans la proximité géographique et l’espace ne constitue donc pas le seul facteurexplicatif de la configuration observée. Quant aux localités où les moustiques sont sensibles,

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 40: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 17

malgré la tendance à la dispersion (indice de Moran négatif), les regroupements observéspeuvent trouver un pas d’explication dans le voisinage.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 41: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 18

Figure 1.9 – Distribution spatiale globale des niveaux de résistance observée.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 42: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

PRÉSENTATION ET ANALYSE DES DONNÉES 19

Figure 1.10 – Distribution spatiale du TM24 par niveau de résistance observée.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 43: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 20

Chapitre 2

MÉTHODOLOGIE

Les analyses effectuées dans ce document reposent sur des notions de mathématiqueset de géostatistique. Dans ce chapitre, nous allons donner quelques éléments théoriques enrelation avec ces dernières.

2.1 Tests statistiques

2.1.1 Test de normalité de Shapiro-Wilk

La description présente est inspirée de celle faite selon Rakotomalala (2011). Ce testpermet de vérifier l’adéquation ou bien d’étudier la compatibilité de la distribution empiriqued’une variable d’intérêt à une loi normale. Ce test ne permet pas de déterminer la loi dedistribution des données en question. Il est particulièrement puissant pour les petits effectifs(n ≤ 50). La statistique de test sécrit :

W =

[∑[n2

]

i=1 ai(x(n−i+1) − x(i))]2∑

i(xi − x)2, (2.1)

où :– n est la taille de l’échantillon ;– x(i) correspond à la i−ème observation d’une série des données triées :x(1) ≤ x(2) ≤...≤ x(n) ;

– [n2] est la partie entière du rapport n

2;

– les ai sont des constantes générées à partir de la moyenne et de la matrice de variancecovariance des quantiles d’un échantillon de taille n suivant la loi normale. En fait,ai = E(X(i)), où X(i) est la i−ème observation d’un échantillon ordonné de taille n,extrait d’une loi normale centrée réduite.

Ainsi, plus W est grand, plus la compatibilité avec la loi normale est crédible.La région critique, rejet de la normalité, s’écrit :

R = W < Wcrit.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 44: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 21

Les valeurs seuils Wcrit pour différentes tailles et différents niveaux de signification du testd’échantillon sont lues dans la table de Shapiro-Wilk.

2.1.2 Test de rang de Kruskal-Wallis

Nous nous sommes inspirés de Fesuh (2012).Disposant d’une variable qualitative Q à M modalités, modalités que nous considérons

ici comme des groupes et d’une variable quantitative continue Y prenant des valeurs danschacun de ces groupes, on voudrait tester l’indépendance entre la variable Y et la variable Q.En d’autres termes, il s’agit de savoir si une caractéristique de tendance centrale (médiane)de Y ne varie pas selon les différents groupes du critère qualitatif. Il est recommandé pour lescas où on ignore la distribution de la variable quantitative et lorsque la taille de l’échantillonest petite. Ce qui fait qu’il soit privilégié par rapport à l’ANOVA à un facteur, dont lesconditions d’utilisation vont de la normalité des variables, des variances égales, etc.

Le test s’effectue en comparant les médianes de Y dans les différents groupes de Q. Sielles sont toutes égales, alors les valeurs de la variable Q n’ont pas d’impact sur celles prisespar Y . Dans le cas contraire, le lien de dépendance peut être établi.

Si pour chaque modalité i de Q, il y a ni observations de Y pour un total de N observa-tions, la statistique de test est :

H =12

N(N + 1)

M∑i=1

Hi2

ni− 3(N + 1), (2.2)

où :– N : effectif total =

∑Mi=1 ni ;

– Hi : somme des carrés des valeurs de Y pour le groupe i.Sous l’hypothèse nulle (indépendance entre les deux variables), la statistique H suit unChi-deux à M − 1 degrés de liberté quand N → +∞.

La région critique est :R = [X 2

1−α(M − 1),+∞[,

où X 21−α(M − 1) est le 1 − α quantile de la distribution du Chi-deux à M − 1 degrés de

liberté.L’hypothèse d’indépendance est donc rejetée si la valeur calculéeH est supérieure à X 2

1−α(M−1). On conclut alors que les médianes de Y dans les différents groupes de Q ne sont pas lesmêmes, et donc les variables Q et Y ne sont pas indépendantes.

2.2 Outils d’aide à la description en analyse spatiale

Nous nous intérressons à deux outils de géostatistique dans cette section. Ceux-ci sontutilisés en analyse spatiale pour donner des informations de forme, de configuration d’objets

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 45: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 22

spatiaux répartis dans un espace ou domaine connu, généralement contenu dans R2 ou R3.

2.2.1 L’ellipse de déviation standard

Une manière courante de caractériser la tendance (Morency, 2006 ; Souris, 2012) pourun ensemble de points ou de surfaces consiste à calculer séparément la distance standard(écart moyen entre le point moyen du nuage et les autres points) dans les directions x ety, si on est dans le plan. Ces deux mesures définissent les axes d’une ellipse qui englobela distribution des entités. L’ellipse est nommée ellipse de l’écart-type, puisque la méthodecalcule l’écart-type des coordonnées x et y à partir du centre moyen pour définir les axes del’ellipse. L’ellipse permet de voir si la distribution des entités est allongée et présente doncune orientation particulière, permet de mesurer si un ensemble d’objets géographiques ontune tendance directionnelle dans l’espace. Ainsi, les ellipses ne représentent pas des agrégats,mais une tendance spatiale et une synthèse de la position.

Pour la représenter, on a besoin du centre moyen, de l’angle de déviation et des écarts-types dans les deux directions (x, y) qui sont orthogonales. Les deux axes sont donc permutésautour du centre moyen dans le sens horaire à partir de midi, de façon à minimiser la sommedes distances quadratiques entre les points et les axes. La longueur de chaque axe correspondà deux fois l’écart-type des données dans cet axe. Les entités présentent une répartitionspatialement normale lorsqu’ils ont une densité maximale vers le centre et deviennent demoins en moins denses vers la périphérie. Si on dispose de n observations, l’obtention del’ellipse passe par les étapes suivantes :

1. Calcul de l’angle de rotation (θ) :

A =

∑ni=1 [(xi − x)2 − (yi − y)2] +

√[∑n

i=1(xi − x)2 − (yi − y)2]2

+ 4 [∑n

i=1(xi − x)(yi − y)]2

2∑n

i=1(xi − x)(yi − y)

θ = Arctan(A).

2. Le calcul de la dispersion sous forme d’écart-type de x et de y, respectivement Sx etSy :

Sx =

√∑ni=1 [(xi − x)cosθ − (yi − y)sinθ]2

n− 2

Sy =

√∑ni=1 [(xi − x)sinθ − (yi − y)cosθ]2

n− 2

3. La réalisation du tracé, en se souvenant que la longueur de chaque axe de l’ellipsecorrespond à deux fois l’écart-type dans la direction correspondante. Le tracé et lescartes ont été faits avec le logiciel ArcGis 10.1.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 46: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 23

2.2.2 Indice de Moran et test d’indépendance spatiale

L’autocorrélation spatiale est un concept fondamental dans l’étude des données spatialeset fait l’objet d’une littérature abondante. L’autocorrélation spatiale est, en fait, la corré-lation d’une variable avec elle-même, en reliant différences de valeur et différences de lieu.Elle mesure essentiellement la ressemblance entre observations voisines d’un même attribut.Elle permet de vérifier la loi de proximité de Tobler d’après laquelle, toutes choses égales parailleurs, les points voisins ont une propension plus grande à avoir des valeurs plus prochesque les points éloignés. De multiples statistiques permettent de mesurer l’autocorrélationspatiale (Morency, 2006).

Au vu : de nos données (géostatistiques), de la nature de notre variable d’intérêt (quanti-tative continue), d’une interprétation simple et directe, nous avons retenu l’indice de Morandans le cadre de nos travaux.

Indice de Moran : I

Il est généralement défini comme le ratio de la covariance entre deux observations (pro-duit croisé des écarts à la moyenne), pondérée par une mesure d’éloignement (influence)entre ces observations, sur la variance totale de l’ensemble de données à l’étude (Thomas-Agnant, 2012). Mesurant une autocorrélation beaucoup plus globale, il est compris entre -1et 1, ses valeurs positives et fortes indiquent une autocorrélation spatiale positive (on parleaussi d’agrégation ou de coopération spatiale), ses valeurs négatives et fortes indiquent uneautocorrélation spatiale négative (répulsion ou compétition spatiale) et ses valeurs prochesde 0 indiquent une absence d’autocorrélation. On le calcule par :

I =n∑

i

∑jWij(Zi − Z)(Zj − Z)

(∑

i

∑jWij)

∑i(Zi − Z)2

,

où :– i 6= j ∈ 1, ..., n, l’ensemble des entités observées ;– n est le nombre d’entités observées ;– Z est la variable étudiée : Zi est sa valeur en l’entité i et Zj la valeur de la même

variable en l’entité j ;– I dépend du choix de la matrice W :Wij est le poids caractérisant l’influence de l’entité i sur celle j ; Wii = 0. Plusieurschoix de W s’offrent (Thomas-Agnan, 2012) : W peut être une matrice de contiguïtéde type "rook", où Wij = 1 si les sites i et j ont au moins une frontière commune ; uneautre façon consiste à considérer W comme une matrice des plus proches voisins, oùétant donnée une notion de distance et un entier k, pour chaque site si, on ordonne lesautres sites en fonction de leur distance à si et l’on détermine ainsi les k plus proches

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 47: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 24

voisins de si. La matrice contient alors sur la ligne i des 1 pour les positions des k plusproches voisins et des 0 sinon. Des matrices basées sur les distances, la triangularisationde Delaunay, peuvent aussi être choisies.Dans notre cas, W est la matrice des poids dont l’élément Wij correspond à l’inversede la distance euclidienne qui sépare i et j. Ainsi, plus i et j sont proches, plus Wij estgrand.

En général, il est difficile d’interpréter un indice de Moran de façon brute et universelle (i.e.calculé comme précédement). Voilà où intervient le

Test d’indépendance spatiale

Il s’agit ici (dans une vision de confirmation de l’information apportée par le calcul deI) de tester l’hypothèse d’absence d’autocorrélation spatiale pour une variable continue Z.D’après Thomas-Agnan (2012), il s’agit aussi de répondre à la question de savoir si lesdonnées à disposition nécessitent un traitement spécifique aux données spatiales. L’hypo-thèse nulle est (H0) : "absence globale d’autocorrélation spatiale" et l’alternative est (H1) :"présence d’autocorrélation spatiale".

Sous (H0), on suppose désormais que les Zi sont indépendants et identiquement distribuéssuivant une loi normale de paramètres tous non nuls, la statistique de test est l’indice deMoran I, associé à une matrice d’influence W . La loi asymptotique de l’indice centré réduitest utilisée pour le test. Pour centrer et réduire I, on utilise les relations suivantes (Gaetanet Guyon, 2008) :

E(I) = − 1

n− 1,

V ar(I) =n2S1 − nS2 + 3S2

0

(n2 − 1)S20

− 1

(n− 1)2,

où les quantités suivantes dépendent de la matrice W :S0 =

∑i 6=j wij, S1 = 1

2

∑i 6=j(wij + wji)

2, S2 =∑

i 6=j(wi+ + w+i)2,

avec wi+ =∑

j wij et w+i =∑

j wji.On utilise alors la loi asymptotique N (0, 1) de l’indice centré réduit pour calculer une p-valeur associée (p) définie par :

p = Pr(|X| > Io),

où :– X suit la loi N (0, 1) ;– Io est l’indice de Moran normalisé calculé sous l’hypothèse nulle valant en faitE(I)/

√V ar(I).

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 48: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 25

On conserve (H1) : "présence d’autocorrélation spatiale" si cette p-valeur est plus petiteque le seuil fixé à l’avance (en général ce seuil vaut 5%) sinon, on ne rejette pas (H0) :"absence globale d’autocorrélation spatiale".

2.3 Interpolation spatiale

La statistique spatiale étudie des phénomènes observés sur un ensemble dit spatial S.Les domaines d’application sont nombreux, dont l’épidémiologie. En Géostatistique, il esten partie question d’étudier, par des outils mathématiques, un phénomène naturel observéen permanence sur un territoire (Goria et al., 2011). Ce phénomène naturel examiné estreprésenté par une certaine mesure localisée. Par exemple, pour étudier un gisement d’or,on peut utiliser la mesure de la densité du minerai dans le sol. Une telle mesure est nomméevariable régionalisée et elle est vue comme un processus aléatoire réel Z = Zs, s ∈ Sindexé par un ensemble spatial S contenu dans Rd. Dans le plan, s = (x, y) représente unpoint du champ S identifié par ses coordonnées géographiques (Bosser, 2012).

Dans un contexte de données géostatistiques, Z est observé en n sites fixés s1, s2, ..., sn ⊂S. Ce type d’échantillonnage contribue à répondre au problème de l’observation non com-plète de la variable régionalisée. Ceci par l’étude des questions de modélisation des variationsspatiales, par la prédiction (en des sites non-observés) et donc à la reconstruction de Z par-tout sur S (Morency, 2006). Ces étapes consistent en l’utilisation des méthodes propresà l’interpolation spatiale, notamment celles liées au variogramme. Elles sont réparties endeux : les méthodes déterministes (s’appuient uniquement sur cette variable et ne font usaged’aucune notion probabiliste dans la définition de la variable régionalisée) et les méthodesstochastiques (la variable régionalisée est vue comme une réalisation d’une fonction aléa-toire Z(s), s ∈ S, où toute valeur régionalisée z(si) est considérée comme une réalisationd’une variable aléatoire Z(si)). En général, pour chaque site s dans S, la variable Z(s) estdécomposée ainsi qu’il suit (Bosser, 2012) :

Z(s) = µ(s) + π(s), (2.3)

où :– µ(.) est la structure déterministe ou variation à grande échelle pour la valeur moyenne

de Z(.) ;– π(s) est un champ de résidus centrés (espérance nulle) possédant ou non une struc-

ture de dépendance spatiale, dont la covariance est appelée fonction de covariance duprocessus spatial Z(s).

Nous présentons ci-dessous quelques bases théoriques sur les modèles spatiaux (Gaetan etGuyon, 2008), s’appuyant sur cette décomposition.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 49: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 26

2.3.1 Éléments sur les processus stochastiques

Pour commencer, nous donnons quelques définitions sur les processus stochastiques. Soit(Ω,F ,P) un espace de probabilité, S un ensemble de sites et (E, E) un espace d’état mesu-rable.

Définition 2.3.1 (Processus stochastique)Un processus stochastique à valeurs dans E est une famille δ = δs, s ∈ S de variablesaléatoires réelles définies sur (Ω,F ,P) et à valeurs dans (E, E) ; (E, E) s’appelle l’espaced’état du processus et S l’ensemble (spatial) des sites sur lequel est défini le processus.

Définition 2.3.2 (Processus du second ordre)δ est un processus (un champ) du second ordre si, pour tout s ∈ S, E(δs

2) <∞. La moyennede δ qui existe alors est la fonction m : S → R définie par m(s) = E(δs). La covariance deδ est la fonction c : S × S → R définie pour tous s, t, par c(s, t) = Cov(δs, δt).

δ est centré si m(s) = 0 en tout s. La propriété caractéristique d’une covariance est d’êtresemi-définie positive (s.d.p.) :

∀m ≥ 1, a ∈ Rm et s1, ..., sm ⊆ S :∑

i,j=1,...,m

aiajc(si, sj) ≥ 0.

Cette propriété résulte de la positivité de la variance de toute combinaison linéaire :

V ar

(m∑i=1

aiπsi

)=

m∑i=1

m∑j=1

aiajc(si, sj) ≥ 0.

Dans la suite, on supposera que δ est un champ du second ordre de moyenne m et decovariance c sur S = Rd.

Définition 2.3.3 (Processus stationnaire)δ est un processus stationnaire au second ordre sur S si sa moyenne est constante et si sacovariance est invariante par translation, i.e. ∀s, t ∈ S :

E(δs) = m,

etc(s, t) = Cov(δs, δt) = C(t− s).

C : S → R, est la fonction de covariance stationnaire de δ. Cette fonction de covariance estappelée «covariogramme». Noter que :

∀s ∈ S, V ar(δs) = Cov(δs, δs) = C(0) = cte.

L’invariance par translation de c se traduit par :

∀s, t, h ∈ S : c(s+ h, t+ h) = Cov(δs+h, δt+h) = C(s− t).

La fonction de corrélation de δ est la fonction h 7−→ ρ(h) = C(h)/C(0).

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 50: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 27

Définition 2.3.4 (Covariance isotropique)La covariance de δ est isotropique si pour tous s, t dans S, Cov(δs, δt) ne dépend que de‖s− t‖ , i.e. la distance entre s et t :

∃Co : R+ → R : ∀s, t ∈ S, c(s, t) = Co(‖s− t‖) = C(s− t).

‖.‖ est la norme euclidienne.L’hypothèse de stationnarité n’est généralement pas vérifiée en pratique. Une façon de

l’affaiblir est de considérer le processus des accroissements qui fait l’objet de la définitionsuivante.

Définition 2.3.5 (Processus intrinsèque, semi-variogramme)δ est un processus intrinsèquement stationnaire, ou encore δ est un processus intrinsèque sipour tout h dans S, le processus ∆δ(h) = ∆δ(h)

s = δs+h − δs : s ∈ S est stationnaire ausecond ordre. Le semi-variogramme de δ est alors la fonction γ : S → R, définie par :

2γ(h) = V ar(δs+h − δs).

La fonction h 7−→ 2γ(h) est le variogramme.

Il découle des définitions précédentes que tout processus stationnaire de covariance C estun processus intrinsèque de variogramme 2γ(h) = 2(C(0) − C(h)). Mais la réciproque estfausse.

Proposition 2.3.1 Quelques propriétés du semi-variogramme

1. γ(h) = γ(−h), γ(h) ≥ 0, γ(0) = 0.

2. Il est conditionnellement défini négatif : ∀a ∈ Rn/∑n

i=1 ai = 0, ∀s1, ..., sn ⊆ S, ona : ∑

i,j=1,...,n

aiajγ(si − sj) ≤ 0.

3. Si A est une transformation linéaire sur Rd, h 7−→ γ(Ah) est un variogramme si γ estun variogramme.

2.3.2 Analyse variographique

Le modèle sur lequel se base le krigeage suppose la connaissance de la structure de dépen-dance spatiale de la fonction aléatoire Z(.) dans (2.3). Or, en pratique, celle-ci n’est presquejamais connue. L’analyse variographique est une étape préalable au krigeage qui permetde l’estimer. Cette analyse est l’étude du comportement spatial de la variable régionalisée,par l’analyse de quelques caractéristiques du variogramme (selon Bosser, 2012) : l’isotropie,

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 51: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 28

Figure 2.1 – Caractéristiques d’un semi-variogramme.

l’effet de pépite, la portée et le palier. La Figure 2.1 nous donne une visualisation de cescaractéristiques.

Un semi-variogramme est dit isotrope s’il ne dépend que de la norme de h. On parled’anisotropie lorsqu’il dépend aussi de la direction de h, h ici désignant le vecteur detranslation entre les points s et s + h. Il s’agira, dans ce mémoire, de semi-variogrammesisotropes et on note :

γ(r) =1

2V ar(π(s)− π(s+ h))

pour tout h de norme r et s, s+ h dans S.

L’effet de pépite fait référence à la continuité du semi-variogramme à l’origine.Si limr→0+γ(r) = a0, alors a0 est appelé effet de pépite, mesurant la ressemblance entrevaleurs prises par la variable régionalisée en des localités très voisines (‖h‖ → 0+).

La portée et le palier font référence au comportement du semi-variogramme lorsque raugmente. Atteindre un plateau indique qu’à partir d’une certaine distance, il n’y a plus dedépendance spatiale entre les données. Cette distance est nommée portée et le terme palierdénote la variance à laquelle le plateau se présente. Il peut y avoir des cas de portée infinielorsque le palier est atteint asymptotiquement (Baillargeon, 2005).

Remarque 2.3.1 Pour un semi-variogramme non borné, il n’y a ni portée, ni palier. Lavariance de la fonction aléatoire n’est pas définie pour un tel semi-variogramme. Cette fonc-

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 52: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 29

tion aléatoire n’est donc pas stationnaire de deuxième ordre, mais seulement stationnaireintrinsèque.

Estimation du semi-variogramme

Soit π, un champ réel intrinsèque sur S ⊆ Rd, de moyenne constante E(πs) = µ (engénéral µ = 0) et de variogramme 2γ(h) = E(πs+h − πs)2 pour tout s dans S. On supposedisposer des observations de la variable régionalisée Z en n sites si, et on cherche à estimerle semi-variogramme à partir de ces données. Se souvenant de l’équation (2.3), notons lesrelations suivantes (Baillargeon, 2005) :

γ(r) =1

2V ar [π(s)− π(s+ h)]

=1

2V ar [(Z(s)− µ(s))− (Z(s+ h)− µ(s+ h))]

=1

2V ar [(Z(s)− Z(s+ h)]

=1

2E[Z(s)− Z(s+ h)2

]− 1

2µ(s)− µ(s+ h)2

Ainsi, si µ(.) est une fonction constante, le deuxième terme (µ(s)− µ(s+ h)) s’annuleet le semi-variogramme est estimable directement à partir des zsi observés. C’est le cas enkrigeage simple et ordinaire. Par contre, lorsque µ n’est pas une fonction constante comme enkrigeage universel, le semi-variogramme peut alors être estimé à partir des valeurs zsi− µ(si),où µ est la tendance estimée, puis le semi-variogramme expérimental est calculé à partir desrésidus e(si) = zsi − µ(si). Gaetan et Guyon (2008) proposent comme estimateur empiriquenon paramétrique du semi-variogramme, dit estimateur des moments :

2γn(‖h‖) =1

|N(‖h‖)|∑

(si,sj)∈N(‖h‖)

(Zsi − Zsj)2 ou

2γn(‖h‖) =1

|N(‖h‖)|∑

(si,sj)∈N(‖h‖)

(e(si)− e(sj))2, h ∈ Rd,

où on désigne par |N(‖h‖)|, le nombre de couples (si, sj) distincts de

N(‖h‖) = (si, sj) ∈ S × S tel que ‖h‖ −∆ ≤ ‖si − sj‖ ≤ ‖h‖+ ∆; i, j = 1, ..., n,

où N(‖h‖) ainsi définie est une classe à tolérance ∆ de h ∈ Rd. D’après ces mêmes auteurs,dans la pratique, on choisit d’estimer le variogramme 2γ(.) en un nombre fini k d’espacements,H = h1, h2, ..., hk de telle sorte que chaque classe comporte au moins 30 couples de pointset le choix de la famille d’espacements H doit "bien" couvrir le domaine de γ(.) en repondantà cette contrainte d’effectifs.

D’après ce qui précède, le constat fait est que le semi-variogramme estimé dépend d’unnombre fini de points, donc de distances. Dans ces conditions, il n’est généralement pas

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 53: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 30

conditionnellement défini négatif, ni robuste. Ainsi, d’après le procédé décrit par Thomas-Agnant (2012), il est nécessaire d’avoir un estimateur conditionnellement défini négatif dusemi-variogramme pour que les variances de prédiction estimées soient positives. Pour cela,on ajuste au variogramme empirique un modèle théorique.

Après avoir choisi une famille paramétrique de variogrammes valides γ(.; θ), où θ ∈ Θ

est un vecteur de paramètres. On ajuste les valeurs du variogramme empirique γ(hk) à cettefamille par moindres carrés ordinaires :

minθ∈Θ

∑k

(γ(hk)− γ(hk; θ))2.

En pratique, le choix de la famille se fait souvent en examinant visuellement la forme de lacourbe empirique, et les paramètres peuvent aussi être ajustés graphiquement, en allant desvaleurs plus gandes aux valeurs plus petites et plus adéquates.

Quelques modèles variographiques isotropes classiques qu’on peut utiliser :

1. modèle pépitique, de palier co : γ(r) =

0 pour r = 0,

c0 pour r > 0;

2. modèle linéaire avec palier, d’effet de pépite c0, de palier c0 + c et de portée a :

γ(r) =

c0 + c

ar pour 0 ≤ r ≤ a,

c0 + c pour r > a;

3. modèle exponentiel, d’effet de pépite c0, de palier c0 + c et de portée pratique 3a :

γ(r) = c0 + c[1− exp(−r

a)]

pour r ≥ 0;

.

4. modèle puissance, d’effet de pépite c0, d’exposant e et de facteur d’échelle m :

γ(r) = c0 +mre pour r ≥ 0 pour 0 < e < 2;

.

5. modèle sphérique, d’effet de pépite c0, de palier c0 + c et de portée a :

γ(r) =

c0 + c

(3r2a− r3

2a3

)pour 0 ≤ r ≤ a,

c0 + c pour r > a;

6. modèle gaussien, d’effet de pépite c0, de palier c0 + c et de portée pratique a√

3 :

γ(r) = c0 + c

[1− exp(−r

2

a2)

]pour r ≥ 0;

.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 54: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 31

7. modèle à effet trou : de palier C. Parabolique à l’origine, il permet de modéliserun variogamme moins stable, présentant des fluctuations au niveau du palier quand ladistance augmente.

γ(r) = C

[1− sin(r/a)

r/a

].

Figure 2.2 – Quelques modèles de semi-variogramme.

En somme, le semi-variogramme est un outil qui permet de caractériser la dépendancespatiale. Comment l’estimer et comment le modéliser ont été l’objet de cette partie.

2.4 L’interpolation optimale : krigeage

2.4.1 Introduction et Généralités

La méthode d’interpolation par krigeage fait partie des méthodes stochastiques, utiliséeen géostatistique pour la prévision. Ici on utilise à la fois les valeurs observées et l’informationde position, pour l’estimation (dans un contexte spatial) de la variable étudiée.

Les méthodes stochastiques sont privilégiées par rapport à celles de la statistique clas-sique qui généralement exigent l’indépendance des observations et leur distribution iden-tique. Ce qui n’est généralement pas le cas en statistique spatiale où la variable étudiée(régionalisée) prend des valeurs inconstantes, ne suivant pas de modèle et qui, en mêmetemps, décrivent une certaine structure de dépendance. C’est aussi le cas lorsqu’on faitusage des méthodes déterministes d’interpolation. Le krigeage, quant à lui, possède, en plusdes contraintes d’optimalité (que nous définissons plus bas), des propriétés qui en font unoutil privilégié en interpolation spatiale :

– il tient compte de la continuité spatiale du phénomène étudié, ainsi que des anisotropies(Tolle, 2010) ;

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 55: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 32

– la structure de dépendance spatiale des données est prise en compte dans la prédiction.

Notons que z(s) représente la valeur prise par la variable régionalisée z au site s. Onl’interprète comme une réalisation d’une variable aléatoire Z(s) définie en s. La fonctionaléatoire représente l’ensemble des variables aléatoires qui interprètent la variable régionali-sée. La structure de corrélation qui existe dans les observations permet de décrire la structurespatiale de la variable régionalisée (Bosser, 2012).

Le krigeage a donc pour objectif principal d’évaluer la valeur de Z en un site non échan-tillonné so à partir des observations faites sur les autres sites. Pour optimiser la prédiction(estimateur sans biais de variance minimale), le krigeage doit répondre à des contraintes(Baillargeon, 2005). Si on note V , l’ensemble des n sites (d’observation) voisins de so, Vcontenu dans S = s1, ..., sN, alors on définit les contraintes :

1. Contrainte de linéaritéToute prévision doit avoir la forme Z(so) = a+

∑i∈V λiZ(si).

2. Contrainte d’autorisationS’assurer que l’erreur de prévision Z(so)−Z(so) ait une espérance et une variance quiexistent.

3. Contrainte de non-biaisOn doit s’assurer que E[Z(so)− Z(so)] = 0.

4. Contrainte d’optimalitéLes poids λi et la constante a doivent être trouvés de façon à minimiserV ar[Z(so)−Z(so)] sous les contraintes précédentes. Le but ici n’est pas de les estimer,mais de les exprimer de façon à satisfaire les contraintes.

Vérifier ces contraintes implique la résolution d’un certain nombre d’équations. Nous n’endonnerons pas la démonstration complète (Chauvet, 2006 ; Baillargeon, 2005), mais quelqueslignes, avec les notations suivantes :

– pour i = 1, ..., n, Zsi est la variable aléatoire qui à si associe la valeur de la variablerégionalisée en si ;

– Z, le vecteur de taille n× 1 constitué de Zs1 , ..., Zsn observées ;– λ, le vecteur des poids λi de taille n× 1 associé à Z ;– δ, le vecteur des erreurs de prédiction de taille n × 1 associé à Z et tel que δ(i) =

(Z(si)− Zsi) ;– en cas de stationnarité du second ordre : Σ est la matrice n×n de variances-covariances

de δ, dont la diagonale contient seulement σ2, qui est la variance commune à δ(s) pours dans S. On notera co, le vecteur n× 1 des covariances entre δ et δ(so) ;

– en cas de stationairité intrinsèque : Γ est la matrice n× n telle que Γ(i, j)=γ(si − sj)i.e. le semi-variogramme entre les éléments i et j de δ. On notera γo, le vecteur n× 1

ayant, à la position i, γ(si − so) ;

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 56: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 33

– Z(so), l’estimateur dont l’estimation (valeur numérique) est z(so) obtenue en rempla-çant Z(si) par sa valeur z(si).

2.4.2 Krigeage simple

C’est la forme originale de cette théorie. Ici, le modèle de prévision est pour tout s ∈ S :

Z(s) = m+ δ(s), (2.4)

où m est une constante connue et δ est une fonction aléatoire stationnaire de second ordre,d’espérance nulle et de structure de dépendance connue.

1. La contrainte de linéarité : La prédiction de Z(so) doit s’exprimer sous la formeZ(so) = a+ λtZ.

2. La contrainte d’autorisation est acquise car l’hypothèse de stationnarité de secondordre de la fonction δ(.) implique l’existence de l’espérance et de la variance de toutevariable aléatoire Z(s) pour s ∈ S.

3. La contrainte de non-biais implique que E[Z(so) − Z(so)] = a + λtm1n −m = 0.Donc a = m(1− λt1n), où 1n est le vecteur colonne unité de taille n.

4. La contrainte d’optimalité voudrait qu’on trouve les poids λi et la constante a defaçon à minimiser V ar[Z(so)−Z(so)] sous les contraintes précédentes. On arrive doncà : V ar[Z(so)− Z(so)] = λtΣλ+ σ2 − 2λtco.Cette dernière expression peut être vue comme une fonction f(λ), dont le vecteur desdérivées partielles est D = 2Σλ − 2co et dont la matrice hessienne est 2Σ qui estsemi-définie positive comme matrice de variances-covariances multipliée par 2 > 0 ; fest donc convexe et le point critique λ = Σ−1co est un minimum global. La prévisionen so est donc :

Z(so) = m+ ctoΣ−1(Z−m1n). (2.5)

2.4.3 Krigeage ordinaire

Elle généralise l’hypothèse sur l’espérance de la fonction aléatoire du krigeage simple ence sens où celle-ci est toujours constante, mais inconnue sur V . L’hypothèse de stationnaritéintrinsèque de la fonction aléatoire δ est désormais admise dans ces conditions. Ici, le modèlede prévision est, pour tout s ∈ S :

Z(s) = µ+ δ(s). (2.6)

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 57: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 34

Le caractère quasi-constant de µ signifie que l’espérance de la fonction aléatoire n’est pascontrainte à demeurer la même partout dans le champ S. Elle doit, par contre, resterconstante à l’intérieur du voisinage de krigeage. δ est une fonction aléatoire stationnaireintrinsèque d’espérance nulle et de structure de dépendance connue.

1. La contrainte de linéarité : La prédiction de Z(so) s’exprime comme en krigeagesimple, i.e. sous la forme Z(so) = a+ λtZ.

2. La contrainte d’autorisation

L’hypothèse de stationnarité intrinsèque de la fonction δ(.) implique l’existence desmoments de premier et de second ordre. Il faudrait donc que l’erreur de prévisionprenne la forme d’une somme pondérée d’accroissements (afin de garantir l’existencede la variance) qu’on peut écrire ainsi qu’il suit pour si, si + hi dans S, i = 1, ..., l,pour wi, i = 1, ..., n, une famille réelle de pondérateurs :

∑li=1wi(δ(si)− δ(si + hi)).

Cette combinaison linéaire d’accroissements correspond à une combinaison linéairede variables aléatoires avec des poids de somme nulle. Ainsi, l’erreur Z(so)− Z(so) =

A+∑

i∈V λiδ(si)−δ(so), où A est un terme non aléatoire et vaut A = a+µ∑

i∈V λi−µ.Cette erreur est une combinaison linéaire d’accroissements de δ(.) si et seulement si∑

i∈V

λi − 1 = 0.

Cette contrainte servira pour la suite. D’où

Z(so)− Z(so) = a+∑i∈V

λiδ(si)− δ(so).

3. La contrainte de non-biais : Comme en krigeage simple, il faudrait queE[Z(so)− Z(so)] = a+ µ(

∑i∈V λi − 1) = 0. Ce qui impose que a = 0.

4. La contrainte d’optimalité voudrait qu’on trouve les poids λi de façon à minimiserV ar[Z(so)− Z(so)] sous les contraintes précédentes. On démontre que :

V ar[Z(so)− Z(so)] = −λtΓλ+ 2λtγo.

Cette expression doit être minimisée sous la contrainte λt1n = 1. En utilisant la mé-thode de Lagrange, il faut minimiser la fonction f(λ, l) = −λtΓλ+2λtγo+2l(λt1n−1).Le vecteur des dérivées partielles par rapport aux λi est

∂λf(λ, l) = −2Γλ+ 2γo + 2l1n.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 58: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 35

Le point critique est λ = Γ−1(γo + l1n).

Le multiplicateur de Lagrange sous la contrainte vaut l = 1−1ntΓ−1γo

1ntΓ−11n

.

On remplace l par l dans λ et on obtient : λ = Γ−1(γo + 1−1ntΓ−1γo

1ntΓ−11n

1n).

La prévision en so est donc :

Z(so) = (γo +1− 1n

tΓ−1γo1n

tΓ−11n

1n)tΓ−1Z. (2.7)

2.4.4 Krigeage universel

Ce type de krigeage vient lever les limites sur les hypothèses des deux derniers. Eneffet, ces hypothèses sur l’espérance de la fonction aléatoire ne sont souvent pas vérifiées enpratique, ou peuvent être mises en doute. En krigeage universel, l’espérance de la fonctionaléatoire est fonction de la position des sites. Ici, le modèle de prévision est pour tout s ∈ S :

Z(s) =

p∑j=0

fj(s)βj + δ(s) (2.8)

avec fj(s), fonctions de la position s, et qui, suivant les graphiques de z(si) en fonction descoordonnées, peuvent être choisies suivant une tendance linéaire ou quadratique ; δ est unefonction aléatoire stationnaire intrinsèque d’espérance nulle et de structure de dépendanceconnue. Par exemple, f0(s) = 1, f1(s) = x et f2(s) = y pour une tendance linéaire.

1. La contrainte de linéarité : La prédiction de Z(so) s’exprime une fois de plus sousla forme Z(so) = a+ λtZ.

2. La contrainte d’autorisation est encore la même qu’en krigeage ordinaire, on doitavoir

∑i∈V λi − 1 = 0 pour assurer l’existence de l’espérance et de la variance de

Z(so)− Z(so).

3. La contrainte de non-biais

Il faudrait que E[Z(so)− Z(so)] = a+∑p

j=0(∑

i∈V λifj(si)− fj(so))βj = 0.Pour que cela soit possible pour tout βj, j = 1, ..., p,il faudrait que a = 0 et que

∑i∈V λifj(si)− fj(so) = 0 pour j = 0, ..., p.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 59: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 36

4. La contrainte d’optimalité

Comme en krigeage ordinaire, V ar[Z(so)−Z(so)] = −λtΓλ+2λtγo. Il faut la minimisersous les contraintes précédentes résumées : λtX = xo

t.Ici, xo = (fo(so), f1(so), ..., fp(so)) et X la matrice n× (p+ 1) dont l’élément (i, j) estfj(si).On minimise la fonction f(λ, l) = −λtΓλ+ 2λtγo + 2(λtX− xo

t)l avec un vecteur l de(p+ 1) Lagrangiens. Le vecteur l est estimé par

l = (XtΓ−1X)−1(xo −XtΓ−1γo).

L’unique point minimum de la fonction f(λ, l) est atteint pour :

λ = λ = Γ−1(γo + X(XtΓ−1X)−1(xo −XtΓ−1γo)).

La prévision en so est donc :

Z(so) = (γo + X(XtΓ−1X)−1(xo −XtΓ−1γo))tΓ−1Z. (2.9)

2.4.5 Mise en oeuvre du krigeage

Elle repose sur une méthodologie propre à la géostatistique. Tout commence par uneanalyse exploratoire descriptive des données qui pourrait aboutir au choix du modèle. Cechoix impose donc une forme déterministe de l’espérance de Z(.). Il s’en suit l’analyse vario-graphique où on fait le choix de la structure de dépendance spatiale et peut donc effectuerle krigeage. Le problème qui se pose en pratique, c’est la modélisation de l’espérance denotre fonction. Comment savoir si elle est stationnaire, stationnaire du second ordre ou bienstationnaire intrinsèque ?

La représentation 3D des données, les fenêtres mobiles, les comportements directionnels,l’étude graphique basée sur la présence des valeurs fortes/faibles proches les unes des autres,pourraient nous aider à postuler sur l’une de ces propriétés. Le problème avec ces mé-thodes, c’est déjà l’oeil de l’utilisateur qui est subjectif, mais aussi la taille de l’échantillongénéralement pas suffisante.

Dans cette confusion, plusieurs méthodes peuvent êtres envisagées, et en pratique, lameilleure est sélectionnée par validation croisée par "leave-one-out". Elle sert aussi à choisirle type de variogramme à employer pour le krigeage.

Ayant à disposition un prédicteur, elle consiste à prédire la valeur de Z(si) en utilisantl’échantillon exempté des informations sur si. Le processus est repété sur chaque unité del’échantillon. Si on note Z−i(si), la valeur prédite pour si, des erreurs sont ensuite calculées :e−i(si) = Z−i(si)−Z(si). Des indices (Baillargeon, 2005) tels l’erreur quadratique moyenne :

EQM =1

n

n∑i=1

[e−i(si)]2 ,

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 60: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

MÉTHODOLOGIE 37

l’erreur absolue :

EAbs =1

n

n∑i=1

|e−i(si)|,

quantifient l’erreur par "leave-one-out", commise en utilisant ce prédicteur. Ainsi, dans unesituation où plusieurs prédicteurs sont commparés, celui qui minimise cette erreur est choisi.

2.4.6 Conclusion du chapitre

Nous avons abordé plusieurs notions dans ce chapitre. Tout d’abord, le test de normalitéde Shapiro-Wilk. Ce test permet de vérifier l’adéquation de la distribution empirique desdonnées à la loi normale. Ceci nous guide dans le choix de l’outil (coefficient de Spearman)permettant d’analyser les liaisons éventuelles entre les différentes variables quantitatives(hypothèse de normalité généralement requise). Deuxièmement, le test de rang de Kruskall-Wallis nous permet ensuite de vérifier s’il y a variation des valeurs quantitatives selon descritères qualitatifs. Nous avons aussi parlé de l’ellipse de déviation, comme outil de caracté-risation de formes et d’organisation spatiale. L’indice de Moran, quant à lui, nous permetde caractériser l’autocorrélation spatiale du phénomène étudié. Nous avons terminé par l’in-terpolation spatiale, l’analyse variographique comme étape préalable au krigeage, que nousavons présenté comme outil de prédiction.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 61: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INTERPOLATION SPATIALE DANS LES TROIS DISTRICTS 38

Chapitre 3

INTERPOLATION SPATIALE DANSLES TROIS DISTRICTS

Il est question pour nous dans ce chapitre d’appliquer la démarche géostatistique sur nosdonnées, en s’intérressant à la variable d’intérêt, i.e. le taux de mortalité des moustiquestestés à la deltaméthrine (TM24). Il s’agira essentiellement d’estimer sa valeur par krigeagesimple, ordinaire et universel (précédement définis) dans les localités où elle n’a pas étéestimée. L’objectif final est de dresser une carte prévisionnelle de la répartition spatiale dela résistance des A. gambiae s.l. à la deltaméthrine dans la zone d’étude pour le compte del’année 2012, et ce par la méthode d’interpolation qui sied le mieux à notre contexte.

Tout d’abord, nous allons revenir aux représentations de la Figure 1.8 et de la Figure 1.9.On a pu constater une certaine concentration des localités avec résistance et des localitésavec sensibilité vers le sud de la zone d’étude. De plus, les variations des valeurs du taux demortalité des moustiques d’une localité à une autre, dans le sud, ne sont pas très grandes. Enoutre, les valeurs prises par le taux de mortalité des moustiques ont tendance à augmenteren se déplaçant vers le nord de la zone d’étude (comportement en latitude, Figure 3.1). Nousadmettons dans la suite le caractère fini de la variance de notre variable régionalisée.

Figure 3.1 – Comportement du TM24.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 62: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INTERPOLATION SPATIALE DANS LES TROIS DISTRICTS 39

La Figure 3.1 présente les graphiques du comportement directionnel du TM24, sur les-quels des droites de régression sont tracées. Il en ressort qu’on peut significativement expli-quer le TM24 en fonction de la longitude (TM24 = 66.7 ∗ longitude − 820.96, paramètrestous significatifs au seuil de 5%). Ceci nous rassure sur le fait que le TM24 est spatialementdépendant, en ce sens qu’il dépend du lieu de mesure (il est propre à chaque localité) et peutdonc bien être obtenu et estimé en tout point dont on connaît les coordonnées. Ceci nousrassure aussi sur la particularité de chaque localité en ce qui concerne la valeur du TM24qui y est mesuré.

3.1 Analyse variographique

Pour la formulation des modèles, rappelons que les trois types de krigeage effectués icitiennent compte, en chaque site où on n’a pas le TM24, de toutes les observations (du TM24)faites pendant l’étude, en raison de leur faible nombre. En ce qui concerne les krigeagessimple et ordinaire, les tendances restent une constante (moyenne empirique du TM24) etune constante inconnue µ, respectivement. Pour ce qui est du krigeage universel, la tendancechoisie est : µ(s) = µ(x, y) = β0 + β1x+ β2y.

La prochaine étape consiste à l’analyse variographique. Nous présentons à la Figure 3.2,le nuage de points du semi-variogramme empirique des moments du paragraphe 2.3.2, quicorrespond aussi au semi-variogramme pour krigeages simple et ordinaire (gauche) et celuiuniversel (droite). En abscisse, les distances (divisées par 100) sont exprimées en kilomètre(km) .

On observe à partir de la Figure 3.2, les nuages de deux semi-variogrammes bornés dontle palier et la portée existent pour chacun d’eux. On peut remarquer que les courbes évoluentpositivement de 0 à 11.31 km et décroissent jusqu’à 25 km environ, puis recommencent àcroître jusqu’à 29.48 km.

On atteint un palier pour une portée correspondante, portée indiquant la distance à par-tir de laquelle les observations deviennent véritablement indépendantes. Ceci suppose doncl’existence d’une coopération locale (au vu du saut à l’origine, donc de l’effet de pépiteindiquant l’existence d’une faible ressemblance entre les valeurs du TM24 entre localités dis-tantes d’environ 1 km), constituant ainsi un autre pas dans l’explication des regroupementsobservés dans le grand sud de la zone d’étude, entre localités avec résistance, localités avecrésistance probable.

Pour ce qui est des krigeages simple et ordinaire, nous avons choisi un modèle à effettrou (vu le graphe non régulier du semi-variogramme) et modèle exponentiel. Un premierajustement graphique nous a permis d’avoir le palier C = 0.033 et la portée a = 0.034 pour

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 63: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INTERPOLATION SPATIALE DANS LES TROIS DISTRICTS 40

Figure 3.2 – Semi-variogrammes empiriques pour krigeages simple, ordinaire et universel.

ce qui est du modèle à effet trou. Nous obtenons de la même faà§on le palier C = 437

et la portée a = 0.06 pour le modèle exponentiel. La Figure 3.3 nous permet de voir lamodélisation effectuée pour les krigeages simple et ordinaire, où nous avons en abcisse lesmêmes distances qu’à la Figure 3.2. La Figure 3.4 est relative à celle du krigeage universel,pour les modèles sphérique (de palier 4 et de portée 0.25) et exponentiel (de palier 600 et deportée 0.08).

Figure 3.3 – Modélisation du semi-variogramme expérimental pour krigeage simple et or-dinaire.

Identifier de façon graphique le modèle adéquat est difficile. Nous faisons recours à lavalidation croisée par "leave-one-out" pour le trouver, ce en obtenant les erreurs de prédictionpour chaque type de modèle.

Le modèle exponentiel est retenu avec une erreur de 0.13 par rapport à 550.21 pour le

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 64: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INTERPOLATION SPATIALE DANS LES TROIS DISTRICTS 41

Figure 3.4 – Modélisation du semi-variogramme expérimental pour krigeage universel.

modèle à effet de trou. Un deuxième ajustement par moindres carrés à l’aide du packagegstat (Pebesma et al., 2004) nous permet d’avoir le palier 230.5 et la portée 0.0029 pour cemodèle exponentiel.

En procédant de même, on trouve que le semi-variogramme du krigeage universel estmodelisé par un une fonction exponentielle de palier C = 239.67 et de portée a = 0.0036,avec une erreur de 0.19, inférieure à 0.41 pour le modèle sphérique de palier ajusté 239.4 etde portée ajustée 0.014.

3.2 L’interpolation du TM24

Il est question de définir dans un premier temps l’espace de krigeage comme étant la zoned’étude avec nos 38 localités, de déterminer selon les principes de chaque méthode la valeurdu TM24 en celles (13) où cela n’a pas été le cas. Le résumé des résultats obtenus est dansla Table 3.1, qui donne la distribution des valeurs interpolées sur les 38 localités de la ditezone. La Table 3.2 donne, par méthode et pour chacune des 13 localités non échantillonnées,la valeur estimée du TM24.

Table 3.1 – Résumé des valeurs krigées du TM24 pour les localités non échantillonnées.Méthodes d’interpolation Min Quartile1 Médiane Moyenne Quartile3 Max

Krigeage simple 43.64 71.93 79.09 79.19 90.72 100Krigeage ordinaire 43.64 71.93 79.89 79.45 90.72 100Krigeage universel 43.64 70.77 81.33 80.09 95.10 100

On peut se demander à ce niveau, quelle méthode de prédiction sied le mieux à nosdonnées ? Une façon (qui n’est pas idéale) de la déterminer est de choisir comme critère deperformance, la minimisation de l’erreur quadratique moyenne (EQM) par validation croisée

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 65: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INTERPOLATION SPATIALE DANS LES TROIS DISTRICTS 42

Table 3.2 – Valeurs krigées du TM24 pour les localités non échantillonnées.Localité Krigeage simple Krigeage ordinaire Krigeage universelKirambo 79.09 79.88 82.77Botoun 79.09 79.88 99.23

Bouyoum 84.72 85.22 97.1Doumo 79.09 79.88 79.7Matara 79.092 79.88 77.82

Bossoum 79.09 79.8 98.86Maboni 79.09 79.89 81.79Bocki 77.58 78.32 73.05

Lainde I 79.04 79.84 73.70LaindeII 79.02 79.81 73.54

Mboum-aviation 79.09 79.89 71.80Nassarao 78.84 79.63 74.81Banaye 79.092 79.89 80.87

par "leave-one-out". Il en ressort que le krigeage universel par surface de réponse utilisé estprivilégié avec une EQM de 317.27 comparée à 342.67 pour le krigeage ordinaire et 319.32

pour le krigeage simple.Nous pouvons donc donner dans la Table 3.3, les estimations des niveaux de résistance

des 13 localités en question, et à la Figure 3.5, la carte des niveaux de résistance des localitésd’étude.

Table 3.3 – Estimation des niveaux de résistance des moustiques dans les 13 localitésrestantes.

Localité Niveau de résistanceKirambo RésistantBotoun SensibleBouyoum Résistant probableDoumo RésistantMatara RésistantBossoum SensibleMaboni RésistantBocki RésistantLainde I RésistantLaindeII RésistantMboum-aviation RésistantNassarao RésistantBanaye Résistant

Il en ressort que Garoua est la zone de concentration de la résistance à la deltaméthrine.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 66: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INTERPOLATION SPATIALE DANS LES TROIS DISTRICTS 43

On observe aussi un léger regroupement des localités avec résistance en allant vers le nord-ouest de Mayo-Oulo. En fait, Garoua est plus urbanisée que Pitoa et Mayo-Oulo. C’est unezone industrielle et à pollution conséquente. L’utilisation des pesticides pour les cultures etdes insecticides pour les pulvérisations y est effective. Les conditions d’hygiène et de salubritélégères (vu la densité de la population) ne peuvent être écartées des caractéristiques de cetteville. D’après les agents de terrain, cette ville présente cette caractéristique particulière : lamajorité des gîtes (lieu d’évolution et de collecte des moustiques) où ne sont pas supposésêtre les A. gambiae s.l. sont pourtant ceux là où on en trouve. Tout ceci nous fait com-prendre à quel point ces vecteurs y ont développé des mécanismes d’adaptation et de survie.De tels facteurs peuvent expliquer chez A. gambiae s.l., un potentiel évolutif accéléré, undéveloppement croissant des caractères d’adaptation, par mutations génétiques en général.

Pitoa, par contre, contient les localités où les moustiques ont un statut majoritaire derésistant probable, mais aussi sensible. Il s’agit d’une zone semi-urbaine où la pollution estbeaucoup plus ménagère et la présense des plantations de la SODECOTON est effective,ainsi qu’à Mayo-Oulo. Ce dernier district présente, en plus d’une densité de populationassez faible dont l’activité pricipale est l’agriculture à moyenne échelle, non seulement desconditions climatiques difficiles, mais aussi et surtout un relief accidenté puisqu’il s’agit d’unezone montagneuse. Ces facteurs entraînent une disparition fréquente des gîtes de moustiquesliée à une variation de la température entre la chaleur extrême en journée et le froid de lanuit. La présence effective des plantations de la SODECOTON dans ce district expliqueraitla présence de quelques localités où les moustiques sont résistants à la deltaméthrine. Il n’endemeure pas moins que le caractère sensible est le plus partagé dans ce district.

La Figure 3.6 nous présente donc une répartition spatiale de la résistance à la deltamé-thrine dans nos trois districts. Il est à noter que, plus la zone est rouge, plus les populationsd’A. gambiae s.l. qui s’y trouvent sont résistantes à la deltaméthrine.

3.3 Discussion

Dans ses travaux : « Analyse spatiale et modélisation de la distribution spatiale desformes moléculaires S et M d’Anopheles gambiae s.l. au Burkina Faso », Y. SOME (2000)met premièrement en évidence le rôle que joue l’espace comme support de recherche. La dé-marche méthodologique qu’il emprunte repose sur l’utilité de la géographie dans l’étude desrelations entre maladie et environnement. Il y était question de « modéliser la distributionspatiale des membres du complexe A. gambiae s.s au Burkina Faso pour comprendre et fairecomprendre la distribution des membres de ce complexe d’espèces à travers l’identificationdes facteurs environnementaux les plus déterminants ». S’intéressant à expliquer la varia-bilité des effectifs dans des lieux donnés, compte tenu de la variabilité de l’environnement,l’usage des outils de description en analyse spatiale et de statistique classique (ACP et modèle

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 67: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INTERPOLATION SPATIALE DANS LES TROIS DISTRICTS 44

de régression par ANCOVA mettant en équation les effectifs de moustiques et les facteursenvironnementaux) a contribué à mettre en exergue des orientations (directionnelles) et desorganisations (diminution/augmentation) des effectifs des membres du complexe A. gambiaes.s au Burkina Faso. Du fait de la non dépendance totale des données à l’espace, les facteurstels : la pression atmosphérique, l’altitude, l’insolation, la végétation et l’évapo-transpiration,contribuaient à décrire la précédente observation.

Une étude comparable a été effectuée par IBEMBA (2012) : « Modélisation de la distri-bution spatiale des populations d’Anopheles gambiae s.l résistantes aux insecticides dans larégion du Nord Cameroun ». En effet, il y était question « d’analyser la distribution spatialeet de mettre en lumière les facteurs pouvant influencer l’émergence de ce phénomène ». Lesdonnées utilisées sont celles de l’année 2011, qui ont cette particularité de contenir plusieurstypes d’insecticides, en plus des synergists, auxquels les moustiques ont été testés. Consi-dérant l’unité statistique de base comme le moustique et malgré l’objectif ainsi formulé,l’approche méthodologique est basée sur une analyse multidimensionnelle de la résistance(ACP, analyse de la variance) ainsi qu’un modèle de régression logistique à deux niveaux.Ce modèle met en équation la variable dichotomique : le moustique est "knocked-down" ounon sous l’effet de l’insecticide et les variables telles les différents synergists associés auxdifférents insecticides, les proportions d’A. gambiae formes moléculaires S et M, le taux decouverture en MILDA et le type de localité. Il en ressort, en ce qui concerne la deltamé-thrine, l’existence d’une orientation de la résistance dans ces trois districts. On note aussila contribution : de l’urbanisation, de la couverture en MILDA, de la densité d’A. gambiaeforme moléculaire S, dans l’observation du taux de mortalité des moustiques exposés à ladeltaméthrine dont la dépendance spatiale exclusive n’était pas effective.

Malgré l’approche méthodologique en partie différente des deux précédents travaux, ainsique du notre (volet modélisation), les rapprochements au niveau des résultats (orientationde la distribution spatiale de la résistance) et des conclusions de ces deux travaux nousaident au niveau de l’interprétation des résultats auxquels nous sommes parvenus. En effet,la démarche méthodologique empruntée ici repose sur la géostatistique linéaire à traversdes notions de variable régionalisée, de processus aléatoire, d’analyse variographique et d’in-terpolation spatiale par krigeage. Notre étude s’inscrit donc comme une contribution (d’unpoint de vue préventif) aux travaux portant sur l’étude (spatiale) des vecteurs du paludisme.Cette méthode d’interpolation trouve dans les travaux précédents, des éléments déterminantsqu’elle n’a pas toujours pris en compte dans les étapes de prédiction et qui, pourtant, peuventconstituer des éléments de différentiation entre localités de notre zone d’étude entre qui desparticularités ont été soulevées en ce qui concerne les valeurs observées du TM24.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 68: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INTERPOLATION SPATIALE DANS LES TROIS DISTRICTS 45

Figure 3.5 – Carte des niveaux de résistance des 38 localités.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 69: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INTERPOLATION SPATIALE DANS LES TROIS DISTRICTS 46

Figure 3.6 – Répartition spatiale de la résistance (en %) dans la zone d’étude.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 70: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

CONCLUSION 47

CONCLUSION GÉNÉRALE

L’émergence de la résistance aux insecticides chez les vecteurs de transmission du palu-disme, à la deltamétrine en particulier, observée et relevée par des études antérieures, suscitebeaucoup d’intérêts et de préocupations quant au développement de stratégies efficaces delutte contre cette maladie. Notre travail s’inscrit comme une contribution (prévention del’échec d’interventions contre les vecteurs du paludisme) à la mise en oeuvre de ces der-nières, où une méthodologie géostatistique a été employée pour parvenir à bout de notreobjectif principal qui était d’analyser la répartition spatiale de la résistance à la deltamé-thrine des espèces du complexe A. gambiae s.l.

Pour mener à bien cet objectif, à partir des données recoltées sur le terrain pour le comptede l’année 2012, nous avons donné une description spatiale de la variable d’intérêt (le tauxde mortalité des A. gambiae s.l. face à la deltaméthrine). S’en est suivie la description desméthodes statistiques et d’analyse spatiale qui ont servi à cette description : l’ellipse de dé-viation, l’indice d’autocorrélation global de Moran, pour ne citer que ceux là. Il a été aussiquestion de parcourir quelques notions sur la modélisation des processus aléatoires et leurutilisation dans la mise sur pied des méthodes d’interpolation spatiale, dont le krigeage, nouspermettant d’établir une carte de répartition de la résistance.

En résumé des résultats obtenus, une orientation et une organisation particulières desniveaux de résistance ont été mises en exergue, dont la concentration dans Garoua et uneévolution dans la direction sud-ouest nord-est des localités avec résistance ont le plus attirénotre attention. On a pu aussi constater que les localités avec résistance et celles avec résis-tance probable diminuent en nombre lorsqu’on se dirige vers Mayo-Oulo. Bien que l’absencetotale d’autocorrélation (d’un point de vue global) spatiale des valeurs du taux de morta-lité des moustiques n’ait pas été effective, nous avons remarqué que la valeur du taux demortalité des A. gambiae s.l. est propre à chaque localité. L’analyse variographique nousa aussi indiqué l’existence d’une faible ressemblance des valeurs du taux de mortalité desmoustiques entre les localités voisines d’environ 1 km, même si l’absence d’autocorrélationglobale spatiale des valeurs du taux de mortalité des moustiques a été confirmé chez leslocalités avec résistance et celles avec résistance probable. L’espace à lui seul ne suffit donc

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 71: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

CONCLUSION 48

pas pour expliquer les regroupements observés et les orientations relevées par les ellipses dedéviation.

L’interpolation spatiale utilisée ici nous a permis de modéliser la variable d’intérêt commeune fonction aléatoire du second ordre à tendance surfacique et à structure de dépendancespatiale, un modèle exponentiel. Ceci nous a servi à la mise en oeuvre du krigeage, dontcelui dit universel s’adapte le mieux à notre situation. Nous avons pu estimer le niveau derésistance des localités non échantillonnées et donc construit une carte prévisionnelle expli-citant la répartition spatiale de la résistance pour le compte de cette année.

Pour une première tentative de mise en oeuvre des méthodes d’interpolation spatialeà la résolution de ce problème de santé, et surtout pour la dépendance de notre variabled’intérêt à l’espace, les prédictions que nous avons eu à faire ici dépendent essentiellementdes positions et des valeurs observées du taux de mortalité des moustiques pour chaquelocalité et non pas de l’ensemble des autres variables observées à cette échelle. Ces pré-visions pourraient être améliorées par la prise en compte quantitative des facteurs relevésdans les études précédentes (Y. Some ; Ibemba, 2012), déjà que ces derniers n’ont pas faitl’objet d’une attention stricte lors de la collecte des données de l’année 2012. En plus deces facteurs, disposer d’un échantillon plus grand contribuerait à améliorer ces prédictions,ainsi que les interprétations d’ordre asymptotique. Nous proposons donc pour la prochaineenquête que de tels paramètres puissent être vraiment pris en compte, en s’assurant de laspécificité de chaque localité. Sensibiliser les agents de terrain sur la codification détaillée etcomplète des lieux de collecte de moustiques permettrait d’affiner les résultats de dépendanceenvironnementale et de prévision.

Afin de poursuivre les travaux de recherche sur cette question, nous pourrons dans unpremier moment utiliser des méthodes de classification pour identifier des clusters, hot spotou points de concentration pour chaque niveau de résistance. Dans un second ordre, explo-rer d’autres méthodes d’interpolation (median polish, cokrigeage, krigeage bayésien, etc.)qui, en intégrant la dimension temporelle, et les différentes variables exogènes éventuelles,amélioreraient l’étude réalisée jusqu’ici.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 72: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INSTRUCTIONS R 49

ANNEXE : Instructions R

################### Analyse descriptive #################################################################################### importation des donnéesdon=read.table("Learning_mod.csv",h=T,sep=";",dec=",")

## Analyse univariée## la seule variable qualitative: Descdesc=unique(don$Desc[1:25])

## Effectifs/ proportionss=length(which(desc=="semi"))u=length(which(desc=="urbain"))r=length(which(desc=="rural"))sp=s/25; up=u/25; rp=r/25

### résumé des variables quantitativesvar.quant=don[1:25,-c(1,3,4)]summary(var.quant)

###histogramme et densité de TM24

hist(var.quant$TM24)plot(density(var.quant$TM24))curve(dnorm(x,mean(var.quant$TM24),sd(var.quant$TM24)),add=TRUE,lty=2)

###histogramme et densité de CouvMILDA

hist(var.quant$CouvMILDA)plot(density(var.quant$CouvMILDA))

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 73: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INSTRUCTIONS R 50

curve(dnorm(x,mean(var.quant$CouvMILDA),sd(var.quant$CouvMILDA)),add=TRUE,lty=2)

###histogramme, densité de N

hist(var.quant$N,main="N",xlab="Nombre de moustiques testés")plot(density(var.quant$N,adjust=2.5),main="")curve(dnorm(x,mean(var.quant$N),sd(var.quant$N)),add=TRUE,lty=2)

### test de normalité de Shapiro-Wilkshapiro.test(var.quant$TM24)shapiro.test(var.quant$CouvMILDA)

shapiro.test(var.quant$N)

### Analyse bivariée

##Matrice de corrélation ebtre variables quantitativescor(var.quant[,-c(4,5)],method="spearman")

##Test de significativitécor.test(var.quant$TM24,var.quant$Tkd95,method="spearman")cor.test(var.quant$TM24,var.quant$TempCl,method="spearman")cor.test(var.quant$TM24,var.quant$Hydrométrie,method="spearman")cor.test(var.quant$TM24,var.quant$Tkd50,method="spearman")

## Distribution des variables par rapport à Desc à la deltaplot(TM24~Desc,data=don[1:25,])

plot(Tkd50~Desc,data=don[1:25,])plot(Tkd95~Desc,data=don[1:25,])

## tests de Kruskall-Wallis correspondantkruskal.test(var.quant$TM24,don$Desc[1:25])kruskal.test(var.quant$CouvMILDA,don$Desc[1:25])kruskal.test(var.quant$N,don$Desc[1:25])

###################### Analyse spatiale ################################################################################################

### Graphe des deux plus proches voisins et table des distances

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 74: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INSTRUCTIONS R 51

## Chargement des packages ##library(ade4)library(spdep)library(ape)

## seulement résistantes parmi les insecticides = Deltares=which(don$TM24<90 & don$Insecticide=="Delta")l=length(res)coord.res=as.matrix(cbind(don$Lon[res],don$Lat[res]))

## matrice de voisinage par les 2 plus proches voisinsw.res = knn2nb(knearneigh(coord.res, 2))

## matrice des distances entre localités résistantesloc.dists =(dist(cbind(don$Lon[res], don$Lat[res])))

## les graphesplot(coord.res,xlab="Longitude", ylab="Latitude",main="Voisinageentre localités résistantes")s.label(as.data.frame(coord.res), add.p = T, neig =nb2neig(w.res),clab=1)table.dist(loc.dists , csize = 0.5,label = don$cluster[res])

## seulement susceptibles parmi les insecticides = Deltasus=which(don$TM24>97 & don$Insecticide=="Delta")l.sus=length(sus)coord.sus=as.matrix(cbind(don$Lon[sus],don$Lat[sus]))

## matrice de voisinage par les 2 plus proches voisinsw.sus = knn2nb(knearneigh(coord.sus, 2))

## matrice des distances entre localités susloc.dists.sus =(dist(cbind(don$Lon[sus], don$Lat[sus])))

## les graphesplot(coord.sus,xlab="Longitude", ylab="Latitude",main="Voisinageentre localités susceptibles")s.label(as.data.frame(coord.sus), add.p = T,neig = nb2neig(w.sus),clab=1)table.dist(loc.dists.sus , csize = 0.5,label = don$cluster[sus])

##seulement susceptibles probables parmi les insecticides = Deltasp=which(don$TM24<=97 & don$TM24>=90 & don$Insecticide=="Delta")l.sp=length(sp)coord.sp=as.matrix(cbind(don$Lon[sp],don$Lat[sp]))

## matrice de voisinage par les 2 plus proches voisins

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 75: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INSTRUCTIONS R 52

w.sp = knn2nb(knearneigh(coord.sp, 2))## matrice des distances entre localités sp

loc.dists.sp =(dist(cbind(don$Lon[sp], don$Lat[sp])))## les graphes

plot(coord.sp,xlab="Longitude",ylab="Latitude",main="Voisinageentre localités susceptibles probables ")s.label(as.data.frame(coord.sp), add.p = T, neig = nb2neig(w.sp),clab=1)table.dist(loc.dists , csize = 0.5,label = don$cluster[sp])

## Représentation en 3d du taux de mortalitélibrary(car)

## attribution des couleurscol.points=c()col.points[res]="red"col.points[sp]="yellow"col.points[sus]="green"

scatter3d(don$Lon[1:25],don$Lat[1:25],don$TM24[1:25],xlab="Longitude",ylab="Latitude",zlab="Taux de mortalité",surface.alpha=0.0,point.col=col.points,sphere.size=1)

################Indice global de Moran########################################################################

## Indice d’autocorrelation global# matrice de pondération des distances inverses

dists = as.matrix(dist(cbind(don$Lon[1:25], don$Lat[1:25])))dists.inv = 1/distsdiag(dists) = 0

##Valeur de l’indiceMoran.I(don$TM24[1:25], dists)

##Indice pour les localités résistantesres=which(don$TM24<90 & don$Insecticide=="Delta")

##matrice des distancesdists.res = as.matrix(dist(cbind(don$Lon[res], don$Lat[res])))dists.res.inv = 1/dists.res

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 76: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INSTRUCTIONS R 53

diag(dists.res.inv) = 0##Valeur de l’indice

Moran.I(don$TM24[res], dists.res.inv)

##Indice pour les localités susceptiblessus=which(don$TM24>97 & don$Insecticide=="Delta")

##matrice des distancesdists.sus = as.matrix(dist(cbind(don$Lon[sus], don$Lat[sus])))dists.sus.inv = 1/dists.susdiag(dists.sus.inv) = 0

##Valeur de l’indiceMoran.I(don$TM24[sus], dists.sus.inv)

##Indice pour les localités susceptibles probablessp=which(don$TM24>90 & don$TM24<=97 & don$Insecticide=="Delta")

## matrice des distancesdists.sp = as.matrix(dist(cbind(don$Lon[sp], don$Lat[sp])))dists.sp.inv = 1/dists.spdiag(dists.sp.inv) = 0

##Valeur de l’indiceMoran.I(don$TM24[sp], dists.sp.inv)

########### Analyse variographique #################################################

Predict=read.table("Predict.csv",h=T,sep=";",dec=",")

### comportement directionnel suivant la longitude:plot(Predict$Lon[1:25],Predict$TM24[1:25],xlab="Longitude",ylab="TM24",main="TM24 suivant la Longitude")summary(lm(Predict$TM24[1:25]~Predict$Lon[1:25]))abline(lm(Predict$TM24[1:25]~Predict$Lon[1:25]))

### comportement directionnel suivant la latitude:plot(Predict$Lat[1:25],Predict$TM24[1:25],xlab="Latitude",ylab="TM24",main="TM24 suivant la Latitude")summary(lm(Predict$TM24[1:25]~Predict$Lat[1:25]))abline(lm(Predict$TM24[1:25]~Predict$Lat[1:25]))

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 77: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INSTRUCTIONS R 54

## Le package suivant contient toutes les fonctions utilisés## ci-dessous

library(gstat)

### semi-vaariogramme

### sauvegarde du data frame complet:Predict2=Predict

### Transformation de Predict en type geodatacoordinates(Predict)=c("Lon","Lat")

### semi-variogramme empirique pour krigeage ordinaire et simplevario=variogram((TM24)~1,data=Predict[1:25,])plot(vario,pch=20)

### Ajustement de vario : effet trou et exponentielmodeleko1=fit.variogram(vario,vgm("Hol",psill=0.5/15,range=0.0329))modeleko2=fit.variogram(vario,vgm("Exp",psill=437,range=0.06))

### Visualisationplot(vario,modeleko1,type="o")plot(vario,modeleko2,type="o")

### Ajustement de variokumodele2=fit.variogram(varioku,vgm("Sph",psill=4,range=0.25),fit.sills = TRUE, fit.ranges = TRUE)modele3=fit.variogram(varioku,vgm("Exp",psill=600,range=0.08),fit.sills = TRUE, fit.ranges = TRUE)

### Visualisationplot(varioku,modele2,type="o")plot(varioku,modele3,type="o")

### semi-variogramme empirique pour krigeage universelvarioku=variogram(TM24~Lon+Lat,data=Predict[1:25,])plot(varioku,pch=20)

### Ajustement de variokumodele2=fit.variogram(varioku,vgm("Sph",psill=4,range=0.25)

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 78: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INSTRUCTIONS R 55

,fit.sills = TRUE, fit.ranges = TRUE)modele3=fit.variogram(varioku,vgm("Exp",psill=600,range=0.08),fit.sills = TRUE, fit.ranges = TRUE)

### Visualisationplot(varioku,modele2,type="o")

### selection du semi-var par vc-L1out## erreur avec effet trou

validHol=krige.cv(TM24~1,Predict[1:25,],modeleko1)errHol=mean(validHol$residual)

##erreur avec exponentielvalidExp=krige.cv(TM24~1,Predict[1:25,],modeleko2)errExp=mean(validExp$residual)

## pour kri-univ:##erreur avec sphérique

validSph=krige.cv(TM24~Lon+Lat,pred[1:25,],modele2)errSph=mean(validSph$residual)

##erreur avec exponentiel2validExp2=krige.cv(TM24~Lon+Lat,pred[1:25,],modele3)errExp2=mean(validExp2$residual)

############# Application du krigeage ####################################################################récupération des coordonnées des 38 localités

x1=Predict$Lonx2=Predict$Latz=Predict$TM24

## La grille des 38 localitéstest.grid=data.frame(x=x1,y=x2)coordinates(test.grid)=~x+ygridded(test.grid)=TRUE

## Data frame de type geodatatest=data.frame(x1=x1,x2=x2,z=z)coordinates(test)=~x1+x2

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 79: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

INSTRUCTIONS R 56

########## krigeage simple #########krs.test=krige(z~1,test[1:25,],test.grid,modeleko2,beta=mean(test$z[1:25]),nmax=25)

########## krigeage ordinaire ##########kr0.test=krige(z~1,test[1:25,],test.grid,modeleko2,nmax=25)

########## krigeage universel ##########kru.test=krige(z~x1+x2,test[1:25,],test.grid,modele3)

###### choix de la méthode de prédiction par validation croisée ############# avec minimisation de l’erreur quadratique moyenne #############

######### par krigeage simple #############valid.ks=krige.cv(z~1,test[1:25,],modeleko2,beta=mean(test$z[1:25]))errks=mean((valid.ks$residual)^2)

######### par krigeage ordinaire #############valid.k0=krige.cv(z~1,test[1:25,],modeleko2,nmax=25)errk0=mean((valid.k0$residual)^2)

######### par krigeage universel #############valid.ku=krige.cv(z~x1+x2,test[1:25,],modele2)errku=mean((valid.ku$residual)^2)

## La carte des 3 districts## Limite des trois districts

carte <- readShapeSpatial("district/Districts_etude.shp", CRS("+proj=longlat"))

plot(carte,col="grey",border="white",axes=TRUE,xlim=c(13.290,13.85),ylim=c(9.25,10.241))

###### Représentation globale de l’évolution de la résistance##création de la grille de krigeage

est<-14ouest<-13nord<-10.4sud<-9grx<- seq(ouest,est,by=0.01)gry<- seq(sud,nord,by=0.01)x1<-rep(grx, length(gry))x2<-rep(gry, length(grx))

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 80: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

BIBLIOGRAPHIE 57

Grid<-data.frame(x1=x1, x2=x2)coordinates(Grid)=~x1+x2gridded(Grid)<-TRUE

##krigeage universel sur toute la grille

Krig3<-krige(z~x1+x2,test[1:25,],Grid,modele2)

##Représentation du krigeage## indices hors grille

dehors <- which(!is.na(overlay(Krig3,carte)))

#Représentation

plot(spplot((Krig3[dehors,"var1.pred"]),panel=function(...)panel.gridplot(...)sp.polygons(carte),aspect=1.3,axes=TRUE,#sp.text(coordinates(test),as.vector(test$z[1:25,])),main=paste("Evolution globale de \n la résistance dans la zone d’étude")))

############################## FIN #################################

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 81: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

BIBLIOGRAPHIE 58

Bibliographie

[1] ABBOT, W.S. (1925). A method of computing the effectiveness of an insecticide. J.Econ. Entomol. 18.

[2] Arc GIS 10.1 (2010). Arc Gis Ressource Center Blog, ESRI.

[3] Baillargeon, Sophie. (2005). Le krigeage : revue de la théorie et application à l’interpo-lation spatiale de données de précipitations. Faculté des sciences et de génie, UniversitéLAVAL.

[4] Bivand, R. et al. (2011). spdep : Spatial dependence : weighting schemes, statistics andmodels. R package version 0.5-43. http ://CRAN.R-project.org/package=spdep.

[5] Bosser, Pierre. (2012). Interpolation spatiale. Département Positionnement Terrestreet Spatial, École Nationale des Sciences Géographiques, France.

[6] Causeur, David. Modélisation géostatistique. Laboratoire de Mathématiques Appli-quées, Pôle d’Enseignement Supérieur et de Recherche Agronomique de Rennes.

[7] Chauvet, Pierre. (2006). Aide mémoire de la Géostatistique Linéaire (Tome 1). Paris-Tech.

[8] Chessel D., Dray S. (2010). Fiche TD avec le logiciel R : ter4, Une variable et unecarte. Université de Lyon I, http//pbil.univ-lyon1.fr/R/pdf/ter4.pdf.

[9] Chessel D., Dray S. et al. (2007). The ade4 package-II : Two-table and K-table methods.R News. 7(2) : 47-52.

[10] Fesuh, Betrand. (2012). Modeling the effects of physiological status and insecticideresistance on the resting behavior on malaria vectors in North Cameroon. Mémoire deMaster de statistique appliquée, École Polytechnique, Yaoundé, Cameroun.

[11] Gaetan C., Guyon X. (2008). Modélisation et statistique spatiales. Université de Venise,Université de Paris I.

[12] GORIA S. et al. (2011). Introduction aux méthodes statistiques et aux systèmes d’in-formation géographique en santé environnement-Application aux études écologiques.Saint-Maurice, Institut de veille sanitaire.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013

Page 82: ANALYSE DE LA DISTRIBUTION ... - …mastat.visualstat.com/dissertation/2013/ntahdui.pdf · REMERCIEMENTS iii nairesdepuisDschangainsiquemesco-stagiairesà l’OCEACetM.FESUHBetrand

BIBLIOGRAPHIE 59

[13] Hennequi, Marie. (2010). Spatialisation des données de modélisation par Krigeage. Mas-ter statistique et Applications, Université de Strasbourg.

[14] Ibemba, Gabin. (2012). Modélisation de la distribution spatiale des populations d’Ano-pheles gambiae s.l résistantes aux insecticides dans la région du Nord Cameroun. Mé-moire professionnel de fin d’études, ISSEA.

[15] Morency, Catherine. (2006). Étude de méthodes d’analyse spatiale et illustration à l’aidede microdonnées urbaines de la grande région de Montréal. Département des géniescivil, géologique et des mines, École Polytechnique de Montréal.

[16] OMS (1970). Insecticide resistance and vector control. Seventeeth report of the WHOexpert committee on insecticides, WHO technical report series, number 443, Geneva,Switzerland.

[17] OMS (2013a). 10 faits sur le paludisme. Genève, Suisse.http//www.who.int/features/factfiles/malaria/malaria_facts/fr/index8.html.

[18] OMS (2013b). Test procedure for insecticide resistance monitoring in malaria vectormosquitoes. World Health Organization 2013, Geneva, Switzerland.

[19] Paradis E., Strimmer K. et al. (2004). APE : analyses of phylogenetics and evolutionin R language. Bioinformatics 20 :289-290.

[20] Pebesma et al. (2004). Multivariable geostatistics in S : the gstat package. Computers& Geosciences, 30 : 683-691.

[21] Rakotomalala, Ricco. (2011). Tests de normalité, Techniques empiriques et tests sta-tistiques. Version 2.0, Université Lumière Lyon 2, France.

[22] R Core Team (2012). R : A language and environment for statistical computing. RFoundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URLhttp ://www.R-project.org/.

[23] Some, Yélézouomin. (2000). SIG, analyse spatiale et modélisation de la distributionsaptiale des formes moléculaires S et M d’Anopheles gambiae s.l. au Burkina Faso.ÉCOLE DOCTORALE SCIENCES DE L’HOMME ET DE LA SOCIÉTÉ, LABO-RATOIRE CEDETE, Université d’ORLÉANS.

[24] Souris, Marc. (2011-2012). Analyse spatiale : Concepts et méthodes, Master de Géo-graphie de la Santé. Paris Ouest Nanterre-La Défense, Institut de Recherche pour leDéveloppement.

[25] Thomas-Agnan, Christine. (2012). Analyse statistique des données spatiales. Universitéde Toulouse I.

[26] Tolle, Florian. (2010). Initiation aux géostatistiques. France.

Mémoire de Master de Statistique Appliquée. NTAHDUI NGUENDJIO Ronnel c© ENSP 2012-2013