100
ANALYSE STATISTIQUE DE LA LOI DES DUREES DANS LE BUT DE PROPOSER UN INDICATEUR RELATIF AUX DELAIS DE VOYAGE SUR LES CORRIDORS DOUANIERS: Douala-N’Djamena et Douala-Bangui Par: NSHARE NJIKAM Emmanuel Cyril Maître ès Sciences Sous la direction du: Dr.Ing. MOUKOUOP NGUENA IBRAHIM Administrateur Délégué de Polytech-valor Sous la supervision du: Dr. Eugène-Patrice NDONG NGUEMA Chargé de Cours à l’ENSP de Yaoundé Novembre 2012

ANALYSE STATISTIQUE DE LA LOI DES DUREES …mastat.visualstat.com/dissertation/2012/nshare.pdf · Douane; Voyage: Déplacement ... de voyage des cargaisons de marchandises en transit

  • Upload
    lamliem

  • View
    218

  • Download
    1

Embed Size (px)

Citation preview

ANALYSE STATISTIQUE DE LA LOI DESDUREES DANS LE BUT DE PROPOSER UNINDICATEUR RELATIF AUX DELAIS DE

VOYAGE SUR LES CORRIDORSDOUANIERS: Douala-N’Djamena et

Douala-Bangui

Par:

NSHARE NJIKAM Emmanuel CyrilMaître ès Sciences

Sous la direction du:

Dr.Ing. MOUKOUOP NGUENA IBRAHIMAdministrateur Délégué de Polytech-valor

Sous la supervision du:

Dr. Eugène-Patrice NDONG NGUEMAChargé de Cours à l’ENSP de Yaoundé

Novembre 2012

2

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DÉDICACES i

Dédicaces

Je dédie ce travail à mes parents M. MFONBOUOT Richard et Mme NGUEGNINJAYOU Elise. Papa et Maman, merci d’avoir toujours été là pour moi, merci pourl’amour sans faille que vous n’avez cessé de m’apporter, ainsi que vos conseils qui m’onttoujours permis d’être sur le droit chemin. Voyez en ce mémoire un des fruits de tous lesefforts et sacrifices que vous ne cessez de faire pour moi.À mes grands parents M. YOUMIE NJAYOU Henock et Mme NGAPKET Emi-lienne ;À mon regretté oncle BEGTNKOM Philippes et ma regrettée tante MOUGOUELOUNEMargueritte ;À mes oncles MFOPOU Henri Dunand, NJILIE Emmanuel, TABEGAM Mama,POUANTAMOUN Charles, BEGTNKOM Emmanuel, MVUH Jérémie, NJI-KAM Georges ;À mes tantes MFONBOUOT Bernadette, POUANTAMOUN Nathalie, MamaSALA, NZIE Rose, MBOUM Gisèle.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

REMERCIEMENTS ii

Remerciements

Je remercie le Dieu tout puissant pour la santé, la persévérance, l’intelligence, la force,l’énergie débordante qu’il m’a accordé tout au long de ce travail et durant tout mon cursusscolaire.Ce mémoire est l’aboutissement d’un long et laborieux travail qui a demandé l’assistance etle soutien de plusieurs personnes. Nous tenons à remercier :

Le Pr. Charles AWONO ONANA, Directeur de l’ENSP pour l’attention qu’il ac-corde au Master de Statistique Appliquée.

Le Pr. Henri GWET, pour son inestimable contribution à notre formation, son bonsens, sa disponibilité, ses précieux conseils et ses encouragements qui m’ont toujours permisde consolider mes connaissances.

Le Dr. Eugène-Patrice NDONG NGUEMA pour l’encadrement, la compréhension,la disponibilité et la patience dont il a fait preuve à mon égard pendant mon stage.

Le Dr. Ing. MOUKOUOP NGUENA IBRAHIM, Administrateur Délégué dePolytech-valor pour l’encadrement professionnel qu’il m’a apporté.

Le Dr. TAKAM SOH Patrice pour son orientation, son soutien et surtout ses conseilspendant les moments difficiles.

Le corps enseignant du Master de Statistique Appliquée pour leur encadrement et leurdévouement tout au long de notre formation. Particulièrement le Dr. Jacques TAGOUD-JEU, leDr. TCHATCHUENG Brice, leMC. TOUSSILEWilson, leDr. NDOUMBENKENG, et le Dr. Jean Jules TEWA.

Tous les camarades et amis de promotion, pour les difficultés que nous avons rencontréeset surmontées ensemble, pour leur esprit d’équipe et de solidarité.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

REMERCIEMENTS iii

Tous mes amis (e) qui par leur présence m’ont particulièrement soutenus au cours de cesdernières années.

Merci à tous ceux qui, de près ou de loin, ont contribué à l’édification de ce document.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

TABLE DES MATIÈRES iv

Table des matières

Dédicaces i

Remerciements ii

Abréviations x

Lexique des termes techniques xi

Avant-propos xii

Résumé xiii

Abstract xiv

Introduction 1

Résumé Exécutif 4

1 REVUE DE LA LITTERATURE 1

2 DONNEES 32.1 Source des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32.2 Identification des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32.3 Description des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

3 METHODOLOGIE STATISTIQUE 173.1 Estimation non paramétrique de la loi des durées de voyage en situation de

durées non censurées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173.1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173.1.2 Estimation de la fonction de répartition de la loi des durées de voyage 173.1.3 Estimation de la moyenne de la loi des durées de voyage T . . . . . . 183.1.4 Estimation de la variance de la loi des durées de voyage T . . . . . . 18

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

TABLE DES MATIÈRES v

3.1.5 Estimation des quantiles de la loi des durées de voyage T . . . . . . . 183.1.6 Intervalle de confiance de la moyenne de la loi des durées de voyage T 19

3.2 Estimation non paramétrique de la loi des durées de voyage en situation dedurées censurées à droite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.2.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.2.2 Cadre de travail . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.2.3 Approche pour l’estimation de la fonction de survie . . . . . . . . . . 20

3.3 Estimateur de Kaplan-Meier . . . . . . . . . . . . . . . . . . . . . . . . . . . 213.3.1 Construction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213.3.2 Rappels des propriétés asymptotiques de ST

KM. . . . . . . . . . . . 22

3.3.3 Estimation de la variance de STKM

(t), ∀t fixé ≥ 0 . . . . . . . . . . . 223.3.4 Intervalle de confiance pour ST (t), ∀t fixé > 0 . . . . . . . . . . . . . 223.3.5 Estimation de la moyenne, de la variance et de la médiane de la loi des

durées de voyage T . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233.3.6 Comparaison des échantillons de la loi des durées de voyage T : Le test

du log-rank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.4 Estimation semi-paramétrique de la loi des durées de voyage : Le modèle de

Cox . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.4.1 Cadre de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.4.2 Le modèle de Cox . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273.4.3 Estimation des paramètres dans le modèle (C) . . . . . . . . . . . . . 273.4.4 Diagnostics du modèle de Cox . . . . . . . . . . . . . . . . . . . . . . 293.4.5 Test sur les paramètres du modèle de Cox . . . . . . . . . . . . . . . 303.4.6 Analyse de l’ajustement du modèle de Cox . . . . . . . . . . . . . . . 313.4.7 Sélection de covariables . . . . . . . . . . . . . . . . . . . . . . . . . . 31

4 RESULTATS 334.1 Préambule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334.2 Estimation non paramétrique de la loi des durées de voyage en situation de

durées non censurées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344.2.1 Estimation des quantiles de la loi des durées de voyage en situation de

durées non censurées . . . . . . . . . . . . . . . . . . . . . . . . . . . 344.2.2 Estimation de la moyenne de la loi des durées de voyage en situation

de durées non censurées . . . . . . . . . . . . . . . . . . . . . . . . . 384.3 Estimation non paramétrique de la loi des durées de voyage en situation de

durées censurées à droite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394.3.1 Estimation des quantiles de la loi des durées de voyage en situation de

durées censurées à droite . . . . . . . . . . . . . . . . . . . . . . . . . 39

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

TABLE DES MATIÈRES vi

4.3.2 Estimation de la moyenne de la loi des durées de voyage en situationde durées censurées à droite . . . . . . . . . . . . . . . . . . . . . . . 40

4.3.3 Fonction de survie de la loi des durées de voyage en situation de duréescensurées à droite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4.4 Proposition d’un indicateur relatif aux délais de voyages sur les corridorsDouala-N’Djamena et Douala-Bangui . . . . . . . . . . . . . . . . . . . . . . 434.4.1 Indicateur relatif au délai de voyage sur le corridor Douala-N’Djamena 444.4.2 Indicateur relatif au délai de voyage sur le corridor Douala-Bangui . . 44

4.5 Le modèle de Cox . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.5.1 Ecriture du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.5.2 Vérification des hypothèses du modèle de Cox . . . . . . . . . . . . . 454.5.3 Estimation des paramètres et analyse des effets des covariables sur les

durées de voyage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514.5.4 Analyse de l’ajustement du modèle de Cox . . . . . . . . . . . . . . . 534.5.5 Sélection de covariables . . . . . . . . . . . . . . . . . . . . . . . . . . 544.5.6 Vers la recherche du meilleur modèle . . . . . . . . . . . . . . . . . . 564.5.7 Conclusion sur le modèle de Cox : . . . . . . . . . . . . . . . . . . . . 61

Conclusion 62

Annexe A : PRESENTATION DES CORRIDORS 65

Annexe B : PROGRAMME R 66

Bibliographie 76

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

TABLE DES FIGURES vii

Table des figures

2.1 Comparaison durées observées et non observées . . . . . . . . . . . . . . . . 72.2 Estimation des densités des durées observées sur les corridors . . . . . . . . . 72.3 Courbe des densités des vitesses maximales . . . . . . . . . . . . . . . . . . . 102.4 Distribution des durées en fonction du nombre d’arrêts et du nombre de sorties 16

3.1 Exemples de durées observées et de durées non observées . . . . . . . . . . . 20

4.1 Fonction de répartition empirique de la loi des durées en situation de duréesnon censurées corridor Douala-N’Djamena . . . . . . . . . . . . . . . . . . . 36

4.2 Fonction de répartition empirique de la loi des durées en situation de duréesnon censurées corridor Douala-Bangui . . . . . . . . . . . . . . . . . . . . . . 38

4.3 Courbe de survie des durées de voyages corridor Douala-N’Djamena . . . . . 414.4 Courbes de survie des durées de voyages corridor Douala-Bangui . . . . . . . 424.5 Comparaison des courbes de survie des durées de voyages . . . . . . . . . . . 434.6 Courbe des résidus de Schoenfeld corridor Douala-N’Djamena . . . . . . . . 474.7 Courbe des résidus de Schoenfeld corridor Douala-Bangui . . . . . . . . . . . 494.8 Nuage de points des résidus du modèle de Cox corridor Douala-N’Djamena . 504.9 Nuage de points des résidus du modèle de Cox corridor Douala-Bangui . . . 514.10 Courbes de prédictions des fonctions de risque instantané corridor Douala-

N’Djamena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594.11 Courbes de prédictions des fonctions de risque instantané corridor Douala-

Bangui . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604.12 Présentation des corridors de transit . . . . . . . . . . . . . . . . . . . . . . 65

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

LISTE DES TABLEAUX viii

Liste des tableaux

1 Estimation des quantiles de la loi des durées de voyage corridor Douala-N’Djamena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Estimation des quantiles de la loi des durées de voyage corridor Douala-Bangui 6

2.1 Récapitulatif des nombres de durées de voyages observeés et non observéespar le GPS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.2 Récapitulatif des nombres de durées de voyages observeés et non observeéspar la Douane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.3 Récapitulatif des nombres de durées de voyages observées et non observeéspar Nexus Plus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.4 Résumé statistique des durées observées de voyage . . . . . . . . . . . . . . . 8

2.5 Résumé statistique des variables quantitatives corridor Douala-Ndjamena . . 9

2.6 Résumé statistique des variables quantitatives corridor Douala-Bangui . . . . 9

2.7 Recodage de la vitesse maximale en 2 classes . . . . . . . . . . . . . . . . . . 11

2.8 Tableau de contingence entre l’itinéraire et la vitesse maximale corridor Douala-N’Djamena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.9 Tableau de contingence entre l’itinéraire et la vitesse maximale corridor Douala-Bangui . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.10 Tableau de contingence entre l’itinéraire et le nombre d’arrêts corridor Douala-N’Djamena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.11 Tableau de contingence entre l’itinéraire et le nombre d’arrêts corridor Douala-Bangui . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.12 Tableau de contingence entre l’itinéraire et le nombre de sorties corridorDouala-N’Djamena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.13 Tableau de contingence entre l’itinéraire et le nombre de sorties corridorDouala-Bangui . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.14 Tableau de contingence entre le nombre d’arrêts et le nombre de sorties cor-ridor Douala-N’Djamena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

LISTE DES TABLEAUX ix

2.15 Tableau de contingence entre le nombre d’arrêts et le nombre de sorties cor-ridor Douala-Bangui . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.16 Matrice de corrélation corridor Douala-N’Djamena . . . . . . . . . . . . . . . 152.17 Matrice de corrélation corridor Douala-Bangui . . . . . . . . . . . . . . . . . 15

4.1 Estimation des quantiles de la loi des durées en situation de durées non cen-surées corridor Douala-N’Djamena . . . . . . . . . . . . . . . . . . . . . . . . 34

4.2 Estimation des quantiles de la loi des durées en situation de durées non cen-surées et des durées non aberrantes corridor Douala-N’Djamena . . . . . . . 35

4.3 Estimation des quantiles de la loi des durées en situation de durées non cen-surées corridor Douala-Bangui . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.4 Estimation des quantiles de la loi des durées en situation de durées non cen-surées et des durées non aberrantes corridor Douala-Bangui . . . . . . . . . . 37

4.5 Estimation de la moyenne et IC de la moyenne de la loi des durées en situationde durées non censurées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.6 Estimation des quantiles de la loi des durées en situation de durées censuréesà droite corridor Douala-N’Djamena . . . . . . . . . . . . . . . . . . . . . . . 39

4.7 Estimation des quantiles de la loi des durées en situation de durées censuréesà droite corridor Douala-Bangui . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.8 Estimation de la moyenne et IC de la moyenne de la loi des durées en situationde durées censurées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.9 Tableau de test des résidus de Schoenfeld corridor Douala-N’Djamena . . . . 464.10 Tableau de test des résidus de Schoenfeld corridor Douala-Bangui . . . . . . 484.11 Tableau de l’estimation des paramètres du modèle de Cox corridor Douala-

N’Djamena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524.12 Tableau de l’estimation des paramètres du modèle de Cox corridor Douala-

Bangui . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524.13 Matrice de corrélation corridor Douala-N’Djamena . . . . . . . . . . . . . . . 554.14 Matrice de corrélation corridor Douala-Bangui . . . . . . . . . . . . . . . . . 554.15 Tableau de l’estimation des paramètres du meilleur modèle de Cox corridor

Douala-N’Djamena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584.16 Tableau de l’estimation des paramètres du meilleur modèle de Cox corridor

Douala-Bangui . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

ABRÉVIATIONS x

Abréviations

1. DGD : Direction Générale des Douanes du Cameroun ;

2. PAD : Port Autonome de Douala ;

3. CDA : Commissionnaire en Douane Agréé ;

4. CEMAC : Communauté Economique et Monétaire de l’Afrique Centrale ;

5. GPS : Global Positioning System ;

6. RCA : République Centrafricaine ;

7. SYDONIA : Système Douanier Automatisé ;

8. KM : Kaplan-Meier ;

9. AIC : Akaike Informative Criterion ;

10. v.a.r : Variable aléatoire réelle ;

11. IC : Intervalle de confiance ;

12. Pr : Probabilité ;

13. PS : Presque surêment ;

14. L : Loi ;

15. i.i.d : Indépendantes et identiquements distribuées ;

16. ENSP : Ecole Nationale Supérieure Polytechnique de Yaoundé.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

LEXIQUE DES TERMES TECHNIQUES xi

Lexique des termes techniques

Cargaison : ensemble des marchandises constituant un voyage ;Checkpoints : bureaux de contrôles de la Douane situés sur les corridors ;Conteneur : caisse de dimensions normalisées, utilisée pour le transport de marchandises ;Corridor : axe (routier, maritime, ferrovier, aérien) reliant deux pays ;Douane : administration chargée de percevoir les droits sur certaines marchandises àl’entrée ou à la sortie d’un Etat ;Itinéraires : trajets définissant les corridors Douaniers ;Transit : passage de marchandises à travers le territoire d’un Etat sans payer les droits deDouane ;Voyage : Déplacement, chemin qu’on fait pour aller d’un lieu dans un autre qui est éloigné ;Indicateur : Valeur (nombre) qui permet d’apprécier une situation donnée ou un fait.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

AVANT-PROPOS xii

Avant-propos

Dans l’optique de l’obtention du diplôme de Master de Statistique Appliquée, le stagepratique de fin de formation est un passage obligatoire pour tout étudiant du dit Master.Ce stage, respectant les canaux de fonctionnement de l’Ecole Nationale Supérieure Poly-technique (ENSP) permet à l’étudiant non seulement d’affronter le monde de l’entrepriseavec les enseignements reçus durant deux ans de formation, mais aussi de cultiver l’esprit derecherche.

Cela ouvre ainsi deux portes : celle de la recherche qui permettra d’approfondir lesconnaissances statistiques, et celle du monde professionnel qui permettra de concevoir, decollecter, d’analyser les données utiles à la prise de décision dans le milieu socioprofessionnel.

Ce stage, en conformité avec les objectifs préalablement suscités à duré 4 mois et s’estdéroulé à Polytech-valor entre le 03 Mai 2012 et le 03 Septembre 2012. Le stage s’estbien déroulé dans le strict respect du règlement intérieur de Polytech-Valor et du calendrieracadémique de l’ENSP. Le thème d’étude qui a été retenu est : ANALYSE STATISTIQUEDE LA LOI DES DUREES DANS LE BUT DE PROPOSER UN INDICATEUR RELATIFAUX DELAIS DE VOYAGE SUR LES CORRIDORS DOUANIERS : Douala-N’Djamenaet Douala-Bangui.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RÉSUMÉ xiii

Résumé

Notre étude avait pour objectifs de proposer à la Direction Générale des Douanes duCameroun (DGD) un indicateur de délais de voyage des cargaisons de marchandises surles corridors Douala-N’Djamena et Douala-Bangui et un modèle expliquant les durées devoyage sur ces corridors. Nous avons utilisé pour cela l’estimation non paramétrique de loides durées de voyage en présence des durées non censurées et des durées censurées à droite,et enfin le modèle de Cox. Compte tenu de nos hypothèses, nous avons obtenu les résultatssuivants : un indicateur relatif au délai de voyage sur le corridor Douala-N’Djamena est9.53 jours en moyenne. Les covariables poids net de la cargaison, itinéraire emprunté par lescamions et vitesse maximale atteinte par les camions semblent avoir des impacts significatifssur les durées de voyage sur ce corridor. De même, un indicateur relatif au délai de voyagesur le corridor Douala-Bangui est 4.92 jours en moyenne. Les covariables nombre de sortiescorridors et vitesse maximale atteinte par les camions semblent avoir des impacts significatifssur les durées de voyage sur ce corridor.

Mots clés : indicateur, cargaisons de marchandises, corridors, durées de voyage, estima-tion non paramétrique, estimateur de Kaplan-Meier, durées censurées, modèle de Cox.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

ABSTRACT xiv

Abstract

Our study aimed to propose an index of the DGD time travel shipments of goods on theDouala-N’Djamena and Douala-Bangui and a model explaining the travel times on thesecorridors. We used a non-parametric estimation of the law of travel times in the presenceof not censored durations and of right censored durations, and the Cox model. Given ourassumptions, we obtained the following results : the index for time travel in the corridorDouala-N’Djamena is 9.53 days on average. The covariables net weight of the shipment, routeborrowed by trucks and maximum speed of the trucks seem to have a significant impact onthe travel times on this corridor. Similarly, the index on time trips on the Douala-Banguicorridor is 4.92 days on average. The covariables number output corridors and the maximumspeed for trucks seem to have a significant impact on the travel times on this corridor.

Key words : index, cargo freight, corridors, travel time, non-parametric estimation,Kaplan-Meier estimator, rigth-censured duration, model of Cox.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

INTRODUCTION 1

Introduction

Contexte

Le suivi des marchandises en transit douanier reste un problème majeur à la DGD. Eneffet, plusieurs milliers de marchandises entrent et sortent chaque jour au Cameroun par lePort Autonome de Douala (PAD) ; et leur suivi jusqu’à leurs destinations finales n’est pastoujours aisé. Pour pallier à ce problème, la DGD a mis sur pied un dispositif de suivi desmarchandises par géo-localisation à l’aide du GPS. Toutefois, elle constate que de nombreusesmarchandises arrivent hors délais ou n’arrivent même pas à destination.

L’arrivée tardive des marchandises dans les pays destinataires est souvent causée (Grou-pement de cabinets SIM S.p.A/CRETES, 2011) par :

– le mauvais état du réseau routier qui ne permet pas de faire de grandes vitesses ;– le temps mis dans les check-points qui sont les points de contrôles des services douaniers

sur les corridors ;– la traversée des contrôles des postes frontaliers ;– les différents contrôles routiers jugés souvent tracassiers par les usagers ;– les pannes de véhicules ;– les accidents de la route ;– les problèmes relatifs à l’insécurité.

Pour les marchandises qui n’arrivent pas à destination, la cause principale est leurs pertes encours de voyage. Cela est due au « mauvais comportement » de certains transitaires locauxqui déclarent leurs marchandises en transit mais s’arrangent à les décharger en chemin afinde les revendre sur le territoire national (Cabinet JYD et Consultants, 2010).

Tous ces problèmes ont un impact négatif pour les opérateurs économiques et les gouver-nements des pays destinataires. Les opérateurs subissent des pertes énormes, surtout lorsqueles marchandises qu’ils attendent sont des produits périssables. Les gouvernements, quant àeux, subissent des pertes de recettes des administrations douanières. Ainsi, ces gouvernementsdes pays destinataires se plaignent trop souvent en attribuant le tort de ces désagréments àla Douane Camerounaise.

C’est dans ce contexte, que la DGD veut mener une étude statistique des données de

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

INTRODUCTION 2

transit sur les corridors douaniers notamment, sur Douala-N’Djamena et Douala-Bangui.Ceci permettra de voir clair sur les délais et les facteurs qui peuvent expliquer les duréesde voyage des cargaisons de marchandises en transit vers les pays voisins, notamment leTCHAD et la RCA.

Problématique

L’estimation statistique de la loi des durées dans le but de proposer un indicateur rela-tif aux délais de voyage sur les corridors douaniers (Douala-N’Djamena et Douala-Bangui)permettra à la DGD de comprendre les délais de voyage de cargaisons des marchandisesen transit, et ce qui peut expliquer les durées de voyage sur ces corridors afin de renforcerles relations avec les 2 pays concernés par ces corridors (TCHAD et RCA). En effet, dansle cadre de ce renforcement des relations, le TCHAD et la RCA qui sont les deux pays dela zone CEMAC sans littoral maritime, font transiter leurs marchandises par le Cameroun,qui, de ce fait, devient un axe très important de transport des marchandises vers ces pays.C’est dans ce sens que le Cameroun a eu à signer des « conventions en matière de TransportRoutier » avec ces deux pays, l’une avec le TCHAD le 13 avril 1999 et l’autre avec la RCAle 22 décembre 1999 (TATCHOU, 2008). De ces conventions, les itinéraires devant servir autransport des marchandises entre ces pays ont été définis. C’est ainsi que les deux corridorsDouala-N’Djamena et Douala-Bangui, qui sont parmi les plus importants corridors de lasous-région Afrique Centrale, ont été établis. Actuellement, le suivi des marchandises le longde ces corridors pose des problèmes :

– le non respect des délais de voyage des cargaisons de marchandises ;– les disparitions des conteneurs en transit ;– les Nombreux tracasseries routières ;– etc.

Bref, tous ces problèmes ont pour effet la détérioration des rapports entre les pays concernés.En vue de contribuer à l’élaboration d’une solution à ces problèmes, nous allons faire uneanalyse statistique des données de transit afin de fournir à la DGD un indicateur des délaisde voyage des cargaisons de marchandises et un modèle permettant d’expliquer les duréesde voyage sur ces corridors.

Objectifs

Le travail que nous allons mener aura pour objectif principal la proposition à la DGDd’un indicateur relatif aux delais de voyage des cargaisons de marchandises sur les corridorsDouala-N’Djamena et Douala-Bangui, et d’un modèle permettant d’expliquer les durées devoyage sur ces corridors en fonction de certains covariables pertinentes que nous identifierons.Les objectifs spécifiques de ce travail sont les suivants :

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

INTRODUCTION 3

1. Estimer la loi des durées de voyage sur les corridors Douala-N’Djamena et Douala-Bangui.

2. Proposer un modèle de Cox qui explique ces durées de voyage en fonction de co-variables auxiliaires pertinentes.

Plan de travail

Pour atteindre les objectifs fixés, nous avons divisés notre travail en 4 chapitres. Lepremier chapitre sera consacré à la revue de la littérature. Le deuxième chapitre sera consacréaux données. Le troisième chapitre sera consacré à la méthodologie statistique. Enfin, ledernier chapitre sera consacré aux résultats.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RÉSUMÉ EXÉCUTIF 4

Résumé Exécutif

Problème

Dans le souci d’améliorer les bons rapports existant entre les pays du TCHAD et de laRCA avec le Cameroun en matière de transit des marchandises, la DGD veut mener uneétude sur les données de transit afin de comprendre les délais de voyage sur les principauxcorridors définis avec ces 2 pays (Douala-N’Djamena et Douala-Bangui) et ce qui peut expli-quer les durées de voyage sur ces corridors. Il en résulte notre problématique de recherche :proposer un indicateur relatif aux délais de voyage sur les corridors Douala-N’Djamena etDouala-Bangui et un modèle expliquant les durées de voyage sur ces corridors en fonctiondes covariables auxiliaires pertinentes.

Méthodologie

Pour répondre au problème posé, nous avons utilisé les méthodes statistiques suivantes :

1. l’analyse descriptive des données pour apprécier les durées de voyage observées (cellesqui sont quittés du PAD et sont arrivés aux postes-frontières), pour étudier les dif-férentes corrélations qu’il peut y avoir entre les covariables qui peuvent expliquer lesdurées de voyage et pour avoir le résumé statistique des covariables observées dansl’échantillon ;

2. l’estimation non paramétrique de la loi des durées de voyage pour proposer un indica-teur relatif aux délais de voyage. Cette méthode a consisté d’abord à estimer la loi desdurées de voyage en présence des durées non censurées, ensuite, à estimer la loi desdurées de voyage en présence des durées censurées à droite par l’estimateur de KaplanMeier ;

3. le modèle de Cox pour expliquer les durées de voyage sur les corridors Douala-N’Djamenaet Douala-Bangui. Cette méthode a consisté d’abord à voir si les covariables vérifientles hypothèses du modèle, ensuite à écrire le modèle, c’est-à-dire exprimer la variableà expliquer en fonction des covariables et enfin à effectuer les tests sur les résidus dumodèle pour valider le modèle.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RÉSUMÉ EXÉCUTIF 5

Résultats

L’application de l’estimation non paramétrique de la loi des durées de voyage en pré-sence des durées non censurées (voyages qui ont quittés le PAD et qui sont arrivés auxpostes-frontières de Kousseri pour le corridor Douala-N’Djamena et de Garoua-Boulai pourle corridor Douala-Bangui), en présence des durées censurées (voyages qui ont quittés le PADet qui ne sont pas arrivés aux postes-frontières), et le modèle de Cox, nous ont conduits auxrésultats suivants :

Þ Corridor Douala-N’DjamenaUn indicateur relatif au délai de voyage sur le corridor Douala-N’Djamena est 9.53 joursen moyenne. En outre, la valeur médiane des durées de voyage sur le corridor Douala-N’Djamena est 8 jours c’est-à-dire que, 50% des voyages durent au plus 8 jours et 50%

des voyages durent plus de 8 jours sur ce corridor. Le tableau 1 donne le récapitulatifdes quantiles estimés des durées de voyage à 10%, à 25%, à 50%, à75%, à 80%, à 90%,à 95% et à 99% de la loi des durées de voyage sur le corridor Douala-N’Djamena.

Table 1 – Estimation des quantiles de la loi des durées de voyage corridor Douala-N’DjamenaQuantiles Durées de voyages (en jours)

10% 625% 750% 875% 1180% 1290% 1595% 1899% 23

D’après le tableau 1, 95% des voyages durent au plus 18 jours sur le corridor Douala-N’Djamena. De même, ce tableau nous suggère que, 99% des voyages durent au plus23 jours sur ce corridor.

Par ailleurs, le modèle de Cox nous révélent que les covariables poids net de la cargaison,itinéraire emprunté par les camions et vitesse maximale atteinte par les camions ontune influence significative au seuil 5% sur les durées de voyage sur le corridor Douala-N’Djamena.

Þ Corridor Douala-BanguiUn indicateur relatif au délai de voyage sur le corridor Douala-Bangui est 4.92 jours enmoyenne. En outre, la valeur médiane des durées de voyage pour le corridor Douala-Bangui est 4 jours c’est-à-dire que, 50% des voyages durent au plus 4 jours et 50% desvoyages durent plus de 4 jours sur ce corridor. Le tableau 2 donne le récapitulatif des

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RÉSUMÉ EXÉCUTIF 6

quantiles estimés des durées de voyage à 10%, à 25%, à 50%, à75%, à 80%, à 90%, à95% et à 99% de la loi des durées de voyage sur le corridor Douala-Bangui.

Table 2 – Estimation des quantiles de la loi des durées de voyage corridor Douala-BanguiQuantiles Durées de voyages (en jours)

10% 225% 350% 475% 680% 690% 895% 1099% 14

D’après le tableau 2, 95% des voyages durent au plus 10 jours sur le corridor Douala-Bangui. De même, ce tableau nous suggère que, 99% des voyages durent au plus 14

jours sur ce corridor.

Par ailleurs, le modèle de Cox nous révélent que les covariables nombre de sortiescorridor et vitesse maximale atteinte par les camions ont une influence significative auseuil 5% sur les durées de voyage sur le corridor Douala-Bangui.

Conclusion et Recommandations

Une étude un peu plus approfondie devrait donc être menée, par exemple repousser ladate de fin de l’étude pour les durées censurées en 2012 et refaire les estimations précédentes.Aussi, considérer 2 échantillons pour chaque corridor, en prenant comme premier échantillon,les voyages qui ont traversé le premier check-point et pas le deuxième et comme deuxièmeéchantillon les voyages qui ont traversé le deuxième check-point et ne sont pas arrivés auxpostes frontières. Dans ce cas, faire plutôt une estimation non paramétrique de la loi desdurées de voyage en présence de durées censurées par intervalle. Proposer par exemple,un modèle de régression multiple pour expliquer les durées de voyage et voir si ce modèleretient ou suggère d’autres covariables que le modèle de Cox n’a pas fournies. Néanmoins,nous recommandons à la DGD de :

– s’assurer que les itinéraires des 2 corridors sont couverts par le réseau des opérateurstéléphoniques auxquels sont rattachés les GPS ;

– permettre des vitesses rapides, mais raisonnables (sans excès) ;– s’assurer du bon état des routes sur les itinéraires de ces corridors ;– s’assurer que les contrôles routiers sur les camions en transit sont limités.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

REVUE DE LA LITTERATURE 1

Chapitre 1

REVUE DE LA LITTERATURE

Peu de travaux ou revues ont traité le sujet de l’estimation statistique de la loi des duréesdans le but de proposer un indicateur relatif aux délais de voyage sur les corridors douaniers.L’historique de cette littérature ainsi que les méthodologies utilisées sont les suivantes :Missimahu Gabriel Jouvence SOUNOUVOU (2007) : Contribution à l’améliorationdu transport international de marchandises : Cas du corridor BENIN-NIGER. Il part dufait que l’acheminement des marchandises du BENIN vers le NIGER se heurte à une fouled’obstacles administratifs, techniques et logistiques. A l’aide d’une analyse descriptive surles données de la Revue Eco et Bulletins Annuels de Statistiques du Conseil Nigérien desUtilisateurs des Transports Publiques (CNUT) [3], il arrive à la conclusion selon laquelle,il serait judicieux de mettre en place des propositions d’optimisation du transport de mar-chandises, en passant par la qualité, tributaire de la facilitation du transit, de la rénovationet/ou de la construction d’infrastructures routières, de l’utilisation de moyens de transportplus modernes pour améliorer l’acheminement des marchandises du BENIN vers le NIGER.

Mathilde NJANKE TATCHOU (2008) : Transports et échanges commerciaux dansles pays de la CEMAC. Elle part du fait que les transports et échanges commerciaux dans lespays de la CEMAC souffrent quelque peu de l’insuffisance ou du manque d’infrastructuresde transports pouvant desservir la sous région. A l’aide d’une analyse descriptive sur lesdonnées du Delta Management, Décembre 2005 [2], elle arrive à la conclusion suivante : lespays de la zone CEMAC gagneraient à développer aussi bien les échanges intra-régionauxque les échanges multilatéraux. Ceci passe par des réformes telles que : doter les économiesd’infrastructures de qualité (routes, télécommunications, etc.), accélérer la mise en place dela réforme portuaire du Cameroun (la modernisation en cours des infrastructures du Port deDouala devrait accélérer la réduction des délais de passage), réduire autant que possible lesobstacles aux échanges entre les économies, appliquer les textes réglementaires notammentla libre circulation des personnes et des biens.

Le Bureau Sous Régional pour l’Afrique Centrale des Nations Unies (2009) :L’état d’avancement du Plan-Cadre pour l’Afrique Centrale en Matière de transports. Cebureau pose le problème de l’absence d’harmonisation des règles et des procédures. Le trans-port de transit Inter-États est confronté à une multitude de barrières le long des corridors

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

REVUE DE LA LITTERATURE 2

et les procédures douanières sont très complexes et coûteuses. En utilisant les données dela Banque Mondiale (2009) de l’étude sur le prix et le coût de transport en Afrique [4], ilpropose que l’Afrique Centrale devrait mettre en place des organes de gestion efficaces pourles corridors de transit afin de favoriser le dialogue entre les parties prenantes et contribuer àl’harmonisation des procédures et de la documentation relatives au transport de transit et àprofiter de l’opportunité de partenariat offerte par le programme des politiques de transporten Afrique Subsaharienne (SSATP) pour la formulation et la promotion des stratégies sainesde gestion des couloirs de transport.

Programme de facilitation du transport sur les corridors Douala-Bangui etDouala-N’djamena(2007) : Resumé du plan d’expropriation, de compensation et de ré-installation des populations. Il pose le problème du mauvais état des routes et chemins de ferle long des corridors Douala-Bangui et Douala-N’Djamena. La source de données n’a pas étéexplicitée. Néanmoins, il suggère d’aménager et de renforcer des routes des corridors Douala-N’Gaoundéré et Bouar-Garoua Boulai, la construction d’un pont à 2 voies d’une longueurde 230 m sur le Logone à Ngueli à la frontière entre le Cameroun et le Tchad, l’améliorationdu chemin de fer Douala-N’Gaoundéré. L’aménagement des travaux connexes et action etmesure de facilitation et du transport contribuera à coup sûr à l’amélioration des échangescommerciaux entre ces pays.

Groupement de cabinets SIM S.p.A/CRETES CA, Programme de facilita-tion du transport sur les corridors Douala-Bangui et Douala-N’Djamena(2011) :Mission d’enquêtes et suivi évaluation des impacts socioéconomiques du Programme de Fa-cilitation du Transport de Transit sur les Corridors Douala-N’Djamena et Douala-Bangui.Ce cabinet fait une analyse de sondage sur les acteurs de transit (transitaires, camionneurs)dans les pays de la zone CEMAC (Cameroun, Tchad, RCA) et fournit quelques indicateursrelatifs aux délais de transit. Il ressort de cette analyse de données de sondage que : En2008, la durée de voyage d’un camion de marchandises entre Douala et N’Djamena(entréeen douanes à Ngueli) était en moyenne de 7.9 jours, alors que celui en direction de Bangui(entrée en douanes à Mpoko) était en moyenne de 7.4 jours, soit des distances respectivesparcourues par jour de 233 kms pour le corridor de N’Djamena, et 196 kms pour celui deBangui. Les délais de voyage sont grevés non seulement par l’état du réseau routier qui nepermet de faire de grandes vitesses, mais également par :

– le temps mis dans les check points qui atteint respectivement 3 heures 39 minutes pourBangui et 4 heures 14 minutes pour N’Djamena ;

– la traversée des contrôles des postes frontaliers qui prend en moyenne 5 heures 43minutes à Garoua-Boulai/Beloko, et 4 heures 50 minutes pour Kousseri/Ngueli ;

– le temps total mis dans les stations de pesage est relativement court (37 minutes pourBangui, et 1 heures 40 minutes pour N’Djamena).

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DONNEES 3

Chapitre 2

DONNEES

2.1 Source des données

Les données utilisées proviennent de la base de données du projet «Nexus Plus» qui apour objectif de devenir le pilier technique du dispositif douanier camerounais de suivi del’acheminement des marchandises en transit par géolocalisation, assujetti aux objectifs desécurisation, de facilitation et de transparence. Cette base de données est fournie par lesagents du projet «Nexus Plus» (Douanes).

2.2 Identification des données

Les données traitées dans ce mémoire ont pour unité statistique une cargaison qui estidentifié par un code (identifiant) voyage. Elles concernent les voyages en transit douaniersvers le TCHAD et la RCA entre le 1er Janvier 2011 et 31 Décembre 2011. Ces voyages sont aunombre de 12866 repartis comme suit : 5510 voyages pour le corridor Douala-N’Djamena(duPAD au poste-frontière de Kousseri) et 7356 pour le corridor Douala-Bangui (du PAD auposte-frontière de Garoua-Boulai). Pour ces voyages, nous avons 16 variables. Les donnéesmanquantes n’ont pas été considérées ici parce que, certains de ces voyages quittent le PortAutonome de Douala (PAD) sans arriver aux postes-frontières Camerounais avec le TCHADet la RCA. Néamoins, sur les 5510 à destination du poste-frontière Kousseri (corridor Douala-N’Djamena), 753 ne sont pas arrivés. De même, sur les 7356 à destination du poste frontièreGaroua-Boulai (corridor Douala-Bangui), 825 ne sont pas arrivés. Pour chaque voyage, nousobservons donc :

Þ l’ itinéraire pris par les cargaisonsC’est l’itinéraire que prennent les cargaisons noté « code_itineraire ». Les codes itiné-raires utilisées sont : 7, 10, 35 représentant respectivement les itinéraires Douala PAD-Yassa-Bonis -Kousseri, Douala PAD-Yassa-Bonis-Garoua-Boulai et Douala-Bertoua-Kousseri.

Þ le bureau d’origine des cargaisons

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DONNEES 4

C’est le bureau de départ des cargaisons (bureau du PAD). Le code utilisé pour cebureau est CMDLP0.

Þ les bureaux de destination des cargaisonsCe sont les bureaux de destination des cargaison (bureaux des postes frontières deKousseri et de Garoua-Boulai). Les codes utilisés pour ces bureaux sont respectivementCMKSR0 pour le bureau de Kousseri et CMGBL0 pour le bureau de Garoua-Boulai.

Þ la date de départ gpsC’est la date de début voyage donnée par le GPS. Cette date est émise dès que lacargaison prend le départ.

Þ la date d’arrivée gpsC’est la date de fin voyage donnée par le GPS. Cette date est émise dès que la cargaisonarrive à destination.

Þ la date de départ douaneC’est la date de début voyage donnée par les agents de la Douane.

Þ la date d’arrivée douaneC’est la date de fin voyage donnée par les agents de la Douane.

Þ la date de départ nexusC’est la date de début voyage donnée par les agents Nexus.

Þ la date d’arrivée nexusC’est la date de fin voyage donnée par les agents Nexus.

Þ la personne CDA principalC’est la personne responsable du voyage ; c’est-à-dire la personne qui gère le voyage dubureau d’origine (CMDLP0) aux bureaux de destination (CMKSR0 et CMGBL0)

Þ le poids net de la cargaisonC’est le poids net de toutes les marchandises de la cargaison.

Þ le nombre colis de la cargaisonC’est le nombre de colis (groupage de marchandises en une pièce) de la cargaison.

Þ le nombre d’arrêts corridorC’est le nombre d’arrêts des camions qui transportent les cargaisons sur les corridorsDouala-N’Djamena et Douala-Bangui.

Þ le nombre de sorties corridorC’est le nombre de sorties des camions sur les corridors Douala-N’Djamena et Douala-Bangui ; c’est-à-dire le fait que les camions prennent un autre itinéraire que celui prévupar la Douane sur ces corridors.

Þ la vitesse maximale des camionsC’est la vitesse maximale atteinte par les camions qui effectuent les voyages sur lescorridors Douala-N’Djamena et Douala-Bangui.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DONNEES 5

Þ les dates d’arrivées aux check-pointsCe sont les dates d’arrivée aux Check-points (YASSA et Dang pour le corridor Douala-N’Djamena, YASSA et Bonis pour le corridor Douala-Bangui) appartenant aux corri-dors Douala-N’Djamena et Douala-Bangui. Ces dates sont émises par le GPS.

A partir de ces observations, nous avons défini les variables suivantes :

Þ la date de début du voyageC’est le récapitulatif des dates de départ GPS, Douane et Nexus. Lorsque toutes les3 dates ne coincident pas, on prend la date GPS. Lorsque la date GPS n’est pasrenseignée, on prend le minimum entre la date départ Douane et la date de départNexus. Cette spécification (manière de récapituler les dates) nous a été données parl’entreprise.

Þ la date de fin du voyageIdem que la précédente mais cette fois pour les dates de fin de voyage.

Þ la durée du voyageC’est la différence entre la date de fin du voyage et la date de début du voyage pourles voyages dont les durées sont non censurées ; pour les voyages dont les durées sontcensurées, c’est la différence entre la date de passage au dernier check-point et la datede début du voyage.

Þ l’état des voyagesC’est le statut des voyages. Il vaut 1 si les voyages sont non censurés, 0 sinon.

2.3 Description des données

1. Répartition des voyages par durées observées et non observées.Les tableaux 2.1, 2.2, 2.3 donnent les récapitulatifs des nombres respectifs des du-rées observées et non observées des voyages sur les corridors Douala-N’Djamena etDouala-Bangui données par le GPS, la Douane (SYDONIA) et par Nexus Plus. Lesdurées observées sont celles dont les cargaisons sont quittées du PAD et sont arrivéesaux postes-frontières de Kousseri (corridor Douala-N’Djamena) et de Garoua-Boulai(corridor Douala-Bangui). Tandis que, les durées non observées sont celles dont les car-gaisons sont quittées du PAD et ne sont pas arrivées aux postes-frontières de Kousseri(corridor Douala-N’Djamena) et de Garoua-Boulai (corridor Douala-Bangui). Quelquescauses de la non arrivée de certains voyages aux postes-frontières sur ces 2 corridors etdonc de la non observation des durées de ces voyages sont dues :– aux prétendus transitaires Camerounais malhonnêtes dont la cargaison était en fait

destinée au territoire national ;– à certains camionneurs qui mettent plus de temps que prévu à certains endroits sur

les corridors.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DONNEES 6

Table 2.1 – Récapitulatif des nombres de durées de voyages observeés et non observées parle GPS

corridors Nombre durées observées Nombre durées non observées TotalDouala-N’Djamena 2756 425 3181Douala-Bangui 3754 824 4578

Total 6510 1249 7759

Table 2.2 – Récapitulatif des nombres de durées de voyages observeés et non observeés parla Douane

corridors Nombre durées observés Nombre durées non observées TotalDouala-N’Djamena 782 4710 5492Douala-Bangui 323 7023 7346

Total 1105 11733 12838

Table 2.3 – Récapitulatif des nombres de durées de voyages observées et non observeés parNexus Plus

corridors Nombre durées observés Nombre durées non observées TotalDouala-N’Djamena 4731 42 4773Douala-Bangui 6044 24 6068

Total 10775 66 10841

Les différences énormes entre les nombres de durées de voyages observées et non ob-serveés données par le GPS, la Douane (SYDONIA) et les agents Nexus sont dues auxécarts d’intervention entre ces 3 entités (la signification des dates de début et d’arrivéevoyages de ces 3 entités étant donnée plus haut). Cependant, le dispositif d’observationle plus fiable est le GPS car c’est ce dispositif qui permet de suivre en temps réel lemouvement des camions le long des corridors. La figure 2.1 donne la répartition desdurées de voyage (observées ou non) enregistrés par le GPS, par la Douane (SYDO-NIA) et par Nexus Plus.A la lecture de la figure 2.1, nous constatons que : quelque soit le corridor, Nexus Plusrenseigne beaucoup plus de dates de fin voyage que le GPS et la Douane. Néamoins,dans la suite, nous allons considérer toutes les données dont les dates de début et defin voyages sont données par le GPS et en complètant (quant le GPS n’est pas ren-seigné) les dates de début et de fin voyages par celles données par la Douane et parNexus Plus (en prenant le minimun entre les 2). Nous obtenons : 5510 voyages pourle corridor Douala-N’Djamena dont 4757 ont des durées observées et 753 n’ont pasde durées observées ; 7356 voyages pour le corridor Douala-Bangui dont 6531 ont desdurées observées et 825 n’ont pas de durées observées.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DONNEES 7

Figure 2.1 – Comparaison durées observées et non observées

2. Estimations des densités des durées observées de voyage sur les corridorsDouala-N’Djamena et Douala-Bangui.La figure 2.2 présente les estimations des densités des durées observées de voyage surles 2 corridors.

Figure 2.2 – Estimation des densités des durées observées sur les corridors

D’après la figure 2.2, l’estimation de la densité des durées observées de voyage sur lecorridor Douala-N’Djamena ne suit pas une distribution normale (p-valeur < 2.2e-16)tandis que celle du corridor Douala-Bangui ne suit pas aussi une distribution normale(p-valeur < 2.2e-16). Cela veut dire que les durées observées de voyage sur les corridorsDouala-N’Djamena et Douala-Bangui ne sont pas normales.

3. Résumé statistique des durées observées de voyage sur les corridors Douala-

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DONNEES 8

N’Djamena et Douala-Bangui.La durée minimale observée d’un voyage sur le corridor Douala-N’Djamena est de 2jours et la durée maximale observée est de 330 jours. Cette durée maximale a un impactsur la moyenne (13.12 jours) calculée sous le logiciel R et peut s’expliquer par les arrêtsprolongés à certains endroits sur ce corridor. De même, la durée minimale observée d’unvoyage sur le corridor Douala-Bangui est de 2 jours et la durée maximale observée est de374 jours avec une moyenne relativement courte (6.81 jours) calculée sous le logiciel R.Toutefois, nous pouvons dire que la plupart des voyages respectent les délais fixés parla Douane (20 jours). Les voyages durent plus sur le corridor Douala-N’Djamena quesur le corridor Douala-Bangui. Le tableau 2.4 donne le résumé statistique des duréesobservées de voyage (en jours) sur les corridors Douala-N’Djamena et Douala-Bangui.

Table 2.4 – Résumé statistique des durées observées de voyageDouala-N’Djamena Douala-Bangui

Minimum 2 21er quartile 7 3Médiane 8 4Moyenne 13.12 6.81

3ème quartile 12 6Maximum 330 374

% respect délai 94.21 97.59

4. Description des variables pour le modèle explicatif des durées de voyage.Dans la description qui va suivre, nous allons utiliser les données pour lesquelles nousavons observés toutes les variables qui serviront à écrire le modèle explicatif des duréesde voyage (censurées ou non). Nous disposons donc de 325 voyages pour le corridorDouala-N’Djamena dont 317 ont des durées observées et 8 des durées non observées.De même, nous avons 145 voyages pour le corridor Douala-Bangui dont 135 ont desdurées observées et 10 des durées non observées.• Résumé statistique des variables explicatives sur le corridor Douala-N’Djamena.

Le tableau 2.5 donne le résumé statistique des variables explicatives sur le corridorDouala-N’Djamena. D’après le tableau 2.5, les cargaisons qui vont vers N’Djamenasont relativement lourdes (en moyenne 27076 kg), ce qui laisse croire qu’il s’agitd’importantes marchandises. Cela masque le fait qu’il y a aussi des petites cargai-sons (minimum de 200 kg). Le nombre de colis est aussi important avec en moyenneenviron 234 colis par cargaison. Les camions engagés sur ce corridor roulent à lavitesse maximale moyenne de 26.77 km/h. Notons que pour la variable « vitessemaximale », c’est le GPS qui fournit ses valeurs et nous prenons la vitesse maximale

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DONNEES 9

et non la vitesse tout simplement car c’est-elle qui peut significativement influer surla durée de voyage.

Table 2.5 – Résumé statistique des variables quantitatives corridor Douala-Ndjamenapoids_net (en Kg) nombre_colis vitesse_max (en Km/h)

Minimun 200 1 31er quartile 28000 1 19Médiane 30266 1 27Moyenne 27076 233.9 26.77

3ème quartile 30629 1 33Maximum 68686 6500 54

• Résumé statistique des variables explicatives sur le corridor Douala-Bangui.Le tableau 2.6 donne le résumé statistique des variables explicatives sur le corridorDouala-Bangui.

Table 2.6 – Résumé statistique des variables quantitatives corridor Douala-Banguipoids_net (en Kg) nombre_colis vitesse_max (en Km/h)

Minimun 1780 1 21er quartile 21679 14 16Médiane 26989 540 25Moyenne 24186 669.9 24.62

3ème quartile 28000 944.5 31.5Maximum 49942 3700 54

D’après le tableau 2.6, les cargaisons qui vont vers Bangui sont relativement lourdes(en moyenne 24186 kg), ce qui laisse croire qu’il s’agit d’importantes marchandises, leminimum étant de 1780 kg. Le nombre de colis est aussi important avec en moyenneenviron 670 colis par cargaison. Les camions engagés sur ce corridor roulent à lavitesse maximale moyenne de 24.62 km/h.

5. Tableaux de contingence entre les variables explicatives.• Représentation de la densité estimée des vitesses maximales sur les cor-

ridors Douala-N’Djamena et Douala-Bangui.La figure 2.3 nous donne les différentes densités estimées des vitesses maximalessur les corridors Douala-N’Djamena et Douala-Bangui avec les barres verticaux quireprésentent le partitionnement de la variable « vitesse maximale » en 2 classes.Notons que, la première classe, est considérée comme classe à faible vitesse (couleurverte) et la deuxième classe, est considérée comme classe à forte vitesse (couleurviolette).

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DONNEES 10

Figure 2.3 – Courbe des densités des vitesses maximales

La figure 2.3 nous montre que l’estimation de la densité des vitesses maximales sur lecorridor Douala-N’Djamena ne suit pas une distribution normale (p-valeur = 0.0073)tandis que celle du corridor Douala-Bangui suit une distribution normale (p-valeur= 0.5187). Cela veut dire que les vitesses maximales atteintes par les camions surle corridor Douala-Bangui sont normales que celles atteintes par les camions sur lecorridor Douala-N’Djamena.

• Recodage de la variable vitesse maximale.Nous allons recoder la variable vitesse maximale en variable qualitative constituéede 2 classes (classe 1 et classe 2). La classe 1 est considérée comme classe à faiblevitesse et la classe 2 quant à elle est considérée comme classe à forte vitesse. L’ob-tention de ces 2 classes s’est faite de manière logique après l’observation du nuage depoints des vitesses maximales en fonction des durées observées de voyages sur les 2corridors c’est-à-dire que, nous avons observées une coupure du nuage de points en 2parties (représentants les 2 classes définies précédemment). Le tableau 2.7 présentele recodage de cette variable sur les corridors Douala-N’Djamena et Douala-Bangui.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DONNEES 11

Table 2.7 – Recodage de la vitesse maximale en 2 classescorridors variable classe 1 (en km/h) classe 2 (en km/h)

Douala-N’Djamena vitesse maximale 3-29 30-54Douala-Bangui vitesse maximale 2-23 24-54

• Tableau de contingence entre l’itinéraire et la vitesse maximale sur les 2corridors.Dans les tableaux 2.8 et 2.9, les classes 1 et 2 sont définies comme précédemment etles itinéraires sont définis par : 7 = Douala PAD-Yassa-Bonis-Kousseri ; 10 = DoualaPAD-Yassa-Bonis-Garoua-Boulai ; 35 = Douala-Bertoua-Kousseri.

Þ Corridor Douala-N’DjamenaLe tableau 2.8 montre que : 199 voyages sur 317 roulent dans la tranche devitesse de classe 1 (3-29 km/h) sur l’itinéraire 7 (soit un pourcentage de 62.77%des voyages sur ce corridor). Nous observons aussi que, 101 camions roulent dansla tranche de vitesse de classe 2 (30-54 km/h) sur ce même itinéraire 7. Nouspouvons donc conclure que sur le corridor Douala-N’Djamena, l’itinéraire 7 estle plus emprunté. Par ailleurs, le test du khi-2 nous montre une dépendanceentre les variables itinéraire et vitesse maximale (p-valeur = 9.07e-04). Ce quipeut s’expliquer par le fait que, certains camionneurs peuvent rouler vite suritinéraire et non sur un autre.

Table 2.8 – Tableau de contingence entre l’itinéraire et la vitesse maximale corridor Douala-N’Djamena

`````````````````Itinérairesvitesse maximale

classe 1 classe 2

Douala PAD-Yassa-Bonis-Kousseri 199 101Douala-Bertoua-Kousseri 4 13

Þ Corridor Douala-BanguiLe tableau 2.9 montre que la proportion des camions roulant sur les 2 tranchesde vitesse est à peu près équilibré ; 45.92% pour la tranche de vitesse de classe1 (2-23 km/h) et 54.08% pour la tranche de vitesse de classe 2 (24-54 km/h).Néamoins, les vitesses maximales atteintes sur ce corridor restent faibles.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DONNEES 12

Table 2.9 – Tableau de contingence entre l’itinéraire et la vitesse maximale corridor Douala-Bangui

`````````````````Itinérairevitesse maximale

classe 1 classe 2

Douala PAD-Yassa-Bonis-Garoua-Boulai 62 73

• Tableau de contingence entre l’itinéraire et le nombre d’arrêts corridors.

Þ Corridor Douala-N’DjamenaLe tableau 2.10 montre que 290 voyages sur 317 (soit un pourcentage de 91.48%)ne font aucun arrêt sur le corridor Douala-N’Djamena via l’itinéraire 7. Parailleurs, le test du khi-2 nous montre une forte indépendance entre les variablesitinéraire et nombre d’arrêts corridor (p-valeur = 0.89). Ce qui signifie que lefait de s’arrêter sur le corridor ne dépend pas de l’itinéraire emprunté.

Table 2.10 – Tableau de contingence entre l’itinéraire et le nombre d’arrêts corridor Douala-N’Djamena

`````````````````ItinérairesNombre d’arrêts

0 2 3 4

Douala PAD-Yassa-Bonis-Kousseri 290 8 1 1Douala-Bertoua-Kousseri 17 0 0 0

Þ Corridor Douala-BanguiLe tableau 2.11 montre que 132 voyages sur 135 (soit un pourcentage de 97.77%)ne font aucun arrêt sur le corridor Douala-Bangui via le seul itinéraire 10.

Table 2.11 – Tableau de contingence entre l’itinéraire et le nombre d’arrêts corridor Douala-Bangui

`````````````````ItinéraireNombre d’arrêts

0 2 3

Douala PAD-Yassa-Bonis-Garoua-Boulai 132 1 2

• Tableau de contingence entre l’itinéraire et le nombre de sorties corridors.

Þ Corridor Douala-N’DjamenaLe tableau 2.12 montre que 247 voyages sur 317 (soit un pourcentage de 77.91%)ne sortent qu’une seule fois du corridor Douala-N’Djamena sur l’itinéraire 7.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DONNEES 13

Par ailleurs, le test du khi-2 nous montre une indépendance entre les variablesitinéraire et nombre sorties corridors (p-valeur = 0.46). Ce qui signifie que lefait de sortir du corridor ne dépend pas de l’itinéraire emprunté.

Table 2.12 – Tableau de contingence entre l’itinéraire et le nombre de sorties corridorDouala-N’Djamena

````````````````ItinérairesNombre de sorties

1 2 3 4 5

Douala PAD-Yassa-Bonis-Kousseri 247 39 7 4 3Douala-Bertoua-Kousseri 17 0 0 0 0

Þ Corridor Douala-BanguiLe tableau 2.13 montre que 98 voyages sur 135 (soit un pourcentage de 72.59%)ne sortent qu’une seule fois du corridor Douala-Bangui sur le seul itinéraire 10.

Table 2.13 – Tableau de contingence entre l’itinéraire et le nombre de sorties corridorDouala-Bangui

`````````````````ItinéraireNombre de sorties

1 2 3 4

Douala PAD-Yassa-Bonis-Garoua-Boulai 98 26 9 2

• Tableau de contingence entre le nombre d’arrêts et le nombre de sortiescorridors.

Þ Corridor Douala-N’DjamenaLe tableau 2.14 montre que 264 voyages sur 317 (soit un pourcentage de 83.28%)n’ont pas d’arrêt et ne sortent qu’une seule fois du corridor Douala-N’Djamena.Par ailleurs, le test du khi-2 nous montre une dépendance entre les variablesnombre d’arrêts et nombre de sorties corridor (p-valeur < 2.2e-16). Cela signifieque le fait de sortir du corridor est lié au fait de s’arrêter sur le corridor ce qui,peut s’expliquer par le fait que, certains camionneurs peuvent sortir du corridoret s’arrêter « quelque part » pour « décharger » les marchandises.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DONNEES 14

Table 2.14 – Tableau de contingence entre le nombre d’arrêts et le nombre de sorties corridorDouala-N’Djamena

hhhhhhhhhhhhhhhhhhhhhNombre d’arrêts

Nombre de sorties1 2 3 4 5

0 264 31 6 3 32 0 8 0 0 03 0 0 1 0 04 0 0 0 1 0

Þ Corridor Douala-BanguiLe tableau 2.15 montre que 98 voyages sur 135 (soit un pourcentage de 72.59%)n’ont pas d’arrêt et ne sortent qu’une seule fois du corridor Douala-Bangui. Parailleurs, le test du khi-2 nous montre une dépendance entre les variables nombred’arrêts et nombre de sorties corridor (p-valeur = 1.242e-05). Cela signifie quele fait de sortir du corridor est lié au fait de s’arrêter sur le corridor ce qui, peuts’expliquer par le fait que, certains camionneurs peuvent sortir du corridor ets’arrêter « quelque part » pour « décharger » les marchandises.

Table 2.15 – Tableau de contingence entre le nombre d’arrêts et le nombre de sorties corridorDouala-Bangui

hhhhhhhhhhhhhhhhhhhhhNombre d’arrêts

Nombre de sorties1 2 3 4

0 98 25 7 22 0 1 0 03 0 0 2 0

• Matrice de corrélation entre les variables explicatives quantitatives pourle corridor Douala-N’Djamena.Notons que, dans une matrice de corrélation, quand les valeurs (coefficients de cor-rélation) entre 2 variables sont positives, alors les 2 variables sont corrélées positive-ment. Dans le cas contraire, les 2 variables sont corrélées en sens opposé et lorsque lavaleur absolue de cette valeur est proche de 1 on dit que les 2 variables sont corrélées.Le tableau 2.16 nous suggère qu’aucune des trois variables (poids net, nombre coliset vitesse max) n’est corrélée avec une autre.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DONNEES 15

Table 2.16 – Matrice de corrélation corridor Douala-N’Djamenapoids_net nombre_colis vitesse_max

poids_net 1.000 -0.163 -0.016nombre_colis -0.163 1.000 -0.106vitesse_max -0.016 -0.106 1.000

• Matrice de corrélation entre les variables explicatives quantitatives pourle corridor Douala-Bangui.

Table 2.17 – Matrice de corrélation corridor Douala-Banguipoids net nombre colis vitesse max

poids net 1.000 0.143 -0.053nombre colis 0.143 1.000 -0.023vitesse max -0.053 -0.023 1.000

D’après le tableau 2.17, la conclusion précédente est aussi valable ici.

6. Représentation des durées de voyages en fonction du nombre d’arrêts et dunombre de sorties sur les corridors Douala-N’Djamena et Douala-Bangui.La figure 2.4 nous donne les différents diagrammes en moustaches des durées de voyageen fonction du nombre d’arrêts et du nombre de sorties sur les corridors Douala-N’Djamena et Douala-Bangui.

Þ Corridor Douala-N’Djamena.La figure 2.4 nous montre que le minimum, le premier quartile, la médiane etle troisième quartile des durées de voyage en fonction des voyages ayant 0 arrêtsont presque confondus. Cela signifie que la grande majorité des durées de voyagese situent au dessus de la moustache supérieur (maximum). Ce raisonnement estidentique pour les voyages ayant 1 sortie et 2 sorties corridor. Les traits noirsqui représentent les boites à moustaches des durées de voyage en fonction desvoyages ayant 2, 3 et 4 arrêts, 3, 4 et 5 sorties corridor signifient qu’il y a trèspeu, voir presque pas de voyages ayant ces caractéristiques. Les points que nousvoyons au dessus des moustaches supérieures sont considérés comme atypiquescar Q3+1.5*(Q3-Q1)< maximun des durées de voyage où Q1 = premier quartileet Q3 = troisième quartile.

Þ Corridor Douala-Bangui.La figure 2.4 nous montre aussi que : la distribution des durées de voyage enfonction des voyages ayant 0 arrêt sur ce corridor est étalée à droite cela veutdire que la plupart des durées de ces voyages sont au dessus de la médiane ; pourles voyages ayant 3 arrêts, la distribution des durées de voyage est symétrique (la

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

DONNEES 16

médiane est proche du centre de la boîte). Le trait noir qui représente la boite àmoustaches des durées de voyage en fonction des voyages ayant 2 arrêts corridorssignifient qu’il y a très peu voir presque pas de voyages ayant cette caractéristique.La distribution des durées de voyage en fonction des voyages ayant 1 sortie, 2sorties et 3 sorties corridor est étalée à droite cela veut dire que la plupart desdurées de ces voyages sont au dessus de la médiane. La distribution des duréesde voyage ayant 4 sorties corridor est symétrique. Les points que nous voyonsau dessus des moustaches supérieures sont interprétés comme pour le corridorDouala-N’Djamena.

Figure 2.4 – Distribution des durées en fonction du nombre d’arrêts et du nombre de sorties

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 17

Chapitre 3

METHODOLOGIE STATISTIQUE

3.1 Estimation non paramétrique de la loi des durées devoyage en situation de durées non censurées

3.1.1 Motivation

L’idée de cette motivation est de penser que, les voyages qui n’arrivent pas à la frontièresont ceux de prétendus transitaires Camerounais malhonnêtes dont la cargaison était en faitdestinée au territoire national et ceux qui sont censurés par la date de fin de notre étudec’est-à-dire le 31/12/2011. Dans ces conditions, nous pouvons supputer que les vrais voyagessont (à quelques exceptions près), en fait, ceux qui arrivent vraiment au poste-frontière oùils étaient destinés. Et donc que ce sont eux qui constituent l’échantillon représentatif desvoyages sur un corridor.

Ci-après, nous nous appuyons sur le cours de Statistiques Mathématiques dispensé auMaster de Statistique Appliquée de l’ENSP par le Dr. Jean Jules TEWA pour l’année aca-démique 2010-2011.

3.1.2 Estimation de la fonction de répartition de la loi des duréesde voyage

Soit à estimer la loi des durées de voyage T pour un corridor arbitraire, à partir desobservations T1 = t1, · · · , Tn = tn, i.i.d

L; T où n est le nombre de voyages effectivement

arrivés au poste-frontière sur ce corridor arbitraire et L; signifie convergence asymptotiqueen loi.La loi de T, PT est caractérisée par sa fonction de répartition FT :

∀t ∈ R, FT (t) = Pr(T ≤ t).

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 18

Nous pouvons estimer FT sur R par la fonction de répartition empirique associée à l’échan-tillon t = (t1, · · · , tn), soit Ft définie par :

∀t ∈ R, Ft(t) =card {i/ti ≤ t}

n=

1

n

n∑i=1

1{ti≤t}

3.1.3 Estimation de la moyenne de la loi des durées de voyage T

Sous les mêmes hypothèses que le précedent, nous estimons la moyenne de la loi desdurées de voyage T , µ :

µ =1

n

n∑i=1

ti,

par l’estimateur de la moyenne empirique, soit Tn définie par :

Tn =1

n

n∑i=1

Ti.

Tn est un estimateur sans biais de µ car,

E(Tn) = µ.

Tn est un estimateur convergent car,

V ar(Tn) =σ2

n−→ 0, quand n→ +∞.

3.1.4 Estimation de la variance de la loi des durées de voyage T

Nous estimons la variance de la loi des durées de voyage T , σ2 :

σ2 =1

n

n∑i=1

(ti − µ)2,

par l’estimateur de la variance empirique, soit S2n définie par :

S2n =

1

n− 1

n∑i=1

(Ti − Tn)2.

3.1.5 Estimation des quantiles de la loi des durées de voyage T

Nous estimons le quantile de la loi des durées de voyage T , qα (α est un seuil fixé) telque :

FT (qα) = α,

par le quantile empirique, soit qα tel que :

Ft(qα) = α.

Notons que : le quantile d’ordre 0.5 est la médiane de la loi des durées de voyage T .

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 19

3.1.6 Intervalle de confiance de la moyenne de la loi des durées devoyage T

A partir des observations T1 = t1, · · · , Tn = tn, i.i.dL; T , et pour n grand, nous supposons

que TnL∼ N

(µ, σ

2

n

). Puisque σ2 est inconnue (estimée par S2

n), alors√n(Tn−µ)Sn

L∼ T (n − 1)

où Sn est l’écart-type empirique de la loi des durées de voyage T et T (n − 1) est la loi destudent à n− 1 degré de liberté. Ainsi ,

IC1−α =

[Tn ±

Sn.q1−α2√

n

]est l’intervalle de confiance de niveau de confiance 1 − α pour la moyenne µ où q1−α

2est le

quantile d’ordre 1− α2de la loi de student à n− 1 degré de liberté.

3.2 Estimation non paramétrique de la loi des durées devoyage en situation de durées censurées à droite

3.2.1 Motivation

L’idée de cette motivation est de penser que, certains camionneurs mettent plus detemps que prévu à certains endroits sur les corridors Douala-N’Djamena et Douala-Banguiet qu’ils finiront par arriver un jour, peut être après la date de fin d’étude (31/12/2011).Dans ces conditions, nous pouvons supputer que, pour notre période d’étude (01/01/2011−31/12/2011), ces voyages doivent être considérés dans l’échantillon comme des voyages dontles durées sont censurées à droite (voyages qui sont quittés du PAD et qui ne sont pas arrivésau poste-frontière de Kousseri pour le corridor Douala-N’Djamena et ceux qui sont quittésdu PAD et qui ne sont pas arrivés au poste-frontière de Garoua-Boulai pour le corridorDouala-Bangui).

Ci-après, nous nous appuyons sur le cours de durées censurées dispensé au Master deStatistique Appliquée de l’ENSP par le Dr. NDONG NGUEMA pour l’année académique2011-2012.

3.2.2 Cadre de travail

Il s’agit ici d’estimer la loi de la durée qu’un voyage peut mettre lorqu’il quitte le PADpour les destinations Kousseri (frontière avec le TCHAD) et Garoua-Boulai (frontière avecla RCA).Pour apporter une solution à cette problématique, nous allons considérer que : pour uncorridor arbitraire, nous associons une durée Ti à un voyage i. Nous avons donc deux cas :

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 20

– cas 1 : Les voyages qui sont quittés du PAD et qui sont arrivés à Kousseri ou àGaroua-Boulai. Dans ce cas, nous observons Ti.

– cas 2 : Les voyages qui sont quittés du PAD et qui ne sont pas arrivés à Kousseri ouà Garoua-Boulai. Dans ce cas, nous n’observons pas Ti. Cela veut dire que la durée Tia été censurée et dans ce cas, il existe une durée de censure Ci qui est positive.

Ces 2 situations sont présentées sur la figure 3.1.

Figure 3.1 – Exemples de durées observées et de durées non observées

L’objectif étant d’estimer la loi des durées de voyage, nous allons considérer que les voyagesdu cas 2 sont censurés et nous notons leur durée de censure Ci qui s’obtiendra en faisantla différence entre la date de passage au dernier check-point et la date de début du voyage.Ainsi, si nous notons Xi la durée effective d’un voyage i, nous avons :Xi = Ti si le voyage i est non censuré, c’est-à-dire Ti ≤ Ci

Xi = Ci pour un voyage i censuré, c’est-à-dire Ti > Ci.Notons ∆i la variable aléatoire qui vaut 1 si le voyage i est non censuré, et 0 si le voyage iest censuré.Ainsi, au couple (Ti, Ci), on associe le couple (Xi,∆i) qui est l’information disponible sur levoyage i avec Xi = min (Ti, Ci) et ∆i = 1Ti≤Ci .Problème : Estimer la loi des durées de voyage en présence de la censure à droite.Hypothèse : Nous allons supposer que les durées de voyage sont indépendantes des duréesde censure.

3.2.3 Approche pour l’estimation de la fonction de survie

Pour répondre au problème précédent, nous allons faire une estimation non paramétriquede la fonction de survie de la loi des durées de voyage T : ainsi, pour une durée de voyage tdonnée positive, la fonction de survie est :

ST (t) = Pr(T > t)

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 21

.

3.3 Estimateur de Kaplan-Meier

3.3.1 Construction

Nous considérons l’information disponible sur les différents voyages, c’est-à-dire

(Xi,∆i) = (xi, δi) , i = 1, · · · , n, i.i.d L∼ (X,∆)

avec X = min (T,C) , ∆ = 1T≤C .

Soient{t(1), · · · , t(L)

}, l’ensemble des durées de voyage distinctes et non censurées dans

l’échantillon, i.e{t(1), · · · , t(L)

}= {xi/δi = 1} /t(1) < · · · < t(L).

Principe d’estimation de ST

On estime la loi des durées de voyage T par une loi discrète concentrée sur l’ensemble{t(1), · · · , t(L)

}, qu’on va noter PT

KM, et dont la fonction de survie associée ST

KMsera pris

comme estimateur de la vraie ST . On définit STKM

comme suit :

1. Pour t = t(0) = 0, ST(t(0)

)= Pr

(T > t(0)

)est estimée par :

STKM (

t(0)

)= 1, car t(0) < t(1)

2. Pour l ∈ {1, · · · , L}, par récurrence, supposons déjà calculée STKM (

t(l−1)

)comme

estimation de ST(t(l−1)

)= Pr

(T > t(l−1)

).

Ainsi, l’estimation de ST (t(j)) est donnée par :

STKM

(t(j)) =

(1− dj

n−j

)∗ ST

KM (t(j−1)

)

⇒ ∀l = 1(1)L, STKM (

t(l))

=l∏

j=1

(1− dj

n−j

)(3.1)

où n−j = nombre de voyages à risque en t(j), c’est-à-dire observés en t(j).

dj = nombre de voyages arrivés à destination en t(j).

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 22

3.3.2 Rappels des propriétés asymptotiques de STKM

Théorème 3.3.1 Soit TX = inf {x > 0/SX(x) = 0}.On a :

1. ∀t fixé dans [0, TX [, STKM

(t) est un estimateur asymptotiquement sans biais de ST (t),c’est-à-dire E

[ST

KM(t)]−→ ST (t) quand n → +∞ ;

2. ∀t ∈ [0, TX [, fixé, on a STKM

(t)PS−→ ST (t) ;

3. ∀T ∈ [0, TX [, fixé, on a :

supt∈[0,T ]

∣∣∣STKM(t)− ST (t)∣∣∣ PS−→ 0;

4. ∀t ∈ [0, TX [, fixé, on a :

√n[ST

KM(t)− ST (t)

]L−→ N

(0, σ2(t)

), quand n→ +∞

oùL−→ signifie convergence en loi et σ2(t) = [ST (t)]2 .IT,C(t),

avecIT,C(t) = −

∫dST (u)

[ST (t)]2 .SC(u)

où ST (u) est la fonction de survie associée à T et SC(u) est la fonction de survieassociée à C.

3.3.3 Estimation de la variance de STKM

(t), ∀t fixé ≥ 0

On estime la variance V ar[ST

KM(t)]par :

ˆV arG

[ST

KM(t)]

=[ST

KM(t)]2

.∑

j/t(j)≤t

dj

n−j(n−j − dj

)C’est la formule de Greenwood

3.3.4 Intervalle de confiance pour ST (t), ∀t fixé > 0

Théorème 3.3.2 (Méthode delta dans R)Si Θn est un estimateur d’un paramètre réel θ et vérifiant

√n(

Θn − θ)

L−→ N(0, σ2

)quand n→ +∞,

alors ∀g : R −→ R de classe C2 dans un voisinage de θ ∈ R et telle que g′(θ) 6= 0, on a :

√n[g(

Θn

)− g(θ)

]L−→ N

(0, σ2 [g′(θ)]

2)

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 23

En utilisant le théorème précédent et la bijection g : ]0, 1[−→ R définie par :

∀p ∈]0, 1[, g(p) = ln(− ln p)

on arrive alors à :

ˆIC1−α [ST (t)] =

[{ST

KM(t)} 1ρ,{ST

KM(t)}ρ]⊂ [0, 1], (3.2)

ρ = exp

Z1−α/2.

√ˆvar[ST

KM(t)]

STKM

(t). ln[ST

KM(t)] ,

avec Z1−α/2 le quantile d’ordre 1− α/2 de la loi normale centrée-réduite.

3.3.5 Estimation de la moyenne, de la variance et de la médiane dela loi des durées de voyage T

Moyenne de la loi des durées de voyage T

La formule théorique de la moyenne de la loi des durées de voyage T est donnée par :

mT = E(T ) =

∫ +∞

0

ST (t)dt

et on estime cette moyenne par :

mT =L−1∑l=0

STKM (

t(l)).[t(l+1) − t(l)

]. (3.3)

Il est à noter que cette expression n’est possible que lorsque t(L) = x(n) = max1≤i≤n

xi car il s’agit

du dernièr instant pour lequel on peut observer la durée de voyage t(L). Pour t(L) < x(n), onne peut pas calculer mT .

Variance de la loi des durées de voyage T

La formule théorique de la variance de la loi des durées de voyage T est donnée par :

V ar(T ) = 2.

∫ +∞

0

t.ST (t)dt− (mT )2 où mT = E(T )

et on estime cette variance dans le cas t(L) = x(n) = max1≤i≤n

xi par :

ˆV ar(T ) =L−1∑l=0

STKM (

t(l)) [

(t(l+1))2 − (t(l))

2]−

(L−1∑l=0

STKM (

t(l)).[t(l+1) − t(l)

])2

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 24

Médiane de la loi des durées de voyage T

La médiane de T est le temps à partir duquel 50% des voyages durent au plus ce tempset 50% des voyages durent plus que ce temps. On va estimer la médiane de T , med(T ), parmed

(PT

KM)définie par :

med(PT

KM)

= inf

{t ≥ 0 / ST

KM(t) ≤ 1

2

}

⇒ med(PT

KM)

= t(l) / STKM

(t(l)) ≤1

2< ST

KM(t(l+1)) (3.4)

Procédure bootstrap pour calculer le biais, la variance et l’IC de l’estimation dela moyenne de la loi des durées de voyage T

On considère une statistique réelle T (X) fonction des observations de l’échantillon :X1, · · · , Xn. Ici, T (X) représente l’estimation de la moyenne (formule (3.3)) de la loi desdurées de voyage T .Supposons qu’on souhaite estimer une caractéristique de T (X) en tant que variable aléatoireréelle (v.a.r), par exemple m = E [T (X)]

1. Fixer un entier B « grand »En suite, on va simuler B réalisations indépendantes et identiquement distribués (i.i.d)de la v.a.r T (X∗) avec X∗ = (X∗1 , · · · , X∗n) où X∗1 , · · · , X∗n sont i.i.d selon la loi px(c’est la loi empirique de x qui est l’échantillon empirique de l’estimateur de KM de laloi des durées de voyage pour un corridor arbitraire)

2. On simule successivement

x∗1 = (x∗11, · · · , x∗1n) i.i.dL∼ px

x∗2 = (x∗21, · · · , x∗2n) i.i.dL∼ px

...

x∗B = (x∗B1, · · · , x∗Bn) i.i.dL∼ px

3. On calcule :t∗1 = T (x∗1), · · · , t∗B = T (x∗B) ∈ R, qui sont des réalisations i.i.d de la loi T (X∗)

4. On estime alors m∗ et donc la vraie valeur m = E [T (X)] par :

m∗B =1

B

B∑k=1

t∗k

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 25

5. Estimation de la variance de T (X) :

σ∗B =1

B − 1

B∑k=1

(t∗k − m∗B)2

Supposons que T (X) est l’estimateur d’un paramètre réel inconnu θ, alors : L’estima-tion concrète de θ est : θ = T (x)

6. Estimation du biais b(T (X)/θ) = E [T (X)]− θ par :

b∗B = m∗B − θ

7. Intervalle de confiance pour θ de niveau 1− α, pour α ∈]0, 12[ :[

t∗B,α2, t∗B,1−α

2

], par défaut α = 0.05

3.3.6 Comparaison des échantillons de la loi des durées de voyageT : Le test du log-rank

Dans le but de savoir si les échantillons de la loi des durées de voyage des corridorsDouala-N’Djamena et Douala-Bangui sont issus de la même loi de durée, nous allons faireun test de comparaison des 2 échantillons : (x1, δ1) pour le corridor Douala-N’Djamena, et(x2, δ2) pour le corridor Douala-Bangui avec les hypothèses suivantes :

– (H0) : Les 2 échantillons (x1, δ1) et (x2, δ2) sont des échantillons indépendants et iden-tiquement distribués (i.i.d) d’une même loi de durée de voyage T0.

– (H1) : Les 2 échantillons (x1, δ1) et (x2, δ2) sont des échantillons i.i.d de 2 lois de duréesde voyage différentes.

La statistique de test est donnée par :

Vw =∥∥∥~Zw∥∥∥2

Σ−1w

= ~Ztw.Σ

−1w . ~Zw,

dont la valeur observée sur les données est :

vw = ‖~zw‖2Σ−1w

= ~ztw.Σ−1w .~zw

où ~zw est le vecteur observé dans R, ~zw = (z(1,w)), donnée pour les 2 échantillons par :

z1,w =M∑l=1

Wl.

(dl,1 −

n−l,1n−l

.dl

),

pour le test du log-rank, Wl = 1, ∀l = 1, · · · , M

⇒ z1,w =M∑l=1

(dl,1 −

n−l,1n−l

.dl

)Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 26

et Σ−1w est l’estimation de l’inverse de la matrice de variance-covariance de ~Zw dont Σw est

donnée par :

Σw = (C11), avec

C11 = σ211 =

M∑l=1

(1−

n−l,1n−l

).n−l − dln−l − 1

.dl

La loi asymptotique de Vw sous (H0) quand n1, n2 −→ +∞ est donnée par :

VwL→ χ2

1 quand n1, n2 −→ +∞

Ainsi, Pour un seuil α ∈]0, 1[, en notant χ21(α), le α-quantile de la loi du chi2 à 1 degré de

liberté le test est le suivant :

Si vw > χ21(1− α)

alors accepter (H1)

sinon rejetter (H1)

3.4 Estimation semi-paramétrique de la loi des durées devoyage : Le modèle de Cox

La méthodologie utilisée ici jusqu’à l’estimation du paramètre β du modèle est tirée ducours de durées censurées dispensé au Master de Statistique Appliquée de l’ENSP par le Dr.NDONG NGUEMA pour l’année académique 2011-2012.

3.4.1 Cadre de base

Pour un corridor arbitraire, soit une v.a.r T > 0, représentant la durée de voyage sur cecorridor c’est-à-dire le temps à la réalisation de l’évènement « arrivée aux postes-frontières». On s’intéresse ici au problème de savoir :

• Dans quelle mesure certaines covariables Z1, · · · , Zp (p = nombre de covariables),connues et observables sur les voyages d’un corridor, impactent :– sur la durée T,– ou sur le risque de réalisation de l’événement sur un voyage ;

• et, notamment, ces covariables (ou certaines d’entre elles) expliquent-elles mieux lesdifférences observées sur les valeurs de T ou le risque instantané de l’événement au fildu temps entre certains sous-groupes de l’ensemble des voyages.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 27

3.4.2 Le modèle de Cox

On suppose qu’il ∃ h0, fonction ≥ 0 sur R+ et ~β = (β1, · · · , βp) ∈ Rp tels que l’on ait

(C)

{∀~z = (z1, · · · , zp), ∀ ≥ 0,

hT/~z(t) = h0(t).e<~β,~z>

Fonction de risque instantané de base h0.

Dans le modèle (C), on a, ∀t ≥ 0 :

hT/~0(t) = h0(t),

⇒ h0 est la fonction de risque instantané de T conditionnement à ~Z = ~0, c’est-à-dire quandil n’y a pas d’effet des covariables.Le principal problème ici est alors de savoir comment le risque à ~Z = ~0, représenté par h0,est affecté, à tout instant, par la présence effective des covariables.

Paramètre d’intérêt-Paramètre de nuisance

Fondamentalement, notre problème ici est détudier l’effet des covariables sur le risque deréalisation de l’événement d’intérêt (arrivée aux postes-frontières), et donc de mesurer nonpas le risque instantané conditionnel absolu sachant ~Z = ~z, c’est-à-dire

hT/~z(t)

mais plutôt le risque instantané conditionnel relatif sachant ~Z = ~z, c’est-à-dire le rapport

hT/~z(t)

hT/~0(t)

soit, dans le modèle de Cox :hT/~z(t)

h0(t)= e<

~β,~z>,

⇒ il suffit d’estimer ~β⇒ ~β est le paramètre d’intérêt dans (C).Mais comme la fonction h0 qui apparaît aussi dans (C) est inconnue, c’est un paramètre denuisance dans ce problème.

3.4.3 Estimation des paramètres dans le modèle (C)

Observations : rappel

L’estimation doit se faire à base d’observation de T dont certaines sont censurées à droite,et des valeurs observées des covariables sur tous les voyages, soit les observations :

(Xi,∆i, Zi) = (xi, δi, zi), i = 1, · · · , n, i.i.d. L∼ (X,∆, ~Z).

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 28

Estimation de β

Initialement, nous maximisons par rapport à ~β, la log-vraisemblance conditionnelle de(X,∆) sachant ~Z :

Vx,δ/~z(~β, h0) =n∏i=1

fX,∆/~zi(xi, δi),

ce qui ramène encore à maximiser :

VTx,δ/~z(~β, h0) =n∏i=1

{[fT/~zi(xi)

]δi . [ST/~zi(xi)]1−δi}=

n∏i=1

{[h0(xi).e

<~β,~zi>]δi.e−HT/~zi (xi)

}Notons alors H0, la fonction de risque cumulée associées à h0 ; c’est-à-dire

∀t ≥ 0, H0(t) =

∫ t

0

h0(s)ds.

celle-ci est aussi inconnue que h0, mais lui est intrinsèquement liée. Or, dans (C), nous avons

HT/~z(t) = H0(t).e<~β,~z>.

⇒ Pour maximiser VTx,δ/~z(~β, h0) par rapport à ~β, il suffit de le faire pour

LTx,δ/~z(~β, h0) = lnVTx,δ/~z(~β, h0)

= < ~β, W > +n∑i=1

[δi. lnh0(xi)−H0(xi).e

<~β,~zi>]

où W =n∑i=1

δi.~zi =n∑i=1δi=1

~zi.

Estimation de h0

Le paramètre h0 est cherché parmi les fonctions de risque instantané de durées discrètesconcentrées sur les instants d’observation effective des durées de voyages t(1) < t(2) < · · · <t(L) tel que :

(α1)

{∀t /∈

{t(1), · · · , t(L)

}, h0(t) = 0,

∀j = 1, · · · , L, h0(t(j)) = Cj > 0;

⇒ La fonction de risque cumulé discrète H0 correspondante sera donnée par :

∀t ≥ 0, H0(t) =∑

j/t(j)≤t

h0(t),

i.e. H0(t) =L∑j=1

Cj.1t(j)≤t, (α2)

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 29

⇒ H0 est une fonction en escalier, constante sur chaque intervalle [t(j), t(j+1)[. Estimer doncles paramètres précédent revient à chercher le couple (β, h0) vérifiant :

(β, h0) = arg max(~β,h0)

lnV(~β, h0),

pour ~β parcourant Rp, et h0 de la forme (α1)

On montre que β s’obtient en maximisant numériquement la fonction L(~β) définie par :

L(~β) =< ~β, W > −L∑j=1

dl. ln

(n∑i=1

e<~β,~zi>.1t(j)≤xi

)(DROESBEKE et al., 1989)

où dl =n∑i=1

δi.1t(l)≤xi est le nombre de voyages vus à l’arrivée dans l’échantillon à l’instant

t(j), W =n∑i=1

δi.zi, et on prend :

h0 = hβ (Cox et al., 1984)

Par la suite, il s’agira de faire l’étude théorique de la validation du modèle de Cox, de sondiagnostic et du test de ces paramètres. La méthodologie statistique utilisée pour toutes cesparties est tirée du document [13].

3.4.4 Diagnostics du modèle de Cox

Le diagnostic du modèle consiste en : la vérification de l’hypothèse d’un modèle à risquesproportionnels et déceler les observations anormalement influentes.

Vérification de l’hypothèse de risque proportionnel

Pour valider le modèle de Cox, nous devons vérifier l’hypothèse d’un modèle à risquesproportionnels (forme multiplicative et covariables indépendantes du temps). Pour cela, plu-sieurs méthodes sont proposées :

– Tracer les graphes de la fonction de survie estimée (resp. fonctions de risque estimées)en fonction du temps pour les différents sous-ensembles de valeurs des covariables : ondoit obtenir des courbes proportionnelles (translatées).

– Tests basés sur les résidus de Schoenfeld : L’analyse des résidus de Schoenfeld permetde tester pour chaque covariable Zj :

H0 : βj(t) = βj contre H1 : βj(t) 6= βj, j ∈ {1, · · · , p}

où βj(t) est le paramètre associé à la covariable Zj pour un temps t donné et p est lenombre de covariables.En Supposant qu’il y ait un ou plusieurs coefficients dépendant du temps, nous notons :

s∗ij = βj(t(i))− βj où i ∈ {1, · · · , n}

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 30

Test graphique des résidus de Schoenfeld : pour chaque covariable j, on trace s∗ij enfonction du temps de réalisation de l’évènement « arrivée aux postes-frontières » : lesrésidus doivent être répartis aléatoirement à l’intérieur d’une bande horizontale centréeen zero (indépendance). Pour plus de lisibilité, on lisse ces courbes par des splines.Test analytique des résidus de Schoenfeld : pour chaque covariable j, on effectue larégression des résidus sur le temps :

s∗ij = ati + εi, i = 1, · · · , n en testant la nullité de a.

Notons que : le logiciel R calcule la corrélation entre les résidus et une fonction dutemps basée sur l’estimateur de KM.

Influence des observations

On cherche à vérifier que les coefficients du modèle ne sont définis qu’à partir d’unpetit nombre d’observations mais qui correspondent bien à l’ensemble des voyages c’est-à-dire qu’on vérifie s’il y a des observations influentes pour certaines covariables. On comparel’ordre de grandeurs des plus grands résidus aux coefficients, s’ils sont petits par rapport auxvaleurs des coefficients, alors, il n’y a pas d’observations anormalement influentes.

3.4.5 Test sur les paramètres du modèle de Cox

Le but de ce test est d’étudier les covariables qui ont un effet significatif sur les duréesde voyage. La procédure de test est la suivante :

– Hypothèses de testHypothèse nulle (H0) : β1 = · · · = βp = 0 où p est le nombre de covariables dans lemodèleHypothèse alternative (H1) : ∃j ∈ {1, · · · , p} /βj 6= 0

– Statistique de test

zj =

√nβj√V (βj)

= valeur de la statistique de Wald, j ∈ {1, · · · , p}

Sous (H0), zj → N(0, 1)

– P-valeur de testpj = P (|U | > zj) = p− valeur, où U ∼ N(0, 1)

– TestPour un seuil α fixé,

Si p− valeur ≥ α, alors la variable n’est pas significative.

Sinon la variable est significative.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 31

3.4.6 Analyse de l’ajustement du modèle de Cox

L’analyse de l’ajustement du modèle de Cox permet de vérifier la qualité d’ajustementglobal du modèle, de tester la significativité de l’effet de chaque covariable sur la durée etd’analyser l’exponentielle des coefficients du modèle.

Qualité d’ajustement globale du modèle :

Lorsque l’une au moins des 3 p-valeurs des tests de Wald, du Score (log-rank) et du Ratio(rapport de vraisemblance) est inférieure au seuil α fixé, il existe au moins une covariableinfluente sur la durée.

Significativité de l’effet de chaque covariable sur la durée :

Lorsque la p-valeur pour le test de Wald de la covariable j est inférieure au seuil α fixé,la covariable j influe de façon significative sur la durée.

Remarque 3.4.1 Le test de Wald teste l’effet d’une covariable, les autres étant dans lemodèle. S’il n’est pas significatif, cela ne veut pas dire qu’il ne le serait pas dans le modèleconstitué uniquement de cette covariable.

L’exponentielle des coefficients du modèle :

L’exponentielle des coefficients mesure l’effet multiplicatif d’une augmentation d’uneunité de la covariable sur la durée (ceci après standardisation des covariables), toutes choseségales par ailleurs.

3.4.7 Sélection de covariables

La sélection des covariables permet d’une part d’examiner la colinéarité entre les cova-riables et d’autre part de sélectionner celles qui sont pertinentes pour le modèle de Cox.

Examen de la colinéarité :

Il s’agit ici d’étudier les corrélations entre les différentes covariables. Deux covariablesseront colinéaires dans le même sens (respectivement dans le sens contraire) si le coefficientde colinéarité entre ces 2 covariables est proche de 1 (respectivement proche de -1).

Sélection des covariables pertinentes :

La sélection de covariables se fait pas à pas en enlevant celle dont la statistique de Waldest la plus faible (p-valeur la plus élevée), on refait tourner le modèle et on recommencejusqu’à obtention de toutes les covariables significatives. Ce critère de sélection s’apparente

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

METHODOLOGIE STATISTIQUE 32

au critère de l’AIC procédure « backward » qui consiste à : on part du modèle saturé (modèleutilisant toutes les covariables) au modèle utilisant un sous-ensemble de covariables ayantfourni le plus petit AIC. Par définition, l’AIC pour un modèle à p paramètres est :

AIC = −2 lnV + 2p. (Rouvière, 2008)

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 33

Chapitre 4

RESULTATS

4.1 Préambule

L’événement d’intérêt ici est l’arrivée des voyages aux postes-frontières (Kousseri pourle corridor Douala-N’Djamena et Garoua-Boulai pour le corridor Douala-Bangui). Ainsi,tous les voyages qui ne sont pas vus à l’arrivée seront considérés comme étant des voyagesdont les durées sont censurées. Il s’agit d’une censure à droite. Nous donnons dans la suitela répartition des voyages dont les durées sont censurées ou non sur les corridors Douala-N’Djamena et Douala-Bangui.

– Corridor Douala-N’DjamenaSur les 5510 voyages sur ce corridor, 4757 sont vus à l’arrivée et 753 voyages ne sontpas vus à l’arrivée. Les 4757 voyages vus à l’arrivée sont les voyages dont les duréessont non censurées et les 753 voyages qui ne sont pas vus à l’arrivée sont les voyagesdont les durées sont censurées à droite.

– Corridor Douala-BanguiSur les 7356 voyages sur ce corridor, 6531 sont vus à l’arrivée et 825 voyages ne sontpas vus à l’arrivée. Les 6531 voyages vus à l’arrivée sont les voyages dont les duréessont non censurées et les 825 voyages qui ne sont pas vus à l’arrivée sont les voyagesdont les durées sont censurées à droite.

Notons que pour les durées de voyage non censurées, le temps de réalisation de l’événementd’intérêt est la différence entre la date de fin voyage et la la date de début voyage. Pour lesdurées de voyages censurées, le temps de censure est la différence entre la date de passageau dernier check-point (poste de contrôle) et la la date de début voyage.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 34

4.2 Estimation non paramétrique de la loi des durées devoyage en situation de durées non censurées

4.2.1 Estimation des quantiles de la loi des durées de voyage ensituation de durées non censurées

Dans cette sous-section, nous nous appuyons sur la sous-section 3.1.5 du chapitre 3 denotre document.

Corridor Douala-N’Djamena

Le tableau 4.1 donne les estimations des quantiles des durées à 10%, à 25%, à 50%, à75%, à 80%, à 90%, à 95% et à 99% de la loi des durées de voyage en situation de duréesnon censurées sur le corridor Douala-N’Djamena.

Table 4.1 – Estimation des quantiles de la loi des durées en situation de durées non censuréescorridor Douala-N’Djamena

Quantiles Durées de voyages (en jours)10% 625% 750% 875% 1280% 1390% 1795% 2299% 98.88

D’après le tableau 4.1, 50% des voyages durent au plus 8 jours et 50% des voyages durentplus de 8 jours sur le corridor Douala-N’Djamena, 95% des voyages durent au plus 22 jourssur ce corridor. Nous remarquons aussi que, le quantile estimé des durées à 99% est élevé(98.88 jours) ce qui veut dire que, quelques voyages ont des durées très élevées. Cela expliquele grand bond qu’il y a entre le quantile estimé des durées à 95% et le quantile estimé desdurées à 99% (de 22 jours à 98.88 jours). Nous allons donc définir un « critère » pour exclureles voyages ayant des durées (censurées ou non) anormalement élevées. Ce critère est basésur la « méthode des quartiles » qui sert à exclure les valeurs aberrantes dans un jeu dedonnées et est donné par la formule suivante :

Di > Q3 + 3.(Q3 −Q1) (4.1)

où i représente un voyage et Di la durée (censurée ou non) de ce voyage, i = 1, · · · , n avecn le nombre de voyage, Q1 est le quartile à 25%, Q3 est le quartile à 75%.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 35

Habituellement, dans la formule (4.1) on utilise 32à la place de 3. Nous avons utilisé 3

parce que, nous nous intéressons aux valeurs aberrantes supérieurs. Ainsi, après exclusiondes voyages dont les durées sont anormalement élevées (durées supérieurs à 27 jours obtenupar la formule (4.1)), nous obtenons 4880 voyages dont 4589 ont des durées non censurées et291 ont des durées censurées. Le tableau 4.2 donne les estimations des quantiles des duréesà 10%, à 25%, à 50%, à 75%, à 80%, à 90%, à 95% et à 99% de la loi des durées de voyageen situation de durées non censurées avec élimination des durées aberrantes sur le corridorDouala-N’Djamena.

Table 4.2 – Estimation des quantiles de la loi des durées en situation de durées non censuréeset des durées non aberrantes corridor Douala-N’Djamena

Quantiles Durées de voyages (en jours)10% 625% 750% 875% 1180% 1290% 1595% 1899% 23

D’après le tableau 4.2, 50% des voyages durent au plus 8 jours et 50% des voyages durentplus de 8 jours sur le corridor Douala-N’Djamena, 80% des voyages durent au plus 12 jourssur ce corridor. De même, ce tableau nous suggère que, 99% des voyages durent au plus 23

jours sur ce corridor.La figure 4.1 donne la fonction de répartition empirique de la loi des durées en situation

de durées non censurées sur le corridor Douala-N’Djamena avec les quantiles estimés desdurées (barres verticales) à 10%, à 25%, à 50%, à 75%, à 80%, à 90%, à 95% et à 99%.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 36

Figure 4.1 – Fonction de répartition empirique de la loi des durées en situation de duréesnon censurées corridor Douala-N’Djamena

Corridor Douala-Bangui

Le tableau 4.3 donne les estimations des quantiles des durées à 10%, à 25%, à 50%, à75%, à 80%, à 90%, à 95% et à 99% de la loi des durées de voyage en situation de duréesnon censurées sur le corridor Douala-Bangui.

Table 4.3 – Estimation des quantiles de la loi des durées en situation de durées non censuréescorridor Douala-Bangui

Quantiles Durées de voyages (en jours)10% 225% 350% 475% 680% 790% 995% 1399% 45

D’après le tableau 4.3, 50% des voyages durent au plus 4 jours et 50% des voyages durent

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 37

plus de 4 jours sur le corridor Douala-Bangui, 95% des voyages durent au plus 13 jours surce corridor. Nous remarquons aussi que, le quantile estimé des durées à 99% est élevé (45

jours) ce qui veut dire que, quelques voyages ont des durées élevées. Cela explique l’écartqu’il y a entre le quantile estimé des durées à 95% et le quantile estimé des durées à 99%

(32 jours). Par le même critère que celui défini par la formule (4.1), les voyages dont lesdurées (censurées ou non) seront supérieurs à 15 jours seront considérés comme aberrants etdonc enlevés de l’échantillon des données sur ce corridor. Nous obtenons 6452 voyages dont6295 ont des durées non censurées et 157 ont des durées censurées. Le tableau 4.4 donne lesestimations des quantiles des durées à 10%, à 25%, à 50%, à 75%, à 80%, à 90%, à 95% età 99% de la loi des durées de voyage en situation de durées non censurées avec éliminationdes durées aberrantes sur le corridor Douala-Bangui.

Table 4.4 – Estimation des quantiles de la loi des durées en situation de durées non censuréeset des durées non aberrantes corridor Douala-Bangui

Quantiles Durées de voyages (en jours)10% 225% 350% 475% 680% 690% 895% 1099% 14

D’après le tableau 4.4, 50% des voyages durent au plus 4 jours et 50% des voyages durentplus de 4 jours sur le corridor Douala-Bangui, 80% des voyages durent au plus 6 jours sur cecorridor. De même, ce tableau nous suggère que, 99% des voyages durent au plus 14 jourssur ce corridor.

La figure 4.2 donne la fonction de répartition empirique de la loi des durées en situationde durées non censurées sur le corridor Douala-Bangui avec les quantiles estimés des durées(barres verticales) à 10%, à 25%, à 50%, à 75%, à 80%, à 90%, à 95% et à 99%.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 38

Figure 4.2 – Fonction de répartition empirique de la loi des durées en situation de duréesnon censurées corridor Douala-Bangui

4.2.2 Estimation de la moyenne de la loi des durées de voyage ensituation de durées non censurées

Dans cette sous-section, nous nous appuyons sur la sous-section 3.1.3 du chapitre 3 denotre document. Le tableau 4.5 donne les estimations des moyennes de la loi des duréesde voyage en situation de durées non censurées (voyages ayant quittés le PAD et qui sontarrivées aux postes-frontières de Kousseri et de Garoua-Boulai) sur les corridors Douala-N’Djamena et Douala-Bangui et des intervalles de confiance de ces moyennes.

Table 4.5 – Estimation de la moyenne et IC de la moyenne de la loi des durées en situationde durées non censurées

corridors moyenne (en jours) intervalle de confiance à 95%Douala-N’Djamena 9.53 [9.42 ; 9.64]Douala-Bangui 4.92 [4.86 ; 4.98]

D’après le tableau 4.5, l’estimation de la moyenne de la loi des durées de voyage en situationde durées non censurées sur le corridor Douala-N’Djamena est de 9.53 jours et celle ducorridor Douala-Bangui est de 4.92 jours.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 39

4.3 Estimation non paramétrique de la loi des durées devoyage en situation de durées censurées à droite

4.3.1 Estimation des quantiles de la loi des durées de voyage ensituation de durées censurées à droite

Dans cette sous-section, nous nous appuyons sur la sous-section 3.3.5 du chapitre 3 denotre document.

Corridor Douala-N’Djamena

Le tableau 4.6 donne les estimations des quantiles des durées à 10%, à 25%, à 50%, à75%, à 80%, à 90%, à 95% et à 99% de la loi des durées de voyage en situation de duréescensurées à droite sur le corridor Douala-N’Djamena.

Table 4.6 – Estimation des quantiles de la loi des durées en situation de durées censuréesà droite corridor Douala-N’Djamena

Quantiles Durées de voyages (en jours)10% 525% 650% 875% 1180% 1290% 1695% 2099% 26

D’après le tableau 4.6, 50% des voyages durent au plus 8 jours et 50% des voyages durentplus de 8 jours sur le corridor Douala-N’Djamena, 80% des voyages durent au plus 12 jourssur ce corridor. De même, ce tableau nous suggère que, 95% des voyages durent au plus 20

jours et 99% des voyages durent au plus 26 jours sur ce corridor.

Corridor Douala-Bangui

Le tableau 4.7 donne les estimations des quantiles des durées à 10%, à 25%, à 50%, à75%, à 80%, à 90%, à 95% et à 99% de la loi des durées de voyage en situation de duréescensurées à droite sur le corridor Douala-Bangui.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 40

Table 4.7 – Estimation des quantiles de la loi des durées en situation de durées censuréesà droite corridor Douala-Bangui

Quantiles Durées de voyages (en jours)10% 025% 250% 375% 580% 690% 795% 1099% 14

D’après le tableau 4.7, 50% des voyages durent au plus 3 jours et 50% des voyages durentplus de 3 jours sur le corridor Douala-Bangui, 80% des voyages durent au plus 6 jours sur cecorridor. De même, ce tableau nous suggère que, 99% des voyages durent au plus 14 jourssur ce corridor.

4.3.2 Estimation de la moyenne de la loi des durées de voyage ensituation de durées censurées à droite

Dans cette sous-section, nous nous appuyons sur la sous-section 3.3.5 du chapitre 3 denotre document.

Le tableau 4.8 donne les estimations des moyennes de la loi des durées de voyage ensituation de durées censurées à droite (voyages ayant quittés le PAD et qui ne sont pasarrivées aux postes-frontières de Kousseri et de Garoua-Boulai) sur les corridors Douala-N’Djamena et Douala-Bangui et des intervalles de confiance de ces moyennes.

Table 4.8 – Estimation de la moyenne et IC de la moyenne de la loi des durées en situationde durées censurées

corridors moyenne (en jours) intervalle de confiance à 95%Douala-N’Djamena 10.14 [10.08 ; 10.21]Douala-Bangui 5.07 [5.01 ; 5.14]

D’après le tableau 4.8, l’estimation de la moyenne de la loi des durées de voyage en situationde durées censurées à droite sur le corridor Douala-N’Djamena est de 10.14 jours et celle ducorridor Douala-Bangui est de 5.07 jours.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 41

4.3.3 Fonction de survie de la loi des durées de voyage en situationde durées censurées à droite

Corridor Douala-N’Djamena

La figure 4.3 donne la courbe de la fonction de survie de la loi des durées de voyage ensituation de durées censurées à droite sur le corridor Douala-N’Djamena. Notons que, audébut de la courbe, 100% des voyages sont représentés (probabilité de 1). Il s’agit d’unecourbe en escalier avec une marche correspondant à chaque événement (voyages qui sontquittés du PAD et sont arrivés au poste-frontière de Kousseri). La hauteur de la marched’escalier est proportionnelle au nombre d’événements sur l’intervalle. Les voyages dont lesdurées sont censurées (voyages qui sont sont quittés du PAD et qui ne sont pas arrivés auposte-frontière de Kousseri) sont représentés par des barres verticales. Si les censures sonttrop nombreuses et entachent le graphique, elles ne sont pas représentées.

Figure 4.3 – Courbe de survie des durées de voyages corridor Douala-N’Djamena

D’après la figure 4.3, plusieurs voyages (4090 sur 4880 voyages) ont des durées inférieures ouégales à 13 jours car c’est jusqu’à ce niveau (13 jours) que nous avons les grandes marchesd’escalier. Passer ces 13 jours, les marches d’escalier deviennent petites ce qui veut dire queles probabilités de survie des voyages ayant des durées supérieures à 13 jours (790 sur 4880

voyages) sont faibles. Les voyages dont les durées sont censurées n’y figurent pas car ennombre considérable (291 sur 4880 voyages).

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 42

Corridor Douala-Bangui

La figure 4.4 donne la courbe de la fonction de survie de la loi des durées de voyage ensituation de durées censurées à droite sur le corridor Douala-Bangui. La description de lacourbe de la fonction de survie est semblable à celle du corridor oiuala-N’Djamena donnéeprécédemment.

Figure 4.4 – Courbes de survie des durées de voyages corridor Douala-Bangui

D’après la figure 4.4, plusieurs voyages (5848 sur 6452 voyages) ont des durées inférieuresou égales à 8 jours car c’est jusqu’à ce niveau (8 jours), que nous avons les grandes marchesd’escalier. Passer ces 8 jours, les marches d’escalier deviennent petites ce qui veut dire queles probabilités de survie des voyages ayant des durées supérieures à 8 jours (604 sur 6452

voyages) sont faibles. Les voyages dont les durées sont censurées n’y figurent pas car ennombre considérable (157 sur 6452 voyages).

Comparaison des deux courbes de fonctions de survie

La figure 4.5 donne la comparaison des deux courbes de la fonction de survie de la loides durées de voyage en situation de durées censurées à droite sur les corridors Douala-N’Djamena et Douala-Bangui. Notons que, nous ne pouvons comparer les 2 courbes desurvie que jusqu’à 15 jours car, les durées de voyage (censurées ou non) supérieures à 15

jours ont été éliminé d’après la formule (4.1) (Chapitre 4, sous-section 4.2.1) pour le corridorDouala-Bangui. Tandis que, pour le corridor Douala-N’Djamena, ce sont les durées de voyage

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 43

(censurées ou non) supérieures à 27 jours qui ont été éliminé.

Figure 4.5 – Comparaison des courbes de survie des durées de voyages

D’après la figure 4.5, jusqu’à 15 jours, les probabilités de survie des durées de voyage sur lecorridor Douala-N’Djamena sont plus élevées que celles du corridor Douala-Bangui. Cepen-dant, il faut faire un test (test programmé par la librairie « survival » du logiciel R) poursavoir si les 2 échantillons (Douala-N’Djamena et Douala-Bangui) sont issus d’une mêmeloi de durée ; nous effectuons le test du log-rank (Chapitre 3, sous-section 3.3.6) sur les 2échantillons. D’après les résultats de ce test, il y a une différence significative entre les 2 loisde durées des corridors Douala-N’Djamena et Douala-Bangui (p − valeur = 1.11e − 05) oùla p-valeur est la probabilité que le α-quantile de la loi du chi2 à 1 degré de liberté depassela valeur de la statistique de test.

4.4 Proposition d’un indicateur relatif aux délais de voyagessur les corridors Douala-N’Djamena et Douala-Bangui

Nous allons dans cette section, proposer un indicateur relatif aux délais de voyage sur lescorridors Douala-N’Djamena et Douala-Bangui à la DGD. Cet indicateur servira la DGD àconnaître les délais moyens de voyage c’est-à-dire les durées moyennes que font les camionsquittant le PAD pour les postes-frontières de Kousseri (corridor Douala-N’Djamena) et deGaroua-Boulai (corridor Douala-Bangui).

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 44

4.4.1 Indicateur relatif au délai de voyage sur le corridor Douala-N’Djamena

Dans le cas des voyages ayant des durées non censurées (les voyages qui sont quittésdu PAD et qui sont arrivés au poste-frontière de Kousseri), la durée moyenne estimée d’unvoyage sur le corridor Douala-N’Djamena est de 9.53 jours et la durée médiane estimée(quantile estimé des durées à 50%) d’un voyage sur le corridor Douala-N’Djamena est de 8

jours.Dans le cas des voyages ayant des durées censurées à droite (les voyages qui sont quittés

du PAD et qui ne sont pas arrivés au poste-frontière de Kousseri), la durée moyenne estiméed’un voyage sur le corridor Douala-N’Djamena est de 10.14 jours et la durée médiane estimée(quantile estimé des durées à 50%) d’un voyage sur le corridor Douala-N’Djamena est de 8

jours.Donc, nous proposons comme indicateur des délais de voyage sur le corridor Douala-

N’Djamena la moyenne estimée des durées de voyage en situation de durées non censurées(car la situation censurée n’a pas fait varié significativement cette moyenne), c’est-à-dire9.53 jours. De même, un indicateur des délais médians de voyage sur le corridor Douala-N’Djamena est la médiane estimée des durées de voyage en situation de durées non censurées,c’est-à-dire 8 jours ce qui signifie que, 50% des voyages durent au plus 8 jours et 50% desvoyages durent plus de 8 jours sur ce corridor.

4.4.2 Indicateur relatif au délai de voyage sur le corridor Douala-Bangui

Dans le cas des voyages ayant des durées non censurées à droite (les voyages qui sontquittés du PAD et qui sont arrivés au poste-frontière de Garoua-Boulai), la durée moyenneestimée d’un voyage sur le corridor Douala-Bangui est de 4.92 jours et la durée médianeestimée (quantile estimé des durées à 50%) d’un voyage sur le corridor Douala-Bangui estde 4 jours.

Dans le cas des voyages ayant des durées censurées (les voyages qui sont quittés du PADet qui ne sont pas arrivés au poste-frontière de Garoua-Boulai), la durée moyenne estiméed’un voyage sur le corridor Douala-Bangui est de 5.07 jours et la durée médiane estimée(quantile estimé des durées à 50%) d’un voyage sur le corridor Douala-Bangui est de 3 jours.

Donc, nous proposons comme indicateur des délais de voyage sur le corridor Douala-Bangui la moyenne estimée des durées de voyage en situation de durées non censurées (carla situation censurée n’a pas fait varié significativement cette moyenne), c’est-à-dire 4.92

jours. De même, un indicateur des délais médians de voyage sur le corridor Douala-Banguiest la médiane estimée des durées de voyage en situation de durées non censurées, c’est-à-dire4 jours ce qui signifie que, 50% des voyages durent au plus 8 jours et 50% des voyages durent

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 45

plus de 4 jours sur ce corridor.

4.5 Le modèle de Cox

4.5.1 Ecriture du modèle

Þ Corridor Douala-N’DjamenaLe modèle de Cox sur ce corridor est donné par :

h(t/~z) = h0(t) exp

(6∑i=1

~ziβi

)

où h(t/~z) est la fonction de risque instantané de la loi des durées de voyage pendantune durée de voyage t sur le corridor Douala-N’Djamena ; h0(t) est la fonction de risqueinstantané de base i.e quand il n’y a pas d’effet des covariables.– ~z = (z1, z2, z3, z4, z5, z6) est le vecteur des covariables constitué respectivement du

poids net de la cargaison, du nombre de colis de la cargaison, de l’itineraire empruntépar les camions, du nombre d’arrêts corridor, du nombre de sorties corridor, de lavitesse maximale atteinte par les camions ;

– β = (β1, β2, β3, β4, β5, β6) ∈ R6 est le vecteur des paramètres du modèle associées àces covariables.

Þ Corridor Douala-BanguiLe modèle de Cox sur ce corridor est donné comme pour le corridor Douala-N’Djamenamais avec plutôt 5 covariables : le poids net de la cargaison, le nombre de colis de lacargaison, le nombre d’arrêts coridor, le nombre de sorties corridor et la vitesse maxi-male atteinte par les camions. Nous notons que l’itinéraire emprunté par les camionsn’apparaît plus car pour ce corridor, il n’y a qu’un seul itinéraire (pas de variation).

4.5.2 Vérification des hypothèses du modèle de Cox

Tout ce qui va suivre dans cette sous-section est le résultat de la partie méthodologie duChapitre 3, sous-section 3.4.4.

Vérification de l’hypothèse de risque proportionnel

Parmi les différentes méthodes proposées pour vérifier l’hypothèse d’un modèle de risqueproportionnel, nous avons choisi celle qui concerne le tracé et le test des résidus de Schoenfeld.Cette approche consiste à voir si certaines covariables ont un effet dépendant du temps.

Þ Corridor Douala-N’DjamenaLe tableau 4.9 nous donne les résultats du test d’indépendance temporelle des effets

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 46

de covariables et du test global de validité de l’hypothèse de risque proportionnel pourle corridor Douala-N’Djamena (programmé sous le logiciel R). Lorsque la p-valeurassociée à une covariable est supérieure ou égale au seuil α fixé (ici α = 5%), alorsl’effet de la covariable est indépendant du temps ; dans le cas contraire, l’effet estdépendant du temps. Le cas de figure d’intêret est le cas où l’effet de la covariable estindépendant du temps. Dans le tableau 4.9, rho représente la corrélation entre la duréeet les résidus du modèle, c’est-à-dire t*résidus.

Table 4.9 – Tableau de test des résidus de Schoenfeld corridor Douala-N’Djamenarho statistique du khi deux p-valeur

poids_net 0.0698 1.32 0.2502nombre_colis 0.1039 3.79 0.0517code_itineraire 0.0656 1.42 0.2335nombre_arrets 0.0725 1.62 0.2031nombre_sorties 0.0905 3.16 0.0753vitesse_max -0.0718 1.72 0.1895GLOBAL NA 12.64 0.0522

D’après le tableau 4.9, le résultat du test global de validité de l’hypothèse de risqueproportionnel conduit à accepter cette hypothèse (p-valeur = 0.0522).La figure 4.6 donne les résidus de Schoenfeld pour les différentes covariables du modèlede Cox sur le corridor Douala-N’Djamena. Notons que le logiciel R trace le graphe desrésidus en incluant par défaut un lissage par des splines (trait plein), et des IC à 95%(trait interrompu). Pour ces graphiques, tout éloignement de l’horizontale (origine à0) traduit un effet dépendant du temps.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 47

Figure 4.6 – Courbe des résidus de Schoenfeld corridor Douala-N’Djamena

D’après la figure 4.6, aucune courbe n’est éloigné de l’origine 0, donc les effets descovariables sont fixes.

Þ Corridor Douala-BanguiLe tableau 4.10 nous donne les résultats du test d’indépendance temporelle des effetsde covariables et du test global de validité de l’hypothèse de risque proportionnel pourle corridor Douala-Bangui. Dans le tableau 4.10, rho est définie comme précédemment.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 48

Table 4.10 – Tableau de test des résidus de Schoenfeld corridor Douala-Banguirho statistique du khi deux p-valeur

poids_net -0.1001 1.042 0.307nombre_colis -0.1385 2.467 0.116nombre_arrets 0.0614 0.475 0.491nombre_sorties 0.0600 0.327 0.568vitesse_max 0.0466 0.338 0.561GLOBAL NA 5.148 0.398

D’après le tableau 4.10, le résultat du test global de validité de l’hypothèse de risqueproportionnel conduit à accepter cette hypothèse (p-valeur = 0.398). Aucune covariablen’a un effet dépendant du temps.La figure 4.7 donne les résidus de Schoenfeld pour les différentes covariables du modèlede Cox sur le corridor Douala-Bangui.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 49

Figure 4.7 – Courbe des résidus de Schoenfeld corridor Douala-Bangui

D’après la figure 4.7, aucune courbe n’est éloigné de l’origine 0, donc les effets descovariables sont fixes.

On peut donc conclure que l’hypothèse d’un modèle de risque proportionnel est bien validesur les corridors Douala-N’Djamena et Douala-Bangui. Il s’agira dans la suite de testerl’influence des observations.

Influence des observations

On cherche à vérifier que les coefficients du modèle ne sont pas définis qu’à partir d’unpetit nombre d’observations mais correspondent bien à l’ensemble des voyages. On comparel’ordre de grandeurs des plus grands résidus aux coefficients. S’ils sont petits par rapportaux valeurs des coefficients, alors, il n’y a pas d’observations anormalement influentes.

Þ Corridor Douala-N’DjamenaLa figure 4.8 nous donne le nuage de points des résidus du modèle de Cox pour les

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 50

covariables « poids_net », « nombre_colis », « code_itineraire », « nombre_arrêts »,« nombre_sorties » et « vitesse_max » sur le corridor Douala-N’Djamena.

Figure 4.8 – Nuage de points des résidus du modèle de Cox corridor Douala-N’Djamena

D’après la figure 4.8, nous pouvons conclure qu’il n’y a pas d’observations anormale-ment influentes sur le corridor Douala-N’Djamena.

Þ Corridor Douala-BanguiLa figure 4.9 nous donne le nuage de points des résidus du modèle de Cox pour lescovariables « poids_net », « nombre_colis », « nombre_arrêts », « nombre_sorties »et « vitesse_max » sur le corridor Douala-Bangui.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 51

Figure 4.9 – Nuage de points des résidus du modèle de Cox corridor Douala-Bangui

D’après la figure 4.9, nous pouvons conclure qu’il n’y a pas d’observations anormale-ment influentes sur le corridor Douala-Bangui.

On peut donc conclure qu’il n’y a pas des observations influentes pour le modèle de Coxsur les corridors Douala-N’Djamena et Douala-Bangui. Le modèle de Cox étant bien adaptépour le jeu de données de cette étude, nous allons dans la suite estimer les paramètres dumodèle ainsi que les différents tests de l’effet des covariables sur les durées de voyage.

4.5.3 Estimation des paramètres et analyse des effets des cova-riables sur les durées de voyage

Les paramètres sont estimés sous le logiciel R selon la procédure définie à la sous-section3.4.3 du Chapitre 3.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 52

Estimation des paramètres

Þ Corridor Douala-N’DjamenaLe tableau 4.11 nous donne l’estimation des paramètres du modèle de Cox sur lecorridor Douala-N’Djamena. Dans le tableau 4.11, la présence de "**" sur les p-valeursdes covariables « poids_net » et « code_itineraire » veut dire que le test de nullitédes coefficients associés à ces covariables est très significatif (les covariables ont uneforte influence sur les durées de voyage) ; et la présence de "*" sur la p-valeur de lacovariable « vitesse_max » veut dire que le test de nullité du coeficient associé à cettecovariable est significatif. Dans le tableau 4.11, Effet = l’effet des covariables, coef =l’estimation des paramètres associées aux covariables, exp(coef) = l’exponentielle deces paramètres, se(coef) = estimation de l’écart-type des estimateurs.

Table 4.11 – Tableau de l’estimation des paramètres du modèle de Cox corridor Douala-N’Djamena

Effet coef exp(coef) se(coef) statistique de Wald p-valeurpoids_net 1.884e-05 1.000e+00 5.968e-06 3.157 0.00159 **

nombre_colis 6.166e-05 1.000e+00 8.692e-05 0.709 0.47808code_itineraire 2.594e-02 1.026e+00 9.148e-03 2.836 0.00457 **nombre_arrets 8.298e-02 1.087e+00 1.338e-01 0.620 0.53500nombre_sorties -4.915e-02 9.520e-01 5.520e-02 -0.890 0.37322vitesse_max 5.012e-03 0.995e+00 2.041e-03 -2.243 0.02490 *

Þ Corridor Douala-BanguiLe tableau 4.12 nous donne l’estimation des paramètres du modèle de Cox sur lecorridor Douala-Bangui. Dans le tableau 4.12, la présence de "**" sur la p-valeur dela covariable « nombre_sorties » veut dire que le test de nullité du coeficient associéà cette covariable est très significatif. Dans le tableau 4.12, Effet, coef, exp(coef) etse(coef) sont définis comme précédemment.

Table 4.12 – Tableau de l’estimation des paramètres du modèle de Cox corridor Douala-Bangui

Effet coef exp(coef) se(coef) statistique de Wald p-valeurpoids_net -2.419e-06 1.000e+00 1.079e-05 -0.224 0.82260

nombre_colis -9.297e-05 9.999e-01 1.118e-04 -0.831 0.40581nombre_arrets 1.605e-01 1.174e+00 2.192e-01 0.732 0.46402nombre_sorties -3.266e-01 7.214e-01 1.154e-01 -2.830 0.00466 **vitesse_max -1.271e-02 9.874e-01 8.460e-03 -1.502 0.13311

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 53

4.5.4 Analyse de l’ajustement du modèle de Cox

L’analyse de l’ajustement du modèle de Cox est donnée ici par la procédure définie à lasous-section 3.4.6 du Chapitre 3.

Qualité d’ajustement globale du modèle :

Lorsque l’une des p-valeurs des 3 tests (ratio, Wald test, Score) est très inférieure à 5%,alors nous dirons que le modèle de Cox est bien ajusté au seuil 5%.

Þ Corridor Douala-N’DjamenaLes p-valeurs des 3 tests (ratio, Wald test, Score) sont respectivement de 0.001176,0.0004403, 0.00032 (données par le logociel R). Ce qui montre que l’ajustement d’unmodèle de Cox est très pertinent au seuil 5% : il existe une influence significative d’aumoins une covariable sur la durée de voyage sur ce corridor.

Þ Corridor Douala-BanguiLes p-valeurs des 3 tests (ratio, Wald test, Score) sont respectivement de 0.01684,0.04537, 0.04008 (données par le logociel R). Ce qui montre que l’ajustement d’unmodèle de Cox est très pertinent au seuil 5% : il existe une influence significative d’aumoins une covariable sur la durée de voyage sur ce corridor.

Significativité de l’effet de chaque covariable sur la durée :

Þ Corridor Douala-N’DjamenaLes tests de Wald pour les covariables « poids_net », « code_itineraire » et « vi-tesse_maximale » montrent que les coefficients correspondants sont significatifs auseuil 5% (p-valeurs < 5%) : ces covariables ont un effet important sur les durées devoyage. Le poids net de la cargaison peut avoir une influence sur les durées de voyagedans la mesure où, si les cargaisons sont très lourdes, les camions rouleront moinsvite ce qui entraine l’augmentation des durées de voyage. De même, l’itinéraire em-prunté par les camions peut influencer les durées de voyage dans la mesure où prendreun itinéraire peut être moins contraignant que prendre un autre itinéraire. La vitessemaximale atteinte par les camions peut également influencer les durées de voyage dansla mesure où « rouler vite » entraine « arriver vite ».

Þ Corridor Douala-BanguiLe test de Wald pour la covariable « nombre_sorties » montre que le coefficient cor-respondant est significatif au seuil 5% (p-valeur < 5%) : cette covariable a un effetimportant sur les durées de voyage. Le nombre de sorties corridor peut influencer lesdurées de voyage dans la mesure où sortir du corridor peut vouloir dire d’une part allerperdre le temps quelque part pour décharger les marchandises et d’autre part prendre

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 54

un itinéraire « moins contraignant » en fonction des obstacles rencontrés sur l’itinérairedéfini par la Douane.

Nous avons vu plus haut (test du log-rank), que les échantillons des lois de durées de voyagedes corridors Douala-N’Djamena et Douala-Bangui ne sont pas issus de la même loi de durée.Cela explique le fait que ce ne sont pas les mêmes groupes de variables qui sont significativessur les 2 corridors.

L’exponentielle des coefficients du modèle :

Þ Corridor Douala-N’DjamenaSupposons que toutes les autres covariables restent constantes, après standardisationdes covariables (pour permettre que les covariables soient comparables), le poids neta un effet stable sur la durée de voyage. De même, l’itinéraire a un effet négatif sur ladurée, prendre un itinéraire augmente la durée de voyage par un facteur eβ3 = 1.026 enmoyenne soit de 102.6%− 100% = 2.6%. A l’opposé, la vitesse maximale atteinte parles camions sur ce corridor a un effet positif sur la durée. Une vitesse de plus reduit ladurée de voyage par un facteur eβ6 = 0.995 en moyenne soit de 100%− 99.5% = 0.5%.Nous pouvons donc dire : plus les cargaisons prennent un itinéraire, moins elles arriventvite et plus les camions roulent vite, moins les voyages durent.

Þ Corridor Douala-BanguiSupposons que toutes les autres covariables restent constantes alors, le nombre desorties sur ce corridor a un effet positif sur la durée de voyage. Une sortie corridorde plus réduit la durée de voyage par un facteur eβ4 = 0.7214 en moyenne soit de100% − 72.14% = 27.86%. Nous pouvons donc dire : plus on sort du corridor, moinsles voyages durent ceci peut sembler « bizarre » mais peut s’expliquer par le fait que,face à un « obstacle » rencontré sur l’itinéraire défini par la Douane, le camionneurprenne une autre direction.

4.5.5 Sélection de covariables

La sélection de covariables est donnée ici par la procédure définie à la sous-section 3.4.7du Chapitre 3.

Examen de la colinéarité :

Il s’agit ici de voir si les covariables sont corrélées entre elles (valeur absolu du coefficientest proche ou égal à 1)

Þ Corridor Douala-N’DjamenaLe tableau 4.13 nous donne la matrice de corrélation entre les covariables du modèle

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 55

Table 4.13 – Matrice de corrélation corridor Douala-N’Djamenapoids_net nombre_arrets nombre_sorties vitesse_max nombre_colis

poids_net 1.000 -0.010 0.038 0.036 -0.136nombre_arrets -0.010 1.000 0.174 -0.016 -0.023nombre_sorties 0.038 0.174 1.000 0.288 -0.030vitesse_max 0.036 -0.016 0.288 1.000 -0.072nombre_colis -0.136 -0.023 -0.030 -0.072 1.000

de Cox sur le corridor Douala-N’Djamena.D’après le tableau 4.13, aucune covariable n’est colinéaire avec l’autre.

Þ Corridor Douala-BanguiLe tableau 4.14 nous donne la matrice de corrélation entre les covariables du modèlede Cox sur le corridor Douala-Bangui.

Table 4.14 – Matrice de corrélation corridor Douala-Banguipoids_net nombre_arrets nombre_sorties vitesse_max nombre_colis

poids_net 1.000 -0.019 -0.049 -0.056 0.045nombre_arrets -0.019 1.000 0.217 -0.040 0.012nombre_sorties -0.049 0.217 1.000 0.065 -0.187vitesse_max -0.056 -0.040 0.065 1.000 -0.008nombre_colis 0.045 0.012 -0.187 -0.008 1.000

D’après le tableau 4.14, aucune covariable n’est colinéaire avec l’autre.

Sélection des covariables pertinentes :

Þ Corridor Douala-N’DjamenaL’hypothèse d’un modèle à risques proportionnels étant vérifiée plus haut, il restele modèle avec les covariables « poids_net », « code_itineraire » et « vitesse_max »(Chapitre 4, sous section 4.5.3). Le critère AIC (Chapitre 3, sous section 3.4.7) confirmece choix. Ce sont donc les 3 covariables pertinentes qui expliquent les durées de voyagesur ce corridor.

Þ Corridor Douala-BanguiDe même, il reste le modèle avec la covariable « nombre_sorties » (Chapitre 4, soussection 4.5.3). Le critère AIC (Chapitre 3, sous section 3.4.7) nous suggère d’ajouterla covariable « vitesse_max ». Ce sont donc les 2 covariables pertinentes qui expliqueles durées de voyage sur ce corridor.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 56

4.5.6 Vers la recherche du meilleur modèle

Il s’agit dans cette partie d’écrire le meilleur modèle de Cox sur les corridors Douala-N’Djamena et Douala-Bangui.

Première approche : Transformation de certaines covariables en quantitativescatégorielles

La motivation de transformer certaines covariables quantitatives en quantitatives caté-gorielles est tout simplement le souci de rendre ces covariables dans le même type.

Þ Corridor Douala-N’DjamenaLa transformation des covariables vitesse maximale atteinte par les camions, poids netde la cargaison et nombre de colis de la cargaison respectivement en 2 modalités, 3modalités et 3 modalités nous a permis de retenir les covariables sus-citées lors de laselection des covariables. Notons pour cela que nous avons utilisé le modèle de Coxstratifié sur la covariable nombre de sorties corridors car cette covariable avait un effetdépendant du temps. Le meilleur modèle de Cox pour ce corridor est donc :

h(durée voyage) = h0(durée voyage)eβ1poids_net+β2code_itineraire+β3vitesse_max

où h(durée voyage) est la fonction de risque instantané de la loi des durées de voyagependant une durée de voyage donnée et h0(durée voyage) est la fonction de risqueinstantané de la loi des durées de voyage sans effet des covariables.

Þ Corridor Douala-BanguiNous tranformons les mêmes covariables comme pour le corridor Douala-N’Djamena.Le meilleur modèle de Cox pour ce corridor est donc :

h(durée voyage) = h0(durée voyage)eβ1nombre_sorties

où h(durée voyage) et h0(durée voyage) sont définies comme pour le corridor Douala-N’Djamena.

Deuxième approche : Transformation logaritmique de certaines covariables

La motivation de transformer certaines covariables quantitatives en logarithme est toutsimplement le souci de rendre ces covariables à la même échelle.

Þ Corridor Douala-N’DjamenaLa transformation logarithmique de certaines covariables (poids net, monbre de coliset vitesse max) rend le modèle de Cox mal adapté aux données dans ce cas car l’hy-pothèse du test global (indépendance temporelle de l’effet des covariables) est rejetée.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 57

Cependant, après stratification de la covariable vitesse maximale qui a un effet dépen-dant du temps, nous arrivons à valider cette hypothèse du test global. Quelque soit lastrate considérée, les covariables retenues après sélection des covariables (Chapitre 4,sous section 4.4.3) sont : « poids_net » et « code_itineraire ». Le meilleur modèle deCox pour ce corridor est donc :

h(durée voyage) = h0(durée voyage)eβ1poids_net+β2code_itineraire

où poids_net est le logarithme du poids net de la cargaison.

Þ Corridor Douala-BanguiLa transformation logarithmique des covariables poids net, nombre de colis et vitessemax conduit à accepter l’hypothèse du test global de validité du modèle de Cox (indé-pendance temporelle de l’effet des covariables). La selection des covariables (Chapitre4, sous section 4.4.3) permet de retenir les covariables « nombre_sorties » et « vi-tesse_max ». Le critère AIC (Chapitre 3, sous-section 3.4.7) confirme ce choix. Lemeilleur modèle de Cox pour ce corridor est donc :

h(durée voyage) = h0(durée voyage)eβ1nombre_sorties+β2vitesse_max

où vitesse_max est le logarithme de la vitesse maximale.

Comparaison approche 1 et approche 2

La comparaison a pour but de retenir le meilleur modèle de Cox issus des 2 approchesprécédentes pour les corridors Douala-N’Djamena et Douala-Bangui.

Þ Corridor Douala-N’DjamenaL’approche 1 nous permet de dire que les covariables « poids_net », « code_itinéraire» et « vitesse_max » ont une influence sur la durée de voyage au seuil 5% sur cecorridor et l’approche 2 nous permet de dire que : quelque soit la strate considérée(strate de vitesse), ce sont les covariables « poids_net » et « code_itinéraire » quiinfluent le plus sur les durées de voyage. Le critère AIC qui nous permet de choisir le «meilleur modèle » (modèle avec le plus petit AIC) nous donne : (i) Approche 1 : AIC=3111,79 et (ii) Approche 2 : AIC = 3114,11. Nous restons donc avec le meilleur modèlede Cox obtenu par l’approche 1. Ce meilleur modèle s’écrit donc :

h(durée voyage) = h0(durée voyage)eβ1poids_net+β2code_itineraire+β3vitesse_max

Le tableau 4.15 nous donne l’estimation des paramètres β1, β2 et β3 du meileur mo-dèle de Cox sur le corridor Douala-N’Djamena. Dans le tableau 4.15, la significationde : Effet, coef, exp(coef) et se(coef) est donnée au paragraphe de l’estimation desparamètres (Chapitre 4, sous-section 4.5.3).

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 58

Table 4.15 – Tableau de l’estimation des paramètres du meilleur modèle de Cox corridorDouala-N’Djamena

Effet coef exp(coef) se(coef) statistique de Wald p-valeurpoids_net 0.3353 1.3984 0.1232 2.721 0.00651 **

code_itineraire 0.7596 2.1373 0.2550 2.979 0.00289 **vitesse_max 0.8701 2.3871 0.5069 1.716 0.08609 .

Þ Corridor Douala-BanguiL’approche 1 nous suggère de ne retenir que la covariable « nombre_sortie » et l’ap-proche 2 nous suggère de retenir les covariables « nombre_sorties » et « vitesse_max». Le critère AIC nous donne : (i) Approche 1 : AIC= 1118,42 et (ii) Approche 2 : AIC= 1115,81. C’est donc le meilleur modèle de Cox de l’approche 2 que nous retenons.Ce meilleur modèle s’écrit donc :

h(durée voyage) = h0(durée voyage)eβ1nombre_sorties+β2vitesse_max

où vitesse_max est le logarithme de la vitesse maximale.Le tableau 4.16 nous donne les estimations des paramètres β1 et β2 du meilleur modèlede Cox sur le corridor Douala-Bangui.

Table 4.16 – Tableau de l’estimation des paramètres du meilleur modèle de Cox corridorDouala-Bangui

Effet coef exp(coef) se(coef) statistique de Wald p-valeurnombre_sorties -0.2857 0.7515 0.1078 -2.649 0.00806 **vitesse_max -0.3263 0.7216 0.1445 -2.258 0.02392 *

Prédiction de la fonction de risque instantané sur les voyages

Dans cette sous-section, nous allons prédire la fonction de risque instantané sur les voyagesc’est-à-dire les chances qu’on les voyages d’arriver aux postes-frontières de Kousseri pour lecorridor Douala-N’Djamena et de Garoua-Boulai pour le corridor Douala-Bangui condition-nellement aux covariables pertinentes retenues par le modèle de Cox. Notons que, cettefonction de risque instantané est proportionnel à la fonction de risque instantané de base (lelogiciel R prend les valeurs moyennes des covariables pertinentes comme référence).

Þ Corridor Douala-N’DjamenaLa figure 4.10 donne les prédictions des fonctions de risque instantané (chances) d’ar-river des voyages au poste-frontière de Kousseri (corridor Douala-N’Djamena) condi-tionnellement aux covariables pertinentes « poids_net », « code_ itinéraire » et «

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 59

vitesse_max » pour les durées observées sur le corridor Douala-N’Djamena. Ces co-variables sont celles qui ont été retenues par le modèle de Cox sur ce corridor. Lescodes itinéraires ici, sont obtenues après un codage numérique de la « code_ iti-néraire » ; il s’agit donc de 0 (Douala PAD-Yassa-Bonis-Kousseri) et de 1 (Douala-Bertoua-Kousseri). Les exemples des valeurs prises par ces covariables sont représen-tées par des couples sur la légende des courbes de la figure. Par exemple, le couple(10000, 1, 15) veut dire le couple de covariables (poids_net = 10000, code_itineraire =

1, vitesse_max = 15). Notons que, la courbe de la fonction de risque instantané icireprésente la chance d’arriver au poste-frontière de Kousseri.

Figure 4.10 – Courbes de prédictions des fonctions de risque instantané corridor Douala-N’Djamena

D’après la figure 4.10, quelque soit la durée observée, les cargaisons pour lesquelles nousobserverons le couple de covariables (30000, 1, 46) auront plus de chance d’arriver auposte-frontière de Kousseri que celles que nous observerons les couples de covariables(10000, 1, 15), (15000, 0, 17), (20000, 0, 32), (25000, 1, 37) car la courbe de la fonctionde risque instantané du couple (30000, 1, 46) (courbe de couleur cyan) est au dessusdes autres courbes des fonctions de risque instantané.

Þ Corridor Douala-Bangui

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 60

La figure 4.11 donne les prédictions des fonctions de risque instantané (chances) d’ar-river des voyages au poste-frontière de Garoua-Boulai (corridor Douala-Bangui) condi-tionnement aux covariables pertinentes « nombre_sorties » et « vitesse_max » pourles durées observées sur le corridor Douala-Bangui. Ces covariables sont celles qui ontété retenues par le modèle de Cox sur ce corridor. Les exemples des valeurs prises parces covariables sont représentées par des couples sur la légende des courbes de la figure.Par exemple, le couple (2, 20) veut dire le couple de covariables (nombre_sorties = 2,vitesse_max = 20). Notons que, la courbe de la fonction de risque instantané ici re-présente la chance d’arriver au poste-frontière de Garoua-Boulai.

Figure 4.11 – Courbes de prédictions des fonctions de risque instantané corridor Douala-Bangui

D’après la figure 4.11, quelque soit la durée observée, les cargaisons pour lesquellesnous observerons le couple de covariables (2, 20) auront plus de chance d’arriver auposte-frontière de Garoua-Boulai que celles que nous observerons les couples de cova-riables (4, 31), (6, 39), (8, 45), (10, 60) car la courbe de la fonction de risque instantanédu couple (2, 20) (courbe de couleur noir) est au dessus des autres courbes des fonctionsde risque instantané.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

RESULTATS 61

4.5.7 Conclusion sur le modèle de Cox :

Þ Corridor Douala-N’DjamenaSur ce corridor, le fait de rouler vite a une influence positive sur les durées de voyage(diminution des durées de voyage). De même, le fait que les cargaisons sont très lourdeset le fait de prendre un itinéraire ont une influence négative sur les durées de voyage(augmentation des durées de voyage). En effet, la figure 4.10 montre que : quelquesoit l’itinéraire emprunté par les camionneurs, plus la vitesse maximale augmente, plusle risque instantané est élevé c’est-à-dire que les chances d’arriver des cargaisons auposte-frontière de Kousseri sont élevées. De même, l’augmentation du poids net d’unecargaison augmente les chances d’arriver au poste-frontière de Kousseri. Cela veut doncdire que l’effet de la vitesse maximale atteinte par les camions est plus marqué quecelle du poids net de la cargaison.

Þ Corridor Douala-BanguiSur ce corridor, le fait de sortir du corridor a une influence positive sur les duréesde voyage (diminution des durées de voyage). Cela semble « bizarre » car nous nousattendions au contraire mais, peut s’expliquer par le fait que les camionneurs prennentun itinéraire moins contraignant que celui défini par la Douane. De ce fait, ils peuventvite arriver à destination. De même, le fait de rouler vite a une influence positive surles durées de voyage (diminution des durées de voyage). En effet, la figure 4.11 montreque : plus la vitesse maximale augmente, plus le risque instantané est élevé c’est-à-dire que les chances d’arriver des cargaisons au poste-frontière de Garoua-Boulai sontélevées. De même, l’augmentation du nombre de sorties corridor augmente les chancesd’arriver au poste-frontière de Garoua-Boulai.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

CONCLUSION 62

Conclusion

Le thème qui a été soumis à notre étude nous a permis de nous poser la question : quelpeut être un indicateur relatif aux délais de voyage sur les corridors Douala-N’Djamena etDouala-Bangui et qu’est ce qui peut expliquer les durées de voyages sur ces corridors ? Nousavons donc formuler à partir de cette problèmatique l’objectif principal qui est le suivant :proposer à la DGD un indicateur relatif aux délais de voyage des cargaisons de marchandisessur les corridors Douala-N’Djamena et Douala-Bangui et un modèle permettant d’expliquerles durées de voyage sur ces corridors.

Pour apporter une réponse à notre problématique, nous avons fait une analyse sur lesdonnées de transit de l’année 2011 pour les corridors Douala-N’Djamena et Douala-Bangui.L’analyse a consisté à utiliser le logiciel R pour appliquer aux données l’estimation non pa-ramétrique de loi des durées de voyage en présence des durées non censurées et des duréescensurées à droite et enfin le modèle de Cox.

L’estimation non paramétrique de la loi des durées de voyage en présence des durées noncensurées nous a permis d’estimer la moyenne et la médiane de la loi des durées de voyage.Il ressort que les voyages durent en moyenne 9.53 jours sur le corridor Douala-N’Djamenaet 4.92 jours sur le corridor Douala-Bangui. Par ailleurs, les médianes sont respectivementde 8 jours et 4 jours sur les corridors Douala-N’Djamena et Douala-Bangui c’est-à-dire que :50% voyages durent au plus 8 jours et 50% voyages durent plus de 8 jours sur le corridorDouala-N’Djamena ; de même, 50% voyages durent au plus 4 jours et 50% voyages durentplus de 4 jours sur le corridor Douala-Bangui.

L’estimation non paramétrique de loi des durées de voyage en présence des durées cen-surées à droite a consisté à utiliser l’estimateur de Kaplan Meier pour estimer la moyenneet la médiane de la loi des durées de voyage. Il ressort que les voyages durent en moyenne10.14 jours sur le corridor Douala-N’Djamena et 5.07 jours sur le corridor Douala-Bangui.Par ailleurs, les médianes sont respectivement de 8 jours et 3 jours sur les corridors Douala-N’Djamena et Douala-Bangui c’est-à-dire que : 50% voyages durent au plus 8 jours et 50%

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

CONCLUSION 63

voyages durent plus de 8 jours sur le corridor Douala-N’Djamena ; de même, 50% voyagesdurent au plus 3 jours et 50% voyages durent plus de 3 jours sur le corridor Douala-Bangui.

Nous avons enfin utilisé le modèle de Cox pour expliquer les durées de voyage sur lescorridors Douala-N’Djamena et Douala-Bangui. Les covariables ayant servi pour l’écrituredu modèle sont : la vitesse maximale atteinte par les camions, le poids net de la cargaison, lenombre de colis de la cargaison, l’itinéraire emprunté par les camions, le nombre de sortiescorridor et le nombre d’arrêts sur le corridor. L’itinéraire n’a pas été utilisé pour le corridorDouala-Bangui car n’ayant qu’une seule modalité. Après validation des hypothèses du mo-dèle de Cox, il ressort que : pour un seuil de 5%, les covariables qui expliquent les duréesde voyage (choisies par le critère AIC) sur le corridor Douala-N’Djamena sont : le poids netde la cargaison, l’itinéraire emprunté par les camions et la vitesse maximale atteinte par lescamions c’est-à-dire que le poids net a une influence significative négative (augmentationdes durées de voyage). L’itinéraire emprunté par les camions a une influence significative né-gative (augmentation des durées de voyage) et la vitesse maximale a une influence positive(diminution des durées de voyage) sur les durées de voyage. De même, pour le même seuil de5% et le critère AIC, ce sont les covariables nombre de sorties corridor et vitesse maximalequi expliquent le mieux les durées de voyage sur le corridor Douala-Bangui. Le nombre desorties corridor a une influence significative positive sur les durées de voyage qui résulte dufait que certains camionneurs prennent en fonction du cas rencontré en route un itinérairemoins contraignant que celui initialement prévu par la Douane et la vitesse maximale a aussiune influence significative positive sur les durées de voyage.

En définitive, nous pouvons retenir que sous nos hypothèses de travail, un indicateurrelatif au délai de voyage sur le corridor Douala-N’Djamena est 9.53 jours en moyenne et lescovariables qui ont une influence significative sur les durées de voyage sur ce corridor sont :le poids net de la cargaison, l’itinéraire emprunté par les camions et la vitesse maximaleatteinte par les camions. De même, un indicateur relatif au délai de voyage sur le corridorDouala-Bangui est 4.92 jours en moyenne et les covariables qui ont une influence significa-tive sur les durées de voyage sur ce corridor sont : le nombre de sorties corridor et la vitessemaximale atteinte par les camions.

Cependant, notre étude rencontre beaucoup de limites à savoir :

– les indicateurs de délais de voyage proposer ne reflètent que l’état des voyages en 2011 ;– la taille de l’échantillon qui peut ne pas nous rassurer dans les résultats données par

le modèle de Cox ;– l’absence de certaines covariables pouvant expliquer les durées de voyage par exemple

le temps mis sur certaines zones géographiques (zones de prédominance d’arrêts), l’état

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

CONCLUSION 64

des routes, les accidents de la route, les pannes de véhicules,...Une étude un peu plus approfondie devrait donc être menée par exemple repousser la date defin de l’étude pour les durées censurées en 2012 et refaire les estimations précédentes. Aussi,considérer 2 échantillons pour chaque corridor, en prenant comme premier échantillon, lesvoyages qui ont traversé le premier check-point et pas le deuxième et comme deuxièmeéchantillon les voyages qui ont traversé le deuxième check-point et ne sont pas arrivés auxpostes frontières. dans ce cas, faire plutôt une estimation non paramétrique de la loi desdurées de voyage en présence de durées censurées par intervalle. Proposer par exemple,un modèle de régression multiple pour expliquer les durées de voyage et voir si ce modèleretient ou suggère d’autres covariables que le modèle de Cox n’a pas fournies. Néanmoins,nous recommandons à la DGD de :

– s’assurer que les itinéraires des 2 corridors sont couverts par le réseau des opérateurstéléphoniques auxquels sont rattachés les GPS ;

– permettre des vitesses rapides mais raisonnables (sans excès) ;– s’assurer du bon état des routes sur les itinéraires de ces corridors ;– s’assurer que les contrôles routiers sur les camions en transit sont limités.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

ANNEXE A : PRESENTATION DES CORRIDORS 65

Annexe A : PRESENTATION DESCORRIDORS

Le projet d’interconnexion des douanes de l’espace Communauté Economique et Moné-taire de l’Afrique Centrale (CEMAC) a identifié plusieurs corridors de transit entre les Etatsmembres parmi lesquels 2 sont conventionnels Douala-N’Djamena et Douala-Bangui. Chaquecorridor peut avoir plusieurs itinéraires (routier, ferroviaire, aérien et fluvial). La carte descorridors douaniers des états menbres de la CEMAC est donnée par la figure 4.12 :

Figure 4.12 – Présentation des corridors de transit

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

ANNEXE B: PROGRAMME R 66

Annexe B : PROGRAMME R

# Importation du tableau de données du corridor Douala-N’Djamena.tab.1 <- read.csv2("dur_Dla_Ndj.csv", dec=".")

# Indice des voyages pour lesquels la duree est > à 2 joursind.1 <- which(tab.1$duree_voyage >= 2)

# Nouveau jeu de données pour le corridor Douala-N’Djamena.tab.Ndj <- tab.1[ind.1,]

# Indice des durees non censuréesind.nc.1 <- which(tab.Ndj$etat==1)

# Tableau des durees observées Douala-Ndjamenatab.Ndj.n.c <- tab.Ndj[ind.nc.1,]

# Resumé statistique Douala-Ndjamenaresum.1 <- summary(tab.Ndj.n.c)

# Respect des délais fixés par la Douane sur le corridor Douala-N’Djamenar.1 <- tab.Ndj.n.c$duree_voyage[tab.Ndj.n.c$duree_voyage <= 20]nb.Ndj <- length(r.1)/length(tab.Ndj.n.c$duree_voyage)*100

# Importation du tableau de données du corridor Douala-Bangui.tab.2 <- read.csv2("dur_Dla_Bang.csv", dec=".")

# Indice des voyages pour lesquels la duree est > à 2 joursind.2 <- which(tab.2$duree_voyage >= 2)

# Nouveau jeu de données pour le corridor Douala-Banguitab.Bang <- tab.2[ind.2,]

# Indice des durees non censuréesind.nc.2 <- which(tab.Bang$etat==1)

# Tableau des durees observées Douala-Banguitab.Bang.n.c <- tab.Bang[ind.nc.2,]

# Resumé statistique Douala-Banguiresum.2 <- summary(tab.Bang.n.c)

# Respect des délais fixés par la Douane sur le corridor Douala-Banguir.2 <- tab.Bang.n.c$duree_voyage[tab.Bang.n.c$duree_voyage <= 20]nb.Bang <- length(r.2)/length(tab.Bang.n.c$duree_voyage)*100

# Tableau de données pour Douala-N’Djamena-Banguitab.Ndj.Bang <- rbind(tab.Ndj, tab.Bang)

# Tableau des durees observées Douala-Ndjamena-Banguitab.Ndj.Bang.n.c <- rbind(tab.Ndj.n.c, tab.Bang.n.c)

# Liste des différentes tableaux des durees de voyages sur les corridors# Douala-N’Djamena et Douala-Bangui

tab <- list(tab.Ndj, tab.Bang, tab.Ndj.Bang)# Liste des différentes tableaux des durees observées de voyages sur# les corridors Douala-N’Djamena et Douala-Bangui

tab.bis <- list(tab.Ndj.n.c, tab.Bang.n.c, tab.Ndj.Bang.n.c)# Tableau de données pour COX sur le corridor Douala-N’Djamena

tab.Ndj.obs <- read.csv2("dur_Dla_Ndj_obs.csv", dec=".")# Indice des durees non censurées pour COX

ind.nc.1.obs <- which(tab.Ndj.obs$etat==1)# Tableau des durees observées pour COX corridor Douala-Ndjamena

tab.Ndj.n.c.obs <- tab.Ndj.obs[ind.nc.1.obs,]# Resumé statistique pour COX corridor Douala-Ndjamena

resum.1.obs <- summary(tab.Ndj.n.c.obs)# Tableau de données pour COX sur le corridor Douala-Bangui

tab.Bang.obs <- read.csv2("dur_Dla_Bang_obs.csv", dec=".")# Indice des durees non censurées pour COX

ind.nc.2.obs <- which(tab.Bang.obs$etat==1)# Tableau des durees observées pour COX corridor Douala-Bangui

tab.Bang.n.c.obs <- tab.Bang.obs[ind.nc.2.obs,]# Resumé statistique pour COX corridor Douala-Bangui

resum.2.obs <- summary(tab.Bang.n.c.obs)# Tableau de données pour COX Douala-N’Djamena-Bangui

tab.Ndj.Bang.obs <- rbind( tab.Ndj.obs, tab.Bang.obs)# Vecteur de caractères qui entrera dans le titre des figures

lab <- c("Douala-N’Djamena", "Douala-Bangui")

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

ANNEXE B: PROGRAMME R 67

# Chargement de la librairie permettant de faire l’anlyse de survielibrary(survival)

##---------------------------------------------------------------------#### ANALYSE DESCRIPTIVE DES DONNEES ####---------------------------------------------------------------------##

#-----------------------------------------------------------------------#

## Fonction qui recode une variable quantitative en quantitative## catégorielle par la méthode des k-means

quant2cat <- function (x, nb.gpes=5) {

old.x <- x ;b <- kmeans(old.x, centers=nb.gpes)$cluster ;b

}

# Tables pour les contingences Douala-Ndjamenacont_Dla_Ndj <- data.frame(code_itineraire=tab.Ndj.n.c.obs$code_itineraire

,vitesse_max=tab.Ndj.n.c.obs$vitesse_max,nombre_arrets=tab.Ndj.n.c.obs$nombre_arrets,nombre_sorties=tab.Ndj.n.c.obs$nombre_sorties)

# Tables pour les contingences Douala-Banguicont_Dla_Bang <-data.frame(code_itineraire=tab.Bang.n.c.obs$code_itineraire

,vitesse_max=tab.Bang.n.c.obs$vitesse_max,nombre_arrets=tab.Bang.n.c.obs$nombre_arrets,nombre_sorties=tab.Bang.n.c.obs$nombre_sorties)

## Fonction R qui donne les tables de contingence entre les variables## quantitatives catégorielles

codag <- function(tab, stat = quant2cat, nb.gpes=5){

# Nombre de colonnes de tableau des donnéesq <- ncol(tab)

# Transformation de la variable code_itinéraire en facteurtab$code_itineraire <- factor(tab$code_itineraire)

# Codage de la variable vitesse maximale quantitative en qualitativecod <- stat(tab$vitesse_max, nb.gpes)

# Remplacement de la vitesse maximale par son codage en classetab$vitesse_max <- cod

# Initialisation des tables de contingenceconting <- list()

# Initialisation du test du chi-deuxchi.2 = c()

# Boucle sur les colonnes de la table de contingencefor(j in 1:(q-1)){

# Tableau de contingenceconting[[j]] <- table(tab$code_itineraire, tab[,j+1])conting[[q]] = table(tab[,3], tab[,4])

# Test de chi-deuxchi.2[j] = chisq.test(tab[,1], tab[,j+1])$p.valuechi.2[q] = chisq.test(tab[,3], tab[,4])$p.value

}list(conting, chi.2)

}

# Tableau de données des variables explicatives du corridor# Douala-N’Djamena.

tab_Ndj.obs <- data.frame(poids__net = tab.Ndj.n.c.obs$poids__net,nombre_colis = tab.Ndj.n.c.obs$nombre_colis,vitesse_max = tab.Ndj.n.c.obs$vitesse_max)

# Matrice de corrélation entre les variables explicatives quantitatives# pour le corridor Douala-N’Djamena.

mat.cor_Ndj.obs <- round(cor(tab_Ndj.obs),3)# Tableau de données des variables explicatives du corridor Douala-Bangui

tab_Bang.obs <- data.frame(poids__net = tab.Bang.n.c.obs$poids__net,nombre_colis = tab.Bang.n.c.obs$nombre_colis,vitesse_max = tab.Bang.n.c.obs$vitesse_max)

# Matrice de corrélation entre les variables explicatives quantitatives# pour le corridor Douala-N’Djamena.

mat.cor_Bang.obs <- cor(tab_Bang.obs)

# Boxplot des durees de voyages en fonction du nombre d’arrêts et# du nombre de sorties sur les 2 corridors

# Partitionnement de la fenêtre graphique

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

ANNEXE B: PROGRAMME R 68

par(mfrow=c(2,2))# Boxplot des durees de voyages en fonction du nombre d’arrêts# corridor Douala-N’Djamena

boxplot(tab.Ndj.n.c.obs$duree_voyage~tab.Ndj.n.c.obs$nombre_arrets,xlab="Nombre d’arrêts", ylab="Durées voyages",main=paste("Durées de voyages en fonction","du nombre d’arrêts corridor", "Douala-N’Djamena",sep="\n"))

# Boxplot des durees de voyages en fonction du nombre de sorties# corridor Douala-N’Djamena

boxplot(tab.Ndj.n.c.obs$duree_voyage~tab.Ndj.n.c.obs$nombre_sorties,xlab="Nombre de sorties", ylab="Durées voyages",main=paste("Durées de voyages en fonction",

"du nombre de sorties corridor", "Douala-N’Djamena",sep="\n"))# Boxplot des durees de voyages en fonction du nombre d’arrêts# corridor Douala-Bangui

boxplot(tab.Bang.n.c.obs$duree_voyage~tab.Bang.n.c.obs$nombre_arrets,xlab="Nombre d’arrêts", ylab="Durées voyages",main=paste("Durées de voyages en fonction","du nombre d’arrêts corridor", "Douala-Bangui",sep="\n"))

# Boxplot des durees de voyages en fonction du nombre de sorties# corridor Douala-Bangui

boxplot(tab.Bang.n.c.obs$duree_voyage~tab.Bang.n.c.obs$nombre_sorties,xlab="Nombre de sorties", ylab="Durées voyages",main=paste("Durées de voyages en fonction","du nombre de sorties corridor", "Douala-Bangui",sep="\n"))

# Courbes des densités estimées des vitesses maximales sur les 2 corridors# Partitionnement de la fenêtre graphique

par(mfrow=c(1,2))# Densité des vitesses maximales sur le corridor Douala-N’Djamena

plot(density(tab.Ndj.n.c.obs$vitesse_max),xlab="Vitesses maximales",ylab="densité des vitesses maximales",main = paste("densité estimée des vitesses maximales",

"du corridor Douala-N’Djamena",sep="\n"),col="red", cex.lab = 1.5, lwd = 2)

# Barres verticales représentants le codage de la vitesse maximaleabline(v=c(3,29,30,54),col=rep(c(3,6),each=2))

# Densité des vitesses maximales sur le corridor Douala-Banguiplot(density(tab.Bang.n.c.obs$vitesse_max),xlab="Vitesses maximales",

ylab="densité des vitesses maximales",main = paste("densité estimée des vitesses maximales",

"du corridor Douala-Bangui",sep="\n"),col="blue", cex.lab = 1.5, lwd = 2)

# Barres verticales représentants le codage de la vitesse maximaleabline(v=c(2,23,24,54),col=rep(c(3,6),each=2))

# Test de normalité de l’estimation de la densité des vitesses maximales# sur le corridor Douala-N’Djamena

shapiro.test(tab.Ndj.n.c.obs$vitesse_max)# Test de normalité de l’estimation de la densité des vitesses maximales# sur le corridor Douala-Bangui

shapiro.test(tab.Bang.n.c.obs$vitesse_max)

#-----------------------------------------------------------------------#

##---------------------------------------------------------------------#### ESTIMATION NON PARAMETRIQUE DE LA LOI DES DUREES DE VOYAGES SUR #### LES CORRIDORS DOUALA-N’DJAMENA ET DOUALA-BANGUI ####---------------------------------------------------------------------##

#-----------------------------------------------------------------------### Fonction R pour exclure les durées aberrantes sur les corridors## tab.nc : Tableau avec les durées non censurées## tab.comp : Tableau de données complet

nouv_jeu_don <- function(tab.nc,tab.comp){

# Vecteurs des quartiles à 25% et 75%x <- quantile(tab.nc$duree_voyage,prob=c(0.25,0.75))

# Critère d’élimination des valeurs aberrantesD <- x[2] + 3*(x[2] - x[1])D <- as.numeric (D)

# Tableau avec les durées non aberrantestab_naberr <- tab.comp[which(tab.comp$duree_voyage <= D),]

# Tableau avec les durées non aberrantes et non censuréstab_naberr_ncens <- tab_naberr[which(tab_naberr$etat==1),]

# Tableau avec les durées non aberrantes et censuréstab_naberr_cens <- tab_naberr[which(tab_naberr$etat==0),]

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

ANNEXE B: PROGRAMME R 69

# Résultatres.1 <- c(taille.compl = nrow(tab_naberr),

taille.ncens = nrow(tab_naberr_ncens),taille.cens = nrow(tab_naberr_cens), val.crit = D)

res <- list(res.1 = res.1, tab_naberr,tab_naberr_ncens, tab_naberr_cens)res

}

# Tableau de données avec les voyages dont les durées sont non censurées# et non aberrantes sur le corridor Douala-N’Djamena

tab.nc.naber.Ndj <- nouv_jeu_don(tab.Ndj.n.c,tab.Ndj)[[3]]# Tableau de données avec les voyages dont les durées# sont non aberrantes sur le corridor Douala-N’Djamena

tab.naber.Ndj <- nouv_jeu_don(tab.Ndj.n.c,tab.Ndj)[[2]]# Tableau de données avec les voyages dont les durées sont non censurées# et non aberrantes sur le corridor Douala-Bangui

tab.nc.naber.Bang <- nouv_jeu_don(tab.Bang.n.c,tab.Bang)[[3]]# Tableau de données avec les voyages dont les durées# sont non aberrantes sur le corridor Douala-Bangui

tab.naber.Bang <- nouv_jeu_don(tab.Bang.n.c,tab.Bang)[[2]]

# Courbes des densités estimées des durées observées sur les 2 corridors# Partitionnement de la fenêtre graphique

par(mfrow=c(1,2))# Densité estimée des durées observées sur le corridor Douala-N’Djamena

plot(density(tab.nc.naber.Ndj$duree_voyage,bw=1),xlab="Durées observées",ylab="densité des durées observées",main = paste("densité estimée des durées observées",

"du corridor Douala-N’Djamena",sep="\n"),col="red", cex.lab = 1.5, lwd = 2)

# Densité des durées observées sur le corridor Douala-Banguiplot(density(tab.nc.naber.Bang$duree_voyage,bw=1),xlab="Durées observées",

ylab="densité des vitesses maximales",main = paste("densité estimée des durées observées",

"du corridor Douala-Bangui",sep="\n"),col="blue", cex.lab = 1.5, lwd = 2)

# Test de normalité de l’estimation de la densité des durées observées# sur le corridor Douala-N’Djamena

shapiro.test(tab.nc.naber.Ndj$duree_voyage)# Test de normalité de l’estimation de la densité des durées observées# sur le corridor Douala-Bangui

#shapiro.test(tab.nc.naber.Bang$duree_voyage)

#-----------------------------------------------------------------------## Situation des durées non censurées ##-----------------------------------------------------------------------#

## Fonction R qui donne l’estimation de la moyenne, médiane,## variance de la loi T.

stat_non_cens <- function(tab){

attach(tab)# Taille de l’échantillon

n <- nrow(tab)# Moyenne estimé de la loi des durées de voyages

moy_emp <- round(mean(duree_voyage),2)# Variance estimé de la loi des durées de voyages

variance_emp <- var(duree_voyage)# Variance de la moyenne estimée

v_m_emp <- variance_emp/n# IC à 95% pour la moyenne de la loi des durées de voyages

born_low <- moy_emp-(sqrt(variance_emp)*qt(0.975,n-1))/sqrt(n)born_upp <- moy_emp+(sqrt(variance_emp)*qt(0.975,n-1))/sqrt(n)IC_moy <- c(inferieur=born_low,supurieur=born_upp)IC_moy <- round(IC_moy,2)

# Vecteurs des quantiles de la loi des durées de voyagesx <- c(0.1, 0.25, 0.5, 0.75, 0.8, 0.9, 0.95, 0.99)

# Taille du vecteur des quantilesl <- length(x)

# Quantiles des durées de voyagequant_dur_nc <- quantile(duree_voyage,prob=x)

# Transformation en un vecteurt_quant_dur_nc <- as.numeric(quant_dur_nc)

# Vecteur des pourcentages de quantilesy <- c("10%", "25%", "50%", "75%", "80%", "90%", "95%", "99%")

# Tableau des quantiles des durées de voyagestab_quant_nc <- data.frame(y, t_quant_dur_nc)

# Noms des colonnes du tableau des quantiles des durées de voyage

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

ANNEXE B: PROGRAMME R 70

colnames(tab_quant_nc) <- c("Quantiles", "durees de voyage")# Résultat

res.1 = c(moy_emp = moy_emp, IC_moy = IC_moy)#write.csv2(tab_quant_nc,file=readline("nom du fichier au format.csv\n"),row.names=FALSE)

res.1}

# Fonction de répartition empirique sur le corridor Douala-N’Djamena:plot(ecdf(tab.nc.naber.Ndj$duree_voyage),xlab="durées de voyages",col="blue"

,main=paste("Fonction de répartition empirique des durées","de voyage Douala-N’Djamena",sep="\n"), cex.lab=1.5,lwd=2, ylab = "probabilités des durées")

# Représentation des quantiles des duréesx <- c(0.1, 0.25, 0.5, 0.75, 0.8, 0.9, 0.95, 0.99)abline(v=quantile(tab.nc.naber.Ndj$duree_voyage,prob=x),col=1:8, lty=1:8)

# Fonction de répartition empirique sur le corridor Douala-Bangui:plot(ecdf(tab.nc.naber.Bang$duree_voyage), xlab="durées de voyages",col="red"

,main=paste("Fonction de répartition empirique des durées","de voyage Douala-Bangui",sep="\n"), cex.lab=1.5,lwd=2, ylab = "probabilités des durées")

abline(v=quantile(tab.nc.naber.Bang$duree_voyage,prob=x),col=1:8, lty=1:8)

#-----------------------------------------------------------------------## Situation des durées censurées ##-----------------------------------------------------------------------### Fonction R qui donnent les probabilités des durées de survies## sur les corridors Douala-N’djamena et Douala-Bangui.

prob_dur_surv <- function(tab){

# Estimateur de KM de la fonction de survie sur l’échantillon des# voyages

fit <- survfit(Surv(tab$duree_voyage, tab$etat) ~tab$corridor, data = tab)

# Resumé statistiqueres <- summary(fit)

# Tableau des probabilités des durées de survienew.tab <- data.frame(duree_voyage = res$time,

Nbre_voy_ris = res$n.risk,Nbre_voy_non_cens = res$n.event,Prob_surv = res$surv)

# Taille du tableau des probabilités des durées de survien <- nrow(new.tab)attach(new.tab)n.tab <- rbind(0:1,data.frame(duree_voyage,Prob_surv))m <- nrow(n.tab)attach(n.tab)

# Initialisation de la moyenne de la loi de T en chaque instantmoy_inst <- c()

# Initialisation de la variance de la loi de T en chaque instantvar_inst <- c()

# Initialisation du vecteur des différences des temps 2 à 2# consécutifs pour la moyenne

vec.1 <- c()# Initialisation du vecteur des différences des temps 2 à 2# consécutifs pour la variance

vec.2 <- c()# Test pour calculer les différentes estimations

if(max(new.tab$duree_voyage)==max(tab[which(tab$etat==1),]$duree_voyage)){# Boucle sur l’échantillon des temps initiaux

for(k in 1:(m-1)){# Vecteur des différences des temps 2 à 2 consécutifs pour la moy

vec.1[k] <- duree_voyage[k+1] - duree_voyage[k]# Moyenne de la loi de T en chaque instant

moy_inst[k] <- Prob_surv[k]* vec.1[k]# Vecteur des différences des temps 2 à 2 consécutifs pour la var

vec.2[k] <- duree_voyage[k+1]^2 - duree_voyage[k]^2# Variance de la loi de T en chaque instant

var_inst[k] <- Prob_surv[k]* vec.2[k]}}elsestop("On ne peut estimer la moyenne, la médiane et la variance de T")# Estimation de la moyenne de la loi de T

moy_loi <- round(sum(moy_inst),2)# Estimation de la variance de T:

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

ANNEXE B: PROGRAMME R 71

var_loi <- 2*sum(var_inst) - (moy_loi)^2

attach(new.tab)# Estimation de la fonction de répartition

fonct_rep <- 1 - Prob_surv# Vecteur des quantiles à 10%,25%,50%,75%,80%,90%,95%,99%

x <- c(0.1, 0.25, 0.5, 0.75, 0.8, 0.9, 0.95, 0.99)# Taille du vecteur des quantiles

p <- length(x)# Initialisation du vecteur des quantiles des durées

quant_dur <- c()# Boucle sur le vecteur des quantiles

for(i in 1:p){# Boucle sur le tableau des probabilités des durées de survie

for(j in 1:n){# Test de localisation d’un quantile dans la fonction de répartition

if(x[i]==fonct_rep[j])quant_dur[i] <- duree_voyage[fonct_rep==fonct_rep[j]]if((fonct_rep[j]<x[i] && x[i]<fonct_rep[j+1]))quant_dur[i] <- duree_voyage[j]}}

quant_dur[is.na(quant_dur)==TRUE] <- 0# Vecteur des pourcentages de quantiles

y <- c("10%", "25%", "50%", "75%", "80%", "90%", "95%", "99%")# Tableau des quantiles des durées de voyages

tab_quant <- data.frame(y, quant_dur)# Noms des colonnes du tableau des quantiles des durées de voyage

colnames(tab_quant) <- c("Quantiles", "durees de voyage")# Résultat

#write.csv2(new.tab,file=readline("nom du fichier au format.csv\n"),row.names=FALSE)#write.csv2(tab_quant,file=readline("nom du fichier au format.csv\n"),row.names=FALSE)moy_loi

}

## Fonction R pour produire l’échantillon-bootstrap de la statistique

ech.boot.moy <- function(tab, moy = prob_dur_surv, B = 100){

boot.moy <- c() ; n <- nrow(tab) ;for ( b in 1:B)

{# Ré-échantillonnnage dans l’échantillon initial

ind.b <- sample(1:n, size = n, replace = TRUE) ;X.b <- tab[ind.b,] ;

# Valeur de la statistique sur le ré-échantillonnage n° bboot.moy[b] <- moy(X.b)

}boot.moy

}

## Fonction R pour diverses estimations bootstrap sur la statistique## à partir des résultats de la fonction précédente

manip.boot.moy <- function(tab, moy = prob_dur_surv, B = 100){

# Calcul de la statistique sur l’échantillon initialmoy.obs <- moy(tab) ;

# Echantillon de valeurs bootstrap de la statistiqueboot.moy <- ech.boot.moy(tab, moy, B) ;

# Estimation de la moyenne de la statistiquemean.moy <- round(mean(boot.moy),2) ;

# Estimation du biais de la statistiquebiais.moy <- round((mean.moy - moy.obs),2) ;

# Estimation de la variance de la statistiquevar.moy <- round(var(boot.moy),2) ;

# I.C. à 95% du paramètre estimé par la statistiqueI.C.per.95 <- round(quantile(boot.moy, probs = c(0.025, 0.975)),2)

# Résultat : liste de tout ce qui précéderes <- list(moy.obs = moy.obs, mean.moy = mean.moy,

biais.moy = biais.moy, var.moy = var.moy,I.C.per.95 = I.C.per.95)

res}

# Courbe de la fonction de survie corridor Douala-N’Djamenafit.Ndj <- survfit(Surv( tab.naber.Ndj$duree_voyage, tab.naber.Ndj$etat) ~

tab.naber.Ndj$corridor, data = tab.naber.Ndj)plot(fit.Ndj, xlab = "Durées(en jours)", ylab = "Probabilité survie",

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

ANNEXE B: PROGRAMME R 72

main = paste("Courbe de survie des durees", "Douala-N’Djamena",sep="\n"), col="blue", cex.lab = 1.5, lwd = 2)

legend(15, 1, c("Kaplan-Meier","Intervalle de confiance"),lty = c(1,2), lwd = 2, col = "blue", bty = "n")

locator(1, type = "n") # localisation d’un point# Courbe de la fonction de survie corridor Douala-Bangui

fit.Bang <- survfit(Surv(tab.naber.Bang$duree_voyage, tab.naber.Bang$etat) ~tab.naber.Bang$corridor, data = tab.naber.Bang)

plot(fit.Bang, xlab = "Durées(en jours)", ylab = "Probabilité survie",main = paste("Courbe de survie des durees", "Douala-Bangui",sep="\n"), col="red", cex.lab = 1.5, lwd = 2)

legend(8, 1, c("Kaplan-Meier","Intervalle de confiance"),lty = c(1,2), lwd = 2, col = "red", bty = "n")

locator(1, type = "n") # localisation d’un point

# Test du log-Ranknew.tab.Ndj.Bang <- rbind(tab.naber.Ndj, tab.naber.Bang)c.surv <- survdiff(Surv(new.tab.Ndj.Bang$duree_voyage,new.tab.Ndj.Bang$etat)

~ new.tab.Ndj.Bang$corridor, data = new.tab.Ndj.Bang)

# Estimateur de KM de la fonction de survie sur l’échantillonfit <- survfit(Surv(new.tab.Ndj.Bang$duree_voyage, new.tab.Ndj.Bang$etat)

~ new.tab.Ndj.Bang$corridor, data = new.tab.Ndj.Bang)# Représentation de la fonction de survie

plot(fit, lty = 1, col = c("blue","red"), lwd = 2, cex.lab = 1.5,main = paste("Comparaison survie Douala-Bangui",

"et Douala-N’Djamena", sep = "\n"),xlab = "Durées (en jours)",ylab = "Probabilité survie")

legend(17, 1, c("Douala_Ndjamena", "Douala_Bangui"), lty = 1,col = c("blue","red"), lwd = 2, bty = "n")

locator(1, type = "n")#-----------------------------------------------------------------------#

##---------------------------------------------------------------------#### ESTIMATION SEMI PARAMETRIQUE DE LA LOI DES DUREES DE VOYAGES SUR #### LES CORRIDORS DOUALA-N’DJAMENA ET DOUALA-BANGUI: LE MODELE DE COX ####---------------------------------------------------------------------##

#-----------------------------------------------------------------------### Modèle de COX sur le corridor Douala-N’Djamena

# Attachement du tableau de données des durees de voyageattach(tab.Ndj.obs)

# Transformation de l’itinéraire en facteurcode_itineraire <- factor(code_itineraire)code_itineraire <- as.numeric(code_itineraire)-1

# Standardisation des covariablespoids__net <- abs((poids__net-mean(poids__net))/sd(poids__net))vitesse_max <- abs((vitesse_max-mean(vitesse_max))/sd(vitesse_max))

# Modèle de coxcox.Ndj <- coxph(Surv(duree_voyage, etat) ~ poids__net +

nombre_colis + code_itineraire + nombre_arrets+ nombre_sorties + vitesse_max , data = tab.Ndj.obs)

# Resumé sur le modèle de coxres.Ndj <- summary(cox.Ndj)

# Vérification de l’hypothèse de HP# 1) Test des résidus de Schoenfeld

res.c.Ndj <- cox.zph(cox.Ndj)# Partitionnement de la fenêtre graphique

par(mfrow = c(3,2))# 2) Tracer des résidus de Schoenfeld

plot(res.c.Ndj, main = "Résidus de Schoenfeld", cex.lab = 1.5)# Influence des observations

dfbeta <- residuals(cox.Ndj, type = "dfbeta")par(mfrow=c(3,2))for (j in 1:6) {plot(dfbeta[,j], ylab = names(coef(cox.Ndj))[j],main="Résidus du modèle"

,xlab = "durées (en jours)", cex.lab = 1.5)abline(h = 0, lty = 2)}

# Colinéarité des covariablesmat.col.Ndj <- cor(tab.Ndj.obs[,3:7])

# Selection des variablescox.Ndj.select <- step(cox.Ndj, direction = "backward")

## Modèle de COX sur le corridor Douala-Bangui

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

ANNEXE B: PROGRAMME R 73

# Attachement du tableau de données des durees de voyageattach(tab.Bang.obs)

# Standardisation des covariablespoids__net <- abs((poids__net-mean(poids__net))/sd(poids__net))vitesse_max <- abs((vitesse_max-mean(vitesse_max))/sd(vitesse_max))

# Modèle de coxcox.Bang <- coxph(Surv(duree_voyage, etat) ~ poids__net +

nombre_colis + nombre_arrets + nombre_sorties+ vitesse_max, data = tab.Bang.obs)

# Resumé sur le modèle de coxres.Bang <- summary(cox.Bang)

# Vérification de l’hypothèse de HP# 1) Test des résidus de Schoenfeld

res.c.Bang <- cox.zph(cox.Bang)# Partionnement de la fenêtre graphique

par(mfrow = c(3,2))# 2) Tracer des résidus de Schoenfeld

plot(res.c.Bang, main = "Résidus de Schoenfeld", cex.lab = 1.5)# Influence des observations

dfbeta <- residuals(cox.Bang, type = "dfbeta")par(mfrow = c(3,2))for (j in 1:5) {plot(dfbeta[,j], ylab = names(coef(cox.Bang))[j], main="Résidus du modèle"

,xlab = "durées (en jours)", cex.lab = 1.5)abline(h = 0, lty = 2)}

# Colinéarité des covariablesmat.col.Bang <- cor(tab.Bang.obs[,3:7])

# Selection des variablescox.Bang.select <- step(cox.Bang, direction = "backward")

## Vers la recherche du meilleur modèle

# Approche 1: Transformation des v.a.r en quantitative catégorielles# corridor Douala-N’Djamena

# Transformation des variables poids net, nombre de colis et vitesse# maximale en variables quantitatives catégorielles# Librairie pour le recodage des variables

library(car)# Recodage des variables

tab.Ndj.obs$vitesse_max <- recode(tab.Ndj.obs$vitesse_max,"lo:54=1; 206:hi=2")

tab.Ndj.obs$nombre_colis <- recode(tab.Ndj.obs$nombre_colis, "lo:420=1;473:1450=2; 1801:hi=3")

tab.Ndj.obs$poids__net <- recode(tab.Ndj.obs$poids__net, "lo:20308=1;20975:36000=2; 50000:hi=3")

tab.Ndj.obs$code_itineraire <- factor(tab.Ndj.obs$code_itineraire)# Attachement du tableau de données des durees de voyage

attach(tab.Ndj.obs)# Modèle de cox

cox.Ndj.1 <- coxph(Surv(duree_voyage, etat) ~ poids__net +strata(nombre_colis) + code_itineraire + nombre_arrets+ nombre_sorties + vitesse_max , data = tab.Ndj.obs)

# Resumé sur le modèle de coxres.Ndj.1 <- summary(cox.Ndj.1)

# Vérification de l’hypothèse de HPres.c.Ndj.1 <- cox.zph(cox.Ndj.1)

# Selection des variables (critère AIC)cox.Ndj.select.1 <- step(cox.Ndj.1, direction = "backward")

# Modèle final de COX sur le corridor Douala-N’Djamenacox.final.Ndj.1 <- coxph(Surv(duree_voyage, etat) ~ poids__net +

code_itineraire + vitesse_max ,data=tab.Ndj.obs)

# corridor Douala-Bangui# Transformation des variables poids net, nombre de colis et vitesse# maximale en variables quantitatives catégorielles

tab.Bang.obs$vitesse_max <- recode(tab.Bang.obs$vitesse_max,"lo:23=1; 24:hi=2")

tab.Bang.obs$nombre_colis <- recode(tab.Bang.obs$nombre_colis, "lo:190=1;450:1320=2; 1376:hi=3")

tab.Bang.obs$poids__net <- recode(tab.Bang.obs$poids__net, "lo:19097=1;19776:31000=2; 49210:hi=3")

# Attachement du tableau de données des durees de voyageattach(tab.Bang.obs)

# Modèle de coxcox.Bang.1 <- coxph(Surv(duree_voyage, etat) ~ poids__net +

nombre_colis + nombre_arrets + nombre_sorties+ vitesse_max, data = tab.Bang.obs)

# Resumé sur le modèle de coxres.Bang.1 <- summary(cox.Bang.1)

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

ANNEXE B: PROGRAMME R 74

# Vérification de l’hypothèse de HPres.c.Bang.1 <- cox.zph(cox.Bang.1)

# Selection des variables (critère AIC)cox.Bang.select.1 <- step(cox.Bang.1, direction = "backward")

# Modèle final de COX sur le corridor Douala-Banguicox.final.Bang.1 <- coxph(Surv(duree_voyage, etat) ~

nombre_sorties, data = tab.Bang.obs)

# Approche 2: Transformation des v.a.r en logarithme# corridor Douala-N’Djamena

# Transformation des variables poids net, nombre de colis et vitesse# maximale en logarithme# Recodage des variables

tab.Ndj.obs$vitesse_max <- recode(tab.Ndj.obs$vitesse_max, "lo:54=1; 206:hi=2")tab.Ndj.obs$nombre_colis <- log(tab.Ndj.obs$nombre_colis)tab.Ndj.obs$poids__net <- log(tab.Ndj.obs$poids__net)tab.Ndj.obs$code_itineraire <- factor(tab.Ndj.obs$code_itineraire)

# Attachement du tableau de données des durees de voyageattach(tab.Ndj.obs)

# Modèle de coxcox.Ndj.2 <- coxph(Surv(duree_voyage, etat) ~ poids__net +

nombre_colis + code_itineraire + nombre_arrets+ nombre_sorties + strata(vitesse_max), data = tab.Ndj.obs)

# Resumé sur le modèle de coxres.Ndj.2 <- summary(cox.Ndj.2)

# Vérification de l’hypothèse de HPres.c.Ndj.2 <- cox.zph(cox.Ndj.2)

# Selection des variablescox.Ndj.select.2 <- step(cox.Ndj.2, direction = "backward")

# Modèle final de COX sur le corridor Douala-N’Djamenacox.final.Ndj.2 <- coxph(Surv(duree_voyage, etat) ~ poids__net +

code_itineraire, data=tab.Ndj.obs)

# corridor Douala-Bangui# Transformation des variables poids net, nombre de colis et vitesse# maximale en logarithme

tab.Bang.obs$vitesse_max <- log(tab.Bang.obs$vitesse_max)tab.Bang.obs$nombre_colis <- log(tab.Bang.obs$nombre_colis)tab.Bang.obs$poids__net <- log(tab.Bang.obs$poids__net)

# Attachement du tableau de données des durees de voyageattach(tab.Bang.obs)

# Modèle de coxcox.Bang.2 <- coxph(Surv(duree_voyage, etat) ~ poids__net +

nombre_colis + nombre_arrets + nombre_sorties+ vitesse_max, data = tab.Bang.obs)

# Resumé sur le modèle de coxres.Bang.2 <- summary(cox.Bang.2)

# Vérification de l’hypothèse de HPres.c.Bang.2 <- cox.zph(cox.Bang.2)

# Selection des variablescox.Bang.select.2 <- step(cox.Bang.2, direction = "backward")

# Modèle final de COX sur le corridor Douala-Banguicox.final.Bang.2 <- coxph(Surv(duree_voyage, etat) ~ nombre_sorties

+ vitesse_max, data = tab.Bang.obs)

# Comparaison approche 1 et approche 2# corridor Douala-N’Djamena

# D’après le critère AIC des 2 approches sur ce corridor c’est# celui de l’approche 1 que nous retenons.# Meilleur modèle de COX du corridor Douala-N’Djamena

cox.final.Ndj <- cox.final.Ndj.1# Estimation des paramètres

res.final.Ndj <- summary(cox.final.Ndj)

## Fonction R pour la prédiction des risques instantanés conditionnement## aux covariables pertinentes sur le corridor Douala-N’Djamena

pred.inst.Ndj <- function(cox.final.Ndj, newdata.1){# Taille du tableau des données pour la prédiction

p <- nrow(newdata.1)# Coefficient du modèle finale de Cox

coeff <- cox.final.Ndj$coefficients# Fonction de risque instantané de base

risq_bas <- basehaz(cox.final.Ndj, centered = TRUE)# Taille de la matrice de risque de base

m <- nrow(risq_bas)risq <- matrix(0, m, p)for(i in 1:p){risq[,i] <- risq_bas[,1]*exp(coeff[1]*newdata.1[i,1] +

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

ANNEXE B: PROGRAMME R 75

coeff[2]*newdata.1[i,2] + coeff[3]*newdata.1[i,3])}

# tableau de prédiction des risques des nouveaux voyagestab.pred <- cbind(risq_bas, risq)tab.pred <- round(tab.pred, 2)

#write.csv2(tab.pred,file=readline("nom du fichier au format.csv\n"),# row.names=FALSE)

tab.pred# Réprésentation du risque instantané

for(i in 1:p){plot(tab.pred[,i+2]~tab.pred[,2], col=i, type="l",

xlab = "durées observées", ylab = "risques instantanés",main = paste("Courbes des prédictions des risques instantanés",

"conditionnellement aux covariables pertinentes","corridor Douala-N’Djamena",sep="\n"),

ylim=c(min(risq),max(risq)), lwd=2)par(new=TRUE)}

legend(50, 11, c("(10000,1,15)","(15000,0,17)","(20000,0,32)","(25000,1,37)","(30000,1,46)"), col=1:p, lwd = 2, bty = "n")

}

# corridor Douala-Bangui# D’après le critère AIC des 2 approches sur ce corridor c’est# celui de l’approche 2 que nous retenons.# Meilleur modèle de COX du corridor Douala-Bangui

cox.final.Bang <- cox.final.Bang.2# Estimation des paramètres

res.final.Bang <- summary(cox.final.Bang)

## Fonction R pour la prédiction des risques instantanés conditionnement## aux covariables pertinentes sur le corridor Douala-Bangui

pred.inst.Bang <- function(cox.final.Bang, newdata.2){# Taille du tableau des données pour la prédiction

p <- nrow(newdata.2)# Coefficient du modèle finale de Cox

coeff <- cox.final.Bang$coefficients# Fonction de risque instantané de base

risq_bas <- basehaz(cox.final.Bang, centered = TRUE)# Taille de la matrice de risque de base

m <- nrow(risq_bas)risq <- matrix(0, m, p)for(i in 1:p){risq[,i] <- risq_bas[,1]*exp(coeff[1]*newdata.2[i,1] +

coeff[2]*newdata.2[i,2])}

# tableau de prédiction des risques des nouveaux voyagestab.pred <- cbind(risq_bas, risq)tab.pred <- round(tab.pred, 2)

#write.csv2(tab.pred,file=readline("nom du fichier au format.csv\n"),# row.names=FALSE)

tab.pred# Réprésentation du risque instantané

for(i in 1:p){plot(tab.pred[,i+2]~tab.pred[,2], col=i, type="l",

xlab = "durées observées", ylab = "risques instantanés",main = paste("Courbes des prédictions des risques instantanés",

"conditionnellement aux covariables pertinentes","corridor Douala-Bangui",sep="\n"),

ylim=c(min(risq),max(risq)), lwd=2)par(new=TRUE)}

legend(100, 1.2, c("(2,20)","(4,31)","(6,39)","(8,45)","(10,60)"),col=1:p, lwd = 2, bty = "n")

}

## Programme d’exécution des fonctions précédentessource("C:\\Codes R mémoire NSHARE\\Code final mémoire\\

New tab mémoire\\code_final_mémoire_NSHARE_Cox.R")

# Tableau de contingence entre les variables quantitatives catégorielles# pour le modèle expliquant les durées corridor Douala-N’Djamena

codag_Ndj <- codag(tab.Ndj.obs, stat = quant2cat, nb.gpes=2)# Tableau de contingence entre les variables quantitatives catégorielles# pour le modèle expliquant les durées corridor Douala-Bangui

codag_Bang <- codag(tab.Bang.obs, stat = quant2cat, nb.gpes=2)

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

ANNEXE B : PROGRAMME R 76

# Estimation de la moyenne et des quantiles des durées sur le# corridor Douala-N’Djamena en situation non censuré et IC de la moy

estim_mq_nc_Ndj <- stat_non_cens(tab.nc.naber.Ndj)# Estimation de la moyenne et des quantiles des durées sur le# corridor Douala-Bangui en situation non censuré et IC de la moy

estim_mq_nc_Bang <- stat_non_cens(tab.nc.naber.Bang)# Estimation de la moyenne et des quantiles des durées sur le# corridor Douala-N’Djamena en situation censuré

estim_mq_Ndj <- function(tab.naber.Ndj)# Estimation de la moyenne et des quantiles des durées sur le# corridor Douala-Bangui en situation censuré

estim_mq_Bang <- function(tab.naber.Bang)# Intervalle de confiance de la moyenne en situation censurée sur# le corridor Douala-N’Djamena

Int_moy_Ndj <- manip.boot.moy(tab.naber.Ndj,moy=prob_dur_surv,B=100)# Intervalle de confiance de la moyenne en situation censurée sur# le corridor Douala-Bangui

Int_moy_Bang <- manip.boot.moy(tab.naber.Bang,moy=prob_dur_surv,B=100)# Prédiction des risques instantanés corridor Douala-N’Djamena

x.1 <- c(10000,15000,20000,25000,30000)y.1 <- c(1,0,0,1,1)z.1 <- c(15,17,32,37,46)newdata.1 <- data.frame(x.1,y.1,z.1)pred_dur_Ndj <- pred.inst.Ndj(cox.final.Ndj, newdata.1)

# Prédiction des risques instantanés corridor Douala-Banguix.2 <- c(2,4,6,8,10)y.2 <- c(20,31,39,45,60)newdata.2 <- data.frame(x.2,y.2)pred_dur_Bang <- pred.inst.Bang(cox.final.Bang, newdata.2)

#-----------------------------------------------------------------------#

##------------------------ FIN DU PROGRAMME R -------------------------##

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

BIBLIOGRAPHIE 77

Bibliographie

[1] Groupement de cabinets, SIM S.p.A/CRETES CA (2011). Mission d’enquêtes et suiviévaluation des impacts socioéconomiques du Programme de Facilitation du Transport deTransit sur les Corridors Douala-N’Djamena et Douala-Bangui. Cameroun.

[2] NJANKE TATCHOU, M. (2008). Transports et échanges commerciaux dans les pays dela CEMAC. Mémoire pour l’obtention du diplôme de Master en Economie des Trans-ports. Université de Yaoundé II Soa, Cameroun.

[3] Missimahu SOUNOUVOU, G.J. (2007). Contribution à l’amélioration du transport in-ternational de marchandises : Cas du corridor BENIN-NIGER. Mémoire pour l’obten-tion du diplôme de Master Professionnelle en Transport Logistique. Université Interna-tionale du Benin , Benin.

[4] Le Bureau Sous Régional pour l’Afrique Centrale des Nations Unies, article (2009).L’état d’avancement du Plan-Cadre pour l’Afrique Centrale en Matière de transports.CA/NRP.

[5] Programme de facilitation du transport sur les corridors Douala - Bangui et Douala -N’Djamena(2009). Resumé du plan d’expropriation, de compensation et de reinstallationdes populations. OINF.

[6] CEA, article (2006). Programme régional d’infrastructures de transport et la facilitationdu transit dans les couloirs en Afrique Centrale. CA/NRP.

[7] Cabinet JYD et Consultants (2010). Ré-conceptualisation du système de facilitation etde sécurisation des marchandises en transit existant en vue d’une automatisation desinterfaces SYDONIA et de la plateforme de géo-localisation NEXUS Plus : Rapportfinal. SARL, Cameroun.

[8] NDONG NGUEMA, E.P. (2012). Cours de Durées Censurées. ENSP, Université deYaoundé I, Cameroun.

[9] TEWA, J.J. (2011). Cours de Statistiques Mathématiques. ENSP, Université de YaoundéI, Cameroun.

[10] Cox, D.R., OAKES, D. (1984). Analysis of Survival Data. Chapman and Hall.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012

BIBLIOGRAPHIE 78

[11] DROESBEKE, J.J. et FICHET, B. et TASSI, P. (1989). ANALYSE STATISTIQUEDES DUREES DE VIE : Modélisation des données censurées. Paris, France.

[12] http ://www.univ-orleans.fr/deg/masters/ESA/GC/sources/Survie(L’APPROCHE SEMI-PARAMETRIQUE : LE MODELE DE Cox)

[13] Rossi, P.H. et Berk, R.A. et Lenihan, K.J. (1980). Cours 7 : Exemple et Programmation.Academic Press, New York.

[14] Rouvière, L. (2008). Régression sur variables catégorielles. Université Rennes 2, France.

Mémoire de Master de Statistique Appliquée. NSHARE NJIKAM Emmanuel Cyril © ENSP 2010-2012