14
ARTICLE ORIGINAL / ORIGINAL ARTICLE DOSSIER L exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains Use of smart card data to plan urban public transport M. Trépanier Reçu le 13 décembre 2010 ; accepté le 7 juillet 2011 © IFSTTAR et Springer-Verlag France 2011 Résumé Les systèmes de paiement par cartes à puce sont maintenant légion dans les réseaux de transport collectif urbains. En plus de jouer leur rôle premier, qui est le contrôle des recettes clientèle, ces systèmes collectent continuelle- ment dénormes quantités de données transactionnelles sur lutilisation des services dautobus, de train, de tramway et de métro. De par la nature spatiotemporelle des informations récoltées, la carte à puce constitue un instrument de planifi- cation des transports très riche, pourvu que les données soient correctement traitées, le tout sous la plus grande confi- dentialité. Cette communication présente plus de cinq années de travaux de recherche effectués en collaboration avec la Société de transport de lOutaouais (STO), au Québec. Les expériences suivantes sont relatées : traitement des erreurs, détermination du point de descente, diffusion de statistiques opérationnelles, analyse du comportement des usagers, ana- lyse de loffre, comparaison avec les résultats dune enquête ménage originedestination et modélisation de la survie des usagers. Pour citer cette revue : Rech. Transp. Secur. 28 (2012). Mots clés Transport collectif · Carte à puce · Planification des transports · Systèmes dinformation · Logistique opérationnelle Abstract Smart card fare collection systems are widely used nowadays in urban public transport networks. These systems are bound to facilitate the collection and management of revenues in transit authorities. However, since smart card systems collect a large amount of data on a daily basis, they can be exploited to better characterize the demand and supply of public transport in subways, tramways and bus networks, while data at an individual level should remain strictly confidential. The spatial and temporal dimensions of the data make it very interesting for planning purposes, but the data must first be validated and completed before further analysis. This article presents the results of five years of research conducted in collaboration with theSociété de transport de lOutaouais, in Quebec. The following ana- lyses are presented: error processing, estimation of alighting points, diffusion of operational statistics, analysis of user behaviour, analysis of network performance, comparison with household survey data and user loyalty modelling. To cite this journal: Rech. Transp. Secur. 28 (2012). Keywords Public transport · Smart card · Transport planning · Information systems · Operational logistics Introduction La carte à puce, de par la versatilité et la puissance du médium, constitue une des plus intéressantes avancées tech- nologiques dans les services de transport collectif. Intégrée à un système de perception électronique et automatique des titres de transport, la carte permet une collecte en continu de données transactionnelles individualisées sur lutilisation des réseaux de transport collectif. Bien que lobjectif soit doffrir une meilleure gestion des recettes clientèle et de diminuer la fraude, il est clair quun observateur avisé, pla- nificateur ou non, sait que cet enregistrement localisé dans le temps et souvent dans lespace pourra servir à des fins de planification du réseau. En effet, la connaissance apportée par ce système dépasse même celui des systèmes de comptage automatiques qui peuvent déterminer la charge à bord des véhicules mais ne permettent pas de déterminer quels types dusagers sy trouvent. Cet article présente plusieurs travaux de recherche réali- sés avec la Société de transport de lOutaouais (STO), une société de transport de taille moyenne située dans M. Trépanier (*) Département de mathématiques et de génie industriel, École polytechnique de Montréal, casier postal 6079, succursale Centre-ville, Montréal, Québec, Canada, H3C 3A7 e-mail : [email protected] Rech. Transp. Secur. (2012) 28:139-152 DOI 10.1007/s13547-011-0019-z

L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

  • Upload
    m

  • View
    215

  • Download
    2

Embed Size (px)

Citation preview

Page 1: L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

ARTICLE ORIGINAL / ORIGINAL ARTICLE DOSSIER

L’exploitation des données de cartes à puce à des fins de planificationdes transports collectifs urbains

Use of smart card data to plan urban public transport

M. Trépanier

Reçu le 13 décembre 2010 ; accepté le 7 juillet 2011© IFSTTAR et Springer-Verlag France 2011

Résumé Les systèmes de paiement par cartes à puce sontmaintenant légion dans les réseaux de transport collectifurbains. En plus de jouer leur rôle premier, qui est le contrôledes recettes clientèle, ces systèmes collectent continuelle-ment d’énormes quantités de données transactionnelles surl’utilisation des services d’autobus, de train, de tramway etde métro. De par la nature spatiotemporelle des informationsrécoltées, la carte à puce constitue un instrument de planifi-cation des transports très riche, pourvu que les donnéessoient correctement traitées, le tout sous la plus grande confi-dentialité. Cette communication présente plus de cinq annéesde travaux de recherche effectués en collaboration avec laSociété de transport de l’Outaouais (STO), au Québec. Lesexpériences suivantes sont relatées : traitement des erreurs,détermination du point de descente, diffusion de statistiquesopérationnelles, analyse du comportement des usagers, ana-lyse de l’offre, comparaison avec les résultats d’une enquêteménage origine–destination et modélisation de la survie desusagers. Pour citer cette revue : Rech. Transp. Secur. 28(2012).

Mots clés Transport collectif · Carte à puce · Planificationdes transports · Systèmes d’information · Logistiqueopérationnelle

Abstract Smart card fare collection systems are widely usednowadays in urban public transport networks. These systemsare bound to facilitate the collection and management ofrevenues in transit authorities. However, since smart cardsystems collect a large amount of data on a daily basis,they can be exploited to better characterize the demand andsupply of public transport in subways, tramways and bus

networks, while data at an individual level should remainstrictly confidential. The spatial and temporal dimensionsof the data make it very interesting for planning purposes,but the data must first be validated and completed beforefurther analysis. This article presents the results of fiveyears of research conducted in collaboration with theSociétéde transport de l’Outaouais, in Quebec. The following ana-lyses are presented: error processing, estimation of alightingpoints, diffusion of operational statistics, analysis of userbehaviour, analysis of network performance, comparisonwith household survey data and user loyalty modelling.To cite this journal: Rech. Transp. Secur. 28 (2012).

Keywords Public transport · Smart card · Transportplanning · Information systems · Operational logistics

Introduction

La carte à puce, de par la versatilité et la puissance dumédium, constitue une des plus intéressantes avancées tech-nologiques dans les services de transport collectif. Intégrée àun système de perception électronique et automatique destitres de transport, la carte permet une collecte en continude données transactionnelles individualisées sur l’utilisationdes réseaux de transport collectif. Bien que l’objectif soitd’offrir une meilleure gestion des recettes clientèle et dediminuer la fraude, il est clair qu’un observateur avisé, pla-nificateur ou non, sait que cet enregistrement localisé dans letemps et souvent dans l’espace pourra servir à des fins deplanification du réseau. En effet, la connaissance apportéepar ce système dépasse même celui des systèmes decomptage automatiques qui peuvent déterminer la charge àbord des véhicules mais ne permettent pas de déterminerquels types d’usagers s’y trouvent.

Cet article présente plusieurs travaux de recherche réali-sés avec la Société de transport de l’Outaouais (STO),une société de transport de taille moyenne située dans

M. Trépanier (*)Département de mathématiques et de génie industriel,École polytechnique de Montréal, casier postal 6079,succursale Centre-ville, Montréal,Québec, Canada, H3C 3A7e-mail : [email protected]

Rech. Transp. Secur. (2012) 28:139-152DOI 10.1007/s13547-011-0019-z

Page 2: L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

l’Outaouais québécois. Équipée d’un système de carte à pucedepuis 2001, la STO s’est montrée proactive en désirantdéterminer quelles sont les potentialités d’exploitation deses données, qui sont de surcroît localisées dans le temps etdans l’espace grâce à des GPS embarqués. Après avoirrésumé quelques travaux pertinents dans la littérature, l’arti-cle présente la méthodologie utilisée en toile de fond auxdifférents projets : l’approche orientée-objet en transport.On y décrit également le système de validation des titres dela STO, source des bases de données. Ensuite, les analysessont articulées sous forme d’exemples et de conceptstouchant ces domaines :

• le traitement des erreurs détectées dans les donnéesbrutes ;

• la détermination d’un lieu de descente probable pour cha-cune des transactions de montées ;

• la diffusion de statistiques d’achalandage (fréquentation)au sein de la société de transport ;

• la modélisation des comportements quotidiens et saison-niers de la clientèle ;

• l’obtention de statistiques opérationnelles de premièremain sur le service ;

• la mesure de la fidélité des usagers.

Quelques perspectives de recherche viendront conclurecet article.

Fondements

Les systèmes de paiement des services de transport collectifpar cartes à puce permettent une meilleure gestion des recet-tes clientèle, en plus de faciliter l’intégration tarifaire et lesopérations de perception à bord des véhicules. L’utilité detels systèmes est reconnue dans la littérature, malgré certai-nes limitations souvent occasionnées par les coûts impor-tants d’implantation : les opérateurs décident de retirercertaines fonctions (nombre de titres, paiement électronique)plutôt que de risquer de voir leur projet stoppé [1]. Cettesection rapporte quelques travaux pertinents du domaine.

Avantages de la carte à puce

La majorité des auteurs proposent plusieurs avantages quifont de la carte à puce, une technologie enviable pour lesplanificateurs de transport. Ainsi, tous s’entendent à savoirque les avantages principaux liés à l’utilisation de la carteà puce comme système de perception des frais sont lessuivants :

• permet aux agences de transport d’examiner les compor-tements des usagers en offrant un meilleur aperçu que lessondages [2] ;

• permet des structures tarifaires plus complexes [3] ;

• permet l’intégration multiréseau [3] ;

• amène à long terme une réduction des coûts de percep-tion [4] ;

• facilite la vie aux chauffeurs [3,4] ;

• permet d’observer les habitudes de déplacements des usa-gers sur une plus longue période [5].

Genèse des données

Les systèmes de paiement par cartes à puces récoltent desdonnées transactionnelles de façon ininterrompue. Bagchiet White [6] ont catégorisé ces données de la façon suivante :

• information spatiale : lieu d’embarquement, lieu de débar-quement dans certains cas, durée de trajet (dans le cas oùon connaît les lieux de montée et de descente) ;

• information temporelle et structurale : date et heured’embarquement, mode de transport et service emprunté ;

• information personnelle sur l’usager : nom, adresse, sexe,âge, possession automobile ;

• information d’achat : type de billet acheté, prix du billet,lieu d’achat.

Le lieu de débarquement n’est pas toujours enregistré. Parcontre, en Corée, ces informations sont recueillies puisqu’ilsont introduit une tarification qui est basée sur la distance deparcours [7]. Conséquemment, un lecteur est positionné à lasortie des autobus ou du métro et les usagers doivent présen-ter au passage leur carte à puce afin de calculer le coût dutrajet réalisé. De la même façon, au Royaume-Uni, une esti-mation de la durée des trajets doit être réalisée pour lesprocessus de remboursement [2]. Ce processus vise à rem-bourser les usagers lorsque surviennent des retards dans leservice. Par contre, les usagers ne sont pas tenus de signalerleur descente avec leur carte à puce. Cette information estdonc obtenue par le biais de sondages [2]. Il est aussi pos-sible d’imputer un lieu plausible de débarquement. À cetégard, Trépanier et al. [8] proposent un modèle afin d’esti-mer les lieux de débarquement en supposant que l’individuva réembarquer au prochain trajet à l’arrêt le plus près du lieuoù il a débarqué. Un résumé plus détaillé de ce modèle seraultérieurement exposé.

Exploitations dans le cadre de la planificationdes transports collectifs

Bagchi et White [2] ont identifié des potentialités d’analysedes données de cartes à puce dans le cadre d’exercices deplanification des réseaux. Ces données ont l’avantage :

• de caractériser chacun des trajets effectués de façonindividuelle ;

140 Rech. Transp. Secur. (2012) 28:139-152

Page 3: L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

• de pouvoir être liés aux caractéristiques sociodémographi-ques des usagers, tout dépendant du niveau de confiden-tialité et des autorisations ;

• de couvrir de longues périodes de temps, ce qui permetdes études longitudinales ;

• de couvrir une grande proportion de la clientèle desréseaux instrumentés.

Ces données sont également avantageuses pour plusieursusages, que ce soit à des fins tarifaires, de marketing oud’amélioration de service [9]. Bien que les contributionsdes données issues des cartes à puce soient de plus en plusreconnues, il n’est pas toujours facile de les utiliser, car deslogiques de continuité du service et de validation d’erreursdoivent y être appliquées [10]. Des processus d’améliorationde la qualité des données, nécessitant des apports de donnéesexternes, sont souvent nécessaires afin d’éliminer les erreurs[5]. Dans cet ordre d’idée, Chu et al. [11] proposent d’utiliserla logique spatiotemporelle ainsi que les concepts de trans-port en commun afin de détecter les valeurs suspectes dansles données et d’améliorer la qualité de ces dernières. Cesujet sera traité à la section « Traitement des erreurs ».

Confidentialité

Les systèmes de perception par cartes à puce soulèvent desquestions quant à la confidentialité des données. Clarke [12]rappelle que la carte à puce n’est qu’une des très nombreusestechnologies permettant de retracer l’identification et leshabitudes d’une personne parmi les systèmes bancaires, poli-ciers, d’immatriculation, de péage routier et qu’en ce sens,des précautions similaires à celles de ces domaines doiventêtre prises pour protéger les informations nominales. Lesdonnées récoltées par les systèmes de perception par carteà puce peuvent être utilisées pour déterminer les schémasde déplacements des individus. Il faut cependant agir confor-mément à la législation en vigueur quant à la protection de lavie privée. Pour le moment, les règles québécoises liées àla confidentialité des données ne permettent pas d’utiliserles profils clientèle sans l’autorisation écrite des usagers.En France, la CNIL [13] a indiqué que le fait d’associer lesdonnées sur la clientèle aux transactions de cartes à puceconstitue un danger. Cependant, il est possible d’appliquerdes algorithmes de séparation et d’encryption d’identifiantsde cartes qui empêchent de faire le lien entre celles-ci et leursporteurs [14].

Méthodologie

Dans cette section, il sera d’abord question d’un exemplede système d’information utilisé pour la gestion et la collectedes données de paiement par carte à puce. Ensuite, le

modèle-objet viendra mettre en perspective les objets et lesdimensions à analyser.

Système d’information et de validationdes titres de la STO

La STO opère une flotte de plus de 200 autobus dans la villede Gatineau, au Québec (240 000 personnes). Gatineau estsituée en face d’Ottawa, sur la rive québécoise de la rivièredes Outaouais (l’agglomération dépasse le million d’habi-tants). Le système informatisé de validation des titres(SIVT) est opérationnel sur l’ensemble de son réseau depuisla fin 2001 et touche maintenant tous les titulaires de titrestarifaires mensuels, soit plus de 80 % des usagers.

Le système implanté à la STO utilise la technologie descartes sans contact (contactless). Chaque usager disposed’une carte identifiée à son nom (avec photo) contenantune puce de stockage de données et une antenne (Fig. 1).La puce contient un identifiant et des données indiquant letype de titre possédé et sa date de validité. Lorsque l’usagermonte dans un autobus de la STO, il passe sa carte devant unlecteur. Ce dernier transmet un signal d’excitation à la carte,qui lui retourne alors ses données. Le lecteur indique ensuite,par un signal lumineux et sonore, si la carte de l’usager estvalide pour la ligne et la direction courantes.

À la fin de la journée, les données collectées dans lesautobus sont transférées dans une base de données centrali-sée. Aux fins de recherche, seules les données sur les vali-dations nous sont rendues accessibles. Aucune informationnominale sur les clients n’est disponible. Sous la plus stricteconfidentialité, voici les variables examinées :

• date et heure de la transaction ou de la validation ;

• type de tarif (régulier, express, interzone, étudiant, aînés,etc.) ;

• numéro et direction de la ligne empruntée ;

• numéro de l’arrêt où a eu lieu la transaction ;

• données opérationnelles telles que le numéro du conduc-teur, de l’autobus et du voyage.

Il faut noter que seuls les usagers habitant dans la pro-vince de Québec détiennent une carte à puce. Ainsi, les usa-gers provenant d’Ottawa et utilisant le réseau de la STO envertu d’une entente de réciprocité ne sont pas comptabilisésdans les transactions. Selon l’enquête ménage de 2005, cesusagers d’Ottawa représentent 14,8 % de la clientèle.

Modèle-objet

L’approche orientée-objet en transport a été utilisée pourdéfinir et quantifier les concepts inhérents à l’analyse dedonnées de cartes à puce. Cette approche, développée parTrépanier et Chapleau [15], préconise l’identification desobjets en présence selon quatre métaclasses qui encadrent

Rech. Transp. Secur. (2012) 28:139-152 141

Page 4: L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

les propriétés et méthodes pouvant être appliquées à cesobjets :

• dynamiques (qui se déplacent, tels que les véhicules et lespersonnes) ;

• cinétiques (descripteurs du mouvement, tels que leslignes) ;

• statiques (supports immobiles faisant partie du système detransport, tels que les arrêts) ;

• systémiques (fédérateurs des autres objets).

Le modèle-objet de la Figure 2 présente les relations entreles objets. Lorsque disponible, le nombre d’instances de cesobjets est indiqué pour l’intervalle de dates couvrant lapériode d’analyse la plus large des expérimentations effec-tuées, soit celle de la modélisation du taux de survie (2004 à2009).

Les objets sont regroupés selon leur fonction. Les objetsdu réseau de transport collectif (A) représentent leséléments « visibles » du réseau de transport. Les objets« ligne-direction », définis comme étant des tracés de lignesunidirectionnels, parcourent les objets « lignes-arrêt » selonune séquence d’objets « arrêt » déterminée pour chaqueobjet « ligne ». Le parcours d’un objet « ligne-direction »par un véhicule est appelé objet « voyage » dans le vocabu-laire québécois. Enfin, citons l’objet « ligne de fuite », quireprésente la séquence d’objets « ligne-arrêt » parcouruepar l’usager qui effectue un déplacement (52 millions de

montées dans ce cas-ci). Les objets opérationnels (B) défi-nissent la mécanique de fonctionnement du service. À laSTO, sur la période donnée, 1 017 chauffeurs distincts ontutilisé 343 autobus différents pour offrir le service. Cela areprésenté plus de 400 000 journées de travail, divisées enpièces de travail (plans d’horaires contigus).

Les objets administratifs (C) regroupent les points devente et sont caractérisés par les objets « recharge » (1,2 mil-lion de fois durant la période), « carte » (158 000 émises),« tarif » (68 types différents, certains étant spécifiques à uneannée donnée) et « transaction » (plus de 52 millions). Pource qui est des objets liés à la demande (D), on compte156 670 usagers distincts ayant fait un total de 21,6 millionsde chaînes de déplacements (chacune définissant une jour-née de déplacements) pour un total de 43,9 millions dedéplacements.

Le réseau de la STO est de type suburbain, avec des dépla-cements pendulaires fortement centrés vers le centre-ville etavec peu de correspondances (seuls 34 % des déplacementsd’adultes, titres réguliers, comptent une correspondance ; letaux tombe à 3,1 % pour les détenteurs de titres express). LaFigure 3 démontre qu’une forte proportion d’usagers ne faitque deux déplacements par jour, quel que soit le type de titre.De même, il y a une proportion non négligeable d’usagersqui ne font qu’un seul déplacement en transport collectifpar jour, préférant utiliser d’autres modes pour leurs autresdéplacements.

Fig. 1 Diagramme fonctionnel du paiement par cartes à puce à la STO

142 Rech. Transp. Secur. (2012) 28:139-152

Page 5: L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

Expérimentations

Cette section présente différentes expérimentations effec-tuées au cours des années avec les données du SIVT et dela STO. Le lecteur est invité à consulter les références citéespour obtenir plus de détails sur chacun de ces travaux.

Traitement des erreurs

Le système de perception des titres de la STO est sujet àla présence d’erreurs, comme tout système d’informationd’entreprise. Cela est dû à différentes causes. Il peut s’agird’erreurs systématiques dues à des bris ou à des défectuosités

Fig. 2 Modèle-objet correspondant à la période du 1er janvier 2004 au 30 septembre 2009

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

1 2 3 4 5

Prop

oron

des

usag

ers-

jour

s

Nombre de déplacements par jour

Adultes réguliers

Adultes express

Adultes interzone

Étudiants

Aînés

Collège et université

1.

2.

3.

4.

5.

6.

12 3

1

65

4

2 3

65

4

1 3654

1 6542

Fig. 3 Répartition du nombre de déplacements par jour par usager, septembre et octobre 2008

Rech. Transp. Secur. (2012) 28:139-152 143

Page 6: L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

de l’équipement embarqué. Il peut également y avoir unedésynchronisation entre les données opérationnelles (horaireplanifié) et la réalité, comme par exemple dans le cas depannes de véhicules ou de détours aux parcours. Bref, bienque la qualité des données se soit considérablement amélio-rée au cours des années, il convient d’utiliser des méthodespour détecter et, le cas échéant, corriger les données.

Les premiers travaux effectués par Tranchant [16] ont per-mis de répertorier et de catégoriser les erreurs pour unepériode limitée. Par exemple, à la Figure 4, on constate quele taux d’erreurs est d’environ 1/15. On retrouve des transac-tions associées à une ligne « 0 » (sans attache), des arrêtssitués sur une ligne inexistante pour la journée donnée, desarrêts en bout de ligne, etc. Notons que les erreurs n’ont paspour conséquence d’éliminer la donnée associée. Celle-ci estplutôt consignée et utilisée en fonction de la statistique cal-culée. Par exemple, le genre d’erreur décrit précédemmentn’a pas d’incidence sur le nombre total de montées, maispourrait impacter le nombre de montées d’une ligne précisesur le réseau.

Chu et Chapleau [10] ont proposé une série de méthodespermettant de corriger ces erreurs. Elles impliquent notam-ment la reconstruction du service opéré en fonction des don-nées observées et du service planifié. Cette opération permetd’identifier de facto les lignes erronées, les mauvaises heuresde départ et les localisations fautives dues à une assignationincorrecte du service planifié (ligne et heure de départ) dans

l’ordinateur de bord du système de perception. Cependant,une automatisation complète de l’application de ces métho-des reste à venir.

Détermination de la destination

Un des premiers éléments à déterminer à l’aide des donnéesprovenant de systèmes de perception par carte à puces est lelieu de descente de chaque usager sur les lignes. En effet, leSIVT de la STO est conçu de telle façon que seule la tran-saction de montée est enregistrée, ce qui est le cas de la plu-part des systèmes existants à travers le monde. Cependant,le SIVT a l’atout de pouvoir enregistrer la localisation spa-tiale du point de montée, ce qui facilite l’identification dupoint de descente.

La méthode développée repose sur la continuité desdéplacements au cours de la journée [8]. Ainsi, à chaquemontée correspond une ligne de fuite regroupant les arrêtsde descente potentiels (Fig. 5). Le lieu de montée suivant del’usager (qu’il s’agisse d’une correspondance ou de la ligneempruntée plus tard dans la journée) est utilisé pour retrou-ver, dans cette ligne de fuite, l’arrêt le plus près (avec unetolérance maximale), constituant ainsi le lieu de descenteplausible. Le déplacement est ainsi qualifié de « régulier ».

La Figure 6 présente les résultats de l’application de l’algo-rithme sur les données de février 2009. La méthode doitégalement tenir compte du déplacement de la fin de journée.

Fig. 4 Statistiques d’identification des erreurs pour les données de juillet 2003 [16]

144 Rech. Transp. Secur. (2012) 28:139-152

Page 7: L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

Ici, l’algorithme essaie d’identifier la destination en exami-nant successivement le premier lieu de montée de la journéeet le premier lieu de montée du lendemain. Les déplacementsqualifiés d’« unitaire » sont ceux dont il n’est pas possibled’identifier la destination à l’aide de la méthode de la ligne defuite. Pour ces déplacements, on fait appel à l’historiquecomplet de l’usager pour essayer de retrouver des circons-tances similaires (heure de départ, ligne, arrêt) pour lesquel-les une destination est déjà estimée. En cas de succès, ladestination trouvée est imputée à ce déplacement unitaire.Le taux de réussite de l’algorithme a été de 92,7 % pour lemois de février 2009, mais il s’agit d’un taux hypothétique,puisqu’aucune des destinations trouvées n’a pas pu être vali-dée avec des observations réelles. La méthode a été utiliséeet adaptée avec succès par l’équipe de Munizaga et al. auChili [17].

Diffusion de statistiques

Le système SIVT récolte des données en continu sur toutes lescomposantes du service d’autobus. Plutôt que de laisser dor-mir ces millions d’observations dans les entrepôts de données,il convient de diffuser en interne de la société de transport unesérie de statistiques simples découlant de l’opération. En plusde renseigner de façon très précise sur les conditions opéra-tionnelles, cette diffusion a l’avantage de faciliter la détectiond’erreurs dans le système, puisque les contrôleurs peuventconfronter la réalité rapportée aux statistiques calculées.

Le système développé calcule une série de statistiquesdescriptives sur l’opération, telles que le nombre de mon-tants par ligne, le nombre de passagers-kilomètres, la répar-tition des types de titres utilisés, etc. Générées durant la nuità partir des données de la veille, les statistiques peuvent

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Prop

oron

desm

onté

esde

l'heu

redo

nnée

Heure de la journéeDépl. Unitaire es�mé

Dépl. Fin de journée es�mé

Dépl. régulier es�mé

Non es�mé

Fig. 6 Résultats de l’application de l’algorithme d’estimation des destinations (données de février 2009)

Pointd’embarquement

1re ligne dela journée

2e ligne de lajournée

3e lignede la journée

Usager i

d(a,b)

d(a,b) < M

ikd1

Arrêts de descenteestimés

Arrêts

2e

embarquement

3e embarquement

Fig. 5 Schéma décrivant le modèle d’estimation des lieux de descente, pour les déplacements de type « normal »

Rech. Transp. Secur. (2012) 28:139-152 145

Page 8: L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

également prendre la forme de graphes interactifs grâce auxtechnologies XML (extended markup language, stockage etmise en forme de données) et SVG (standard vector gra-phics, affichage). La Figure 7 est un exemple de profil decharge interactif généré en format SVG et pouvant être exa-miné à même un navigateur web. En déplaçant la souris,l’usager peut interroger chacun des arrêts, déterminer lestypes de titres associés et connaître le nombre de correspon-dances, ce pour chacun des voyages opérés [18].

Analyse du comportement des usagers

L’examen longitudinal d’un si grand nombre de transactionspermet d’obtenir des informations de première main sur lescomportements de la clientèle. Des techniques de datamining sont utilisées pour déterminer des groupes d’usagersayant des similarités en fonction de leurs habitudes dedéplacements [19]. Dans l’exemple rapporté ici, le conceptd’usager-semaine représente le comportement typique del’usager durant la semaine. Chaque observation est caracté-risée par le nombre de montées effectuées dans quatre pério-des à chaque jour, pour un total de 28 paramètres. Unetechnique de classification automatique (k-means) estensuite appliquée pour déterminer des groupes. Dans cetexercice, quatre groupes principaux ont été identifiés : legroupe 1 représente les déplacements pendulaires matin etsoir, le groupe 2 se déplace souvent durant la journée, le

groupe 3 représente les lève-tôt, et le groupe 4 se déplaceassez peu. Le Tableau 1 présente la distribution desusagers-semaines en fonction du type de titre utilisé.

Ce genre d’analyse permet non seulement de savoir dansquel groupe se situe chaque carte prise individuellement,mais également comment varie cette appartenance au fildes semaines. En effet, le comportement hebdomadairen’est pas constant pour tous les usagers comme en fait foila Figure 8, où on constate par exemple que les adultesidentifiés au groupe 1 n’ont un comportement constant sur11 semaines que dans environ 30 % des cas. Cela pourraitcontribuer à raffiner la planification des horaires du service,qui sont habituellement fixés pour de longues périodes.

Ce genre d’analyse peut être également conduit dans lecas des usagers-jours. On examine alors la journée typiqueen la découpant en 24 périodes d’une heure. Ce raffinementpermet de distinguer de façon précise les variations compor-tementales de chaque individu, comme par exemple à laFigure 9 où on examine l’appartenance quotidienne d’unecarte de type « aîné » à un ensemble de 30 groupes définisà partir de techniques de data mining.

La finesse des observations peut également servir à exa-miner l’évolution de l’apprentissage du réseau par les usa-gers, c’est-à-dire le nombre d’arrêts différents utilisés au fildes jours. À la Figure 10, on observe une lente augmentationdu nombre moyen d’arrêts « assimilés », puis un saut aprèsune période de six mois, dû à l’arrivée de la saison estivale.

Fig. 7 Exemple de profil de charge interactif généré sur demande pour une ligne donnée, à une date et une heure données (adaptée de

Trépanier et Vassivière 2008 [18)]

146 Rech. Transp. Secur. (2012) 28:139-152

Page 9: L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

À cet effet, il est possible que cet « apprentissage » soit aussifonction de la variation des motifs et des besoins de dépla-cements, engendrant des changements dans les localisationsà atteindre sur le réseau.

Analyse de l’offre

Bien que les données de cartes à puce soient traditionnelle-ment associées à la caractérisation de la demande, il est toutaussi intéressant de les utiliser pour analyser l’offre de trans-port collectif. En effet, l’enregistrement de transactions surles montées à un niveau très précis dans le temps et l’espacepermet de calculer des indicateurs de service [20]. Ces indi-cateurs peuvent être ventilés en fonction du type de titre uti-lisé, ce qui est impossible à faire à l’aide des systèmes d’aideà l’exploitation, à moins qu’ils soient justement couplés auxdonnées de perception. Le Tableau 2 permet d’apprécier lafinesse de ces résultats, qui peuvent être obtenus par ligne,pour chaque journée et à des périodes horaires précises. Ony remarque par exemple les différences significatives de

Fig. 8 Proportion des usagers selon leur appartenance aux groupes

pendant 11 semaines d’observation [19]

Tableau 1 Distribution des usagers-semaines en quatre groupes selon le type de titre [19]

Type de carte Groupe 1 (%) Groupe 2 (%) Groupe 3 (%) Groupe 4 (%)

Adulte 58,8 13,9 9,2 18,1

Étudiant 21,0 17,7 26,4 34,8

Aîné 6,2 6,4 7,9 79,5

Régularité temporelle des déplacements sur le réseau de transport en commun -Aîné

02468

1012141618202224262830

2005

-01-

01

2005

-01-

15

2005

-01-

29

2005

-02-

12

2005

-02-

26

2005

-03-

12

2005

-03-

26

2005

-04-

09

2005

-04-

23

2005

-05-

07

2005

-05-

21

2005

-06-

04

2005

-06-

18

2005

-07-

02

2005

-07-

16

2005

-07-

30

2005

-08-

13

2005

-08-

27

2005

-09-

10

2005

-09-

24

2005

-10-

08

Fig. 9 Appartenance des différents jours d’observation aux 30 agrégats formés — titre aîné [19]

Rech. Transp. Secur. (2012) 28:139-152 147

Page 10: L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

vitesses commerciales entre les titres adulte régulier et adulteinterzone (lignes suburbaines). De plus, les étudiants, quieffectuent 26,3 % des montées, ne comptent que pour21 % des passagers-kilomètres.

Puisque les données disponibles à la STO sont dotées degéolocalisations précises, elles permettent de faire des ana-lyses de ponctualité par ligne. Pour ce faire, il s’agit de com-parer les heures de passage aux arrêts enregistrées lors destransactions de montées aux heures de passage planifiéesselon l’horaire. La Figure 11 présente la distribution desobservations de temps de passage en fonction de l’écart à

l’horaire pour une ligne importante du réseau. On yremarque un léger retard par rapport à l’horaire, ce qui estconforme aux normes de service, où l’on garantit un passagemoins de deux minutes après l’horaire, mais où il faut éviterd’avoir plus d’une minute d’avance.

Comparaison avec des données d’enquête ménageorigine–destination

Une grande enquête ménage téléphonique s’est tenue dans lagrande région d’Ottawa-Gatineau à l’automne 2005. Elle a

Nombre d'arrêts différents utilisés (en montée) selon le nombre de joursde déplacements sur le réseau

0

10

20

30

40

50

60

70

80

901-

1011

-20

21-3

031

-40

41-5

051

-60

61-7

071

-80

81-9

091

-100

101-

110

111-

120

121-

130

131-

140

141-

150

151-

160

161-

170

171-

180

181-

190

191-

200

201-

210

211-

220

221-

230

231-

240

241-

250

251-

260

261-

270

Nombre de jours de déplacements sur le réseau

Nom

bre

d'ar

rêts

diffé

rent

sut

ilisé

sen

mon

tée

0

1

2

3

4

5

6

7

8

9

Nom

bre

moy

ende

nouv

eaux

arrê

ts

NouveauxArrêtsMoy-1ETMoy+1ETNbMoyArrêts

Fig. 10 Chronologie d’utilisation d’arrêts différents du réseau de transport en commun sur une plage continue d’observation (janvier à

octobre 2005) [19]

Tableau 2 Statistiques de l’offre de transport calculées à partir de données de cartes à puces et ventilées par type de carte (données

de novembre 2006) [20]

Type de carte Pourcentage

des montées

Pourcentage

des pass-km

Pourcentage

des pass-hr

Vitesse

commerciale

(km/h)

Longueur

des dépl. (km)

Durée

moyenne

des dépl. (min)

Adulte régulier 46,2 38,9 42,3 17,5 7,0 24,1

Adulte express 15,1 21,8 20,4 20,4 12,0 35,3

Adulte interzone 3,0 11,5 8,4 26,2 31,8 72,9

Étudiant 26,3 21,0 21,7 18,4 6,7 21,7

Personnes âgées 3,5 2,1 2,3 17,8 5,1 17,2

Autres 6,0 4,7 5,0 17,9 6,6 22,0

Total 100 100 100 19,0 8,3 26,3

148 Rech. Transp. Secur. (2012) 28:139-152

Page 11: L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

été réalisée auprès de 23 912 ménages, ce qui représente untaux de sondage de 5,1 % (environ 5 000 ménages localiséssur le territoire de la STO). Les ménages ont été sondés surles déplacements effectués la veille de l’appel par tous lesmembres du ménage. Il s’agit d’une excellente occasionpour comparer les statistiques compilées dans cette enquêtesur les déplacements réalisés par les usagers sur le réseau detransport collectif aux données transactionnelles de cartes àpuce enregistrées au cours de la même période.

La Figure 12 présente les résultats de cette comparaisonpour trois lignes importantes du réseau. Trois constats peu-vent être tirés de l’analyse [21] :

• les différences sont notables au niveau des volumes obser-vés sur les lignes, montrant d’un côté l’impossibilité d’ob-tenir une finesse suffisante avec les enquêtes ménage(moins de 300 observations de déplacements pour legroupe des trois lignes), et d’un autre côté la nécessitéd’avoir une méthode d’expansion de l’enquête fondéesur l’achalandage mesuré et non seulement sur lasociodémographie ;

• les enquêtes origine–destination, de par leur concept dejour moyen de semaine établi à partir de deux mois d’en-trevues (sur les observations de déplacements effectués laveille des appels), ne peuvent prendre en compte la varia-bilité quotidienne de l’achalandage sur le réseau, ce quepeut faire l’analyse des données transactionnelles de car-tes à puce ;

• cependant, les enquêtes origine–destination renseignentsur la sociodémographie des usagers et les circonstancesdes déplacements, ce que ne peut faire un système de per-ception par cartes à puce.

Somme toute, l’exercice a démontré qu’il convient dedévelopper une méthode permettant de fusionner les don-nées d’enquêtes aux données de cartes à puce afin de tirerprofit des avantages de chaque ensemble informationnel. Enprincipe, on pourrait remplacer tous les déplacements detransport collectif de l’enquête par un échantillon élargi,sinon l’univers, des déplacements tirés des transactions decartes à puce. Cela nécessiterait par contre de pouvoir asso-cier à chaque déplacement des attributs sociodémographi-ques pertinents (âge, sexe, taille du ménage, etc.) et unmotif dérivé (travail, étude, etc.). Il faudrait également déri-ver une « journée moyenne » des données transactionnelles.Cette méthode d’attribution reste à être définie.

Survie des usagers (fidélité)

Bien que l’information nominale des usagers ne soit pas dis-ponible dans les jeux de données, il est possible de suivre lestransactions d’une même carte au fil du temps. Ainsi, unexamen longitudinal des cartes par type de titre permet decaractériser la fidélité des usagers en leur attribuant un tauxde survie sur le réseau [22]. Ce taux est borné par la date de« naissance », c’est-à-dire la date de première transaction surle réseau, et la date de disparition, où a eu lieu la dernièretransaction enregistrée.

La Figure 13 permet d’apprécier la finesse de ce genred’analyse. Pour chaque mois des années 2004 à 2007, onpeut mesurer le nombre de cartes en service, et suivre cha-cune des cohortes de naissance associées à ces mois (chaquesérie représente l’ajout mensuel de clientèle). On perçoit

0%

2%

4%

6%

8%

10%

12%

14%

16%

-10,0 -9,0 -8,0 -7,0 -6,0 -5,0 -4,0 -3,0 -2,0 -1,0 ,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0

Écart par rapport à l'heure de passage plani ée à l'horaire (minutes)

Nov. 2005

Nov. 2006

Moyenne mobile sur 3périodes (Nov. 2005)Moyenne mobile sur 3périodes (Nov. 2006)

--> En retard

<-- En avance

% des observations

Fig. 11 Conformité à l’horaire dans le cas de la ligne 37 pour les mois de novembre 2005 et 2006 (adapté de Trépanier et al. [20])

Rech. Transp. Secur. (2012) 28:139-152 149

Page 12: L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

aisément les variations saisonnières du nombre d’usagersactifs ainsi que la diminution progressive de la taille descohortes « nées » à chacun des mois. À partir de cettemesure, on peut obtenir le taux de rétention du réseau, définicomme le nombre d’usagers toujours actifs dans le systèmeaprès une certaine période de temps. À la Figure 14, on

remarque que les titres avec paiement bancaire (PB) ont untaux de rétention plus élevé que les autres. Les usagers deslignes express sont également plus fidèles que ceux deslignes régulières. Dans le cas des étudiants collégiaux etuniversitaires, on constate les chutes régulières de rétentiondues aux saisons scolaires.

Fig. 12 Analyse de toutes les montées sur les lignes 46, 50 et 67 de la STO (période de l’enquête origine–destination de 2005,

CAP = carte à puce, EOD = enquête origine–destination)

Fig. 13 Profil de survie des usagers du titre « adultes réguliers » [22]

150 Rech. Transp. Secur. (2012) 28:139-152

Page 13: L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

Conclusion

Cet article a permis d’exposer différents résultats de recher-ches effectuées à l’aide des données du système de percep-tion par carte à puce de la STO. L’utilisation d’une approcheorientée-objet appliquée aux transports a permis de mettre latable pour une série d’analyse portant sur la demande etl’offre de transport ainsi que sur le territoire. La très grandequantité de données récoltées par de tels systèmes est certesun avantage pour les chercheurs, mais les travaux ontdémontré que cette lourdeur, sinon cette indigestion, infor-mationnelle, nécessite des nouveaux questionnements quantaux applications possibles, par rapport aux méthodes de pla-nification actuelles, qui préconisent des modèles utilisantbeaucoup moins de données factuelles. Le Tableau 3 faitétat de ces avantages et inconvénients, mis en lumière parles travaux exposés dans cet article.

Les perspectives de recherche sont nombreuses en ce quiconcerne l’utilisation des données de cartes à puce en trans-port urbain. Le Tableau 4 énonce certaines limites associéesaux expérimentations présentées, ce qui aidera à identifierces perspectives.

Le tableau démontre qu’il serait important de pouvoirenrichir ces données à l’aide de caractéristiques sociodémo-graphiques afin de préciser le profil des comportements desutilisateurs, comme le font les enquêtes origine–destination.Il est aussi nécessaire de poursuivre les études sur les varia-tions quotidiennes et saisonnières de l’achalandage afind’offrir aux opérateurs de transport des paramètres leur per-mettant de mieux ajuster leur service. Les effets externes surles réseaux, tels que les conditions météorologiques et lesévénements fortuits ou non peuvent également faire l’objetd’études. Enfin, une intégration plus marquée des donnéesau sein même des outils de planification doit être envisagée,

Fig. 14 Taux de rétention des usagers de cartes à puce apparus sur le réseau en 2004 et 2005, selon le type de titre [22]

Tableau 3 Avantages et inconvénients de l’utilisation de la carte à puce en planification des transports collectifs

Avantages Inconvénients

Mise à disposition de données individualisées

de grande précision dans le temps et dans l’espace

Aucune information sociodémographique n’est associée

à ces données, problématique de la confidentialité

Grandes quantités de données disponibles

de façon longitudinale dans le temps

Difficulté de traiter ces données à cause des erreurs

et des effets saisonniers dans l’achalandage

Données passives collectées sur l’achalandage Données non universelles, l’analyse ne tient pas compte

des non titulaires de cartes

Données peu coûteuses lorsque les systèmes

de paiement sont déjà en place

Données non nécessairement formatées pour la planification,

doivent faire l’objet de traitements particuliers qui demandent

des données fiables sur les réseaux de transport

Perspectives élargies d’utilisation à des fins de planification Demande des modèles plus puissants et désagrégés

(basés sur l’individu)

Rech. Transp. Secur. (2012) 28:139-152 151

Page 14: L’exploitation des données de cartes à puce à des fins de planification des transports collectifs urbains

afin de produire des simulateurs de réseau basés sur des don-nées réelles et non microsimulées. En effet, il faut dévelop-per des modèles désagrégés qui pourraient mieux prédirele comportement individuel des usagers sur les réseauxde transport collectif planifiés en fonction des habitudes dedéplacement « déclarées » indirectement dans les transac-tions de cartes à puce.

Références

1. Bonneau W (eds) (2002) The role of smart cards in mass transitsystems. Card Technology Today, p 10

2. Bagchi M, White PR (2005) The potential of public transportsmart card data. Transport Policy 12(5):464–74

3. Attoh-Okine NO, Shen LD (1995) Security issues of emergingsmart card fare collection application in mass transit. In: IEEEVehicle Navigation and Information Systems Conference. Procee-dings. In conjunction with the Pacific Rim TransTech Conference.Sixth International VNIS. ‘A Ride into the Future’, pp 523–6

4. McDonald N (2003) Multipurpose smart cards in transportation:benefits and barriers to use. University of California Transporta-tion Center, Research Paper, no 630, Spring 2003

5. Utsunomiya M, Attanucci J, Wilson N (2006) Potential uses oftransit smart card registration and transaction data to improvetransit planning, transportation research record: Journal of theTransportation Research Board, no 1971. Transportation ResearchBoard of the National Academies, Washington, DC, pp 119–26

6. Bagchi M, White PR (2004) What role for smart-card data frombus system? Municipal Engineer 157:39–46

7. Park JY, Kim DJ (2008) The potential of using the smart carddata to define the use of public transit in Seoul. Transp ResBoard Natl Acad, Washington, DC, 20 p

8. Trépanier M, Chapleau R, Tranchant N (2007) Individual tripdestination estimation in transit smart card automated fare collec-tion system. Journal of Intelligent Transportation System, Taylor& Francis 11:1–14

9. Blythe PT (2004) Improving public transport ticketing throughsmart cards. Municipal Engineer 157:47–54

10. Chu KKA, Chapleau R (2008) Enriching Archived Smart CardTransaction Data for Transit Demand Modeling, TransportationResearch Record: Journal of the Transportation Research Board,

no 2063. Transportation Research Board of the National Acade-mies, Washington, DC, pp 63–72

11. Chu KKA, Chapleau R, Trépanier M (2009) Driver-Assisted BusInterview (DABI): Passive Transit Travel Survey using SmartCard Automatic Fare Collection System and its Applications,Transportation Research Record: Journal of the TransportationResearch Board, no 2105. Transportation Research Board of theNational Academies, Washington, DC, pp 1–10

12. Clarke R (2001) Person location and person tracking: techno-logies, risks and policy implications. Inf Technol People 14(2):206–31

13. CNIL — Commission nationale de l’informatique et des libertés(2003) Recommandation relative à la collecte et au traitementd’informations nominatives par les sociétés de transports collec-tifs dans le cadre d’applications billettiques. CNIL, Délibérationno 03-038

14. Gorawski M, Bularz J (2007) Protecting Private Information byData Separation in Distributed Spatial Data Warehouse. SecondIEEE International Conference on Availability, Reliability andSecurity (ARES’07), Vienne (Autriche), 8 p

15. Trépanier M, Chapleau R (2001) Analyse orientée-objet et totale-ment désagrégée des données d’enquêtes ménages origine–destination. Revue canadienne de génie civil 28(1):48–58

16. Tranchant N (2004) Analyse des déplacements d’usagers à partirde données de cartes à puce. Mémoire de maîtrise en génie indus-triel (MScA) de l’École polytechnique de Montréal, 178 p

17. Munizaga M, Palma C, Mora P (2010) Public transport ODmatrix estimation from smart card payment system data. 12thWorld Conference on Transport Research, Lisbon, Portugal

18. Trépanier M, Vassivière F (2008) Democratized Smartcard Datafor Transit Operators. 15th World Congress on Intelligent Trans-port Systems, New York, États-Unis

19. Morency C, Trépanier M, Agard B (2007) Measuring transit usevariability with smart-card data. Transport Policy 14(3):193–203

20. Trépanier M, Morency C, Agard B (2009) Calculation of TransitPerformance Measures Using Smartcard Data. J Public Transp12(1):79–96

21. Trépanier M, Morency C, Blanchette C (2009) Enhancing house-hold travel surveys using smart card data? TransportationResearch Board of the National Academies, Washington, DC

22. Trépanier M, Morency C (2010) Assessing Transit Loyalty withSmart Card Data. 12th World Conference on Transport Research,Lisbon, Portugal

Tableau 4 Avantages et inconvénients de l’utilisation de la carte à puce en planification des transports collectifs

Expérimentation Limites, perspectives

1 – Traitement des erreurs Les erreurs sont souvent liées à des gestes humains (poinçonnage chauffeur)

et il faut viser des systèmes les plus « automatiques » possible

2 – Détermination de la destination Les destinations estimées ne sont pas validées pour le moment

3 – Diffusion de statistiques Il y a un risque d’indigestion informationnelle, il y a nécessité de produire

des tableaux de bord pertinents. De plus, tous les usagers ne sont pas comptés

4 – Analyse du comportement des usagers Puisqu’aucune information sociodémographique n’est disponible, les possibilités

d’appliquer des modèles explicatifs sont limitées

5 – Analyse de l’offre Il s’agit d’une méthode indirecte de mesure, il faut contre-valider les indicateurs

6 – Comparaison avec des données

d’enquêtes origine–destination

Il faut concilier les objectifs des deux modes de collecte de données, qui sont

complètement différents

7 – Survie des usagers Ces analyses ne sont valables que pour un réseau où les cartes sont personnalisées

et où un numéro d’usager (et non seulement de carte) est disponible

152 Rech. Transp. Secur. (2012) 28:139-152