1
CARTOGRAPHIE ET GÉOMATIQUE Map-matching + lissage de Kalman Extraction de N fenêtres glissantes Calcul de la variable d'intérêt distance vitesse Nettoyage Interpolation Base d'entraînement Speed Variance distance-vitesse 0 20 40 60 80 Approche fonctionnelle Approche image Adaptation d'une méthode de reconnaissance d'images (Ozuysal et al) Calcul de prols agrégés Décomposition des en ondelettes 5.16" Conversion en carte de chaleur "densité de prols de vitesse" Apprentissage automatique pour la détection de feux tricolores à partir de profils de vitesse Yann Méneroux 1 1 Institut National de l'Information Géographique et Forestière (IGN), Equipe COGIT, St Mandé, France Conclusion et perspectives L'expérimentation a montré que la méthode des forêts aléatoires semble la plus performante pour identifier la signature d'un feu tricolore dans un paquet de profils de vitesse, quelque soit l'approche utilisée, avec un taux de confusion marginal avec les stops. Les résultats démontrent également la supériorité de l'approche fonctionnelle sur tous les algorithmes testés. D'autres algorithmes d'apprentissage statistique (tels que les réseaux de neurones fonctionnels) pourront également être testés. L'objectif dans un second temps sera d'étendre les résultats obtenus à d'autres éléments de l'infrastructure routière (éventuellement à l'aide d'autres sources de données enregistrées à bord du véhicule ou à l'aide des images satellitaires de l'IGN). La portée théorique de ces travaux devrait in fine permettre d'apporter des éléments de réponse aux interrogations suivantes : 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 TPR 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 FPR 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 FPR 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 FPR 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 FPR 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 FPR TPR Robustesse de l'approche aux changements d'environnement ? Combien de données faut-il avoir à disposition dans la base d'entraînement ? Quelles influences (sur les précisions de détection et de localisation) de la fréquence d'acquisition des capteurs, des erreurs de mesures et du nombre de traces observées ? Personnal Website [email protected], [email protected] [email protected] Arnaud Le Guilcher (COGIT, IGN) Sébastien Mustière (COGIT, IGN) Guillaume Saint Pierre (LIVIC, IFSTTAR) Encadrement de thèse Contact Préparation de la base d'entraînement Apprentissage automatique et comparaisons Données Données Références • 1) Andrieu, C. (2013). Modélisation fonctionnelle de profils de vitesse en lien avec l’infrastructure et méthodologie de construction d’un profil agrégé, thèse de doctorat • 2) Ozuysal, M., Fua, P., & Lepetit, V. (2007). Fast keypoint recognition in ten lines of code. In Computer Vision and Pattern Recognition. CVPR'07. IEEE Conference on (pp. 1-8). • 3) Gregorutti, B. (2015). Forêts aleatoires et selection de variables : analyse des données des enregistreurs de vol pour la securite aerienne. Paris VI. L'arrivée récente de flottes de véhicules traceurs, mais aussi d'applications de conduite collaborative, rend possible l'accès à de grandes masses de données de conduite sur un même itinéraire. Peut-on exploiter les profils de vitesse GPS de véhicules pour détecter de manière précise l’infrastructure routière permanente à l’aide d’algorithmes d’apprentissage statistique génériques ? On cherche dans un premier temps à valider l'emploi de telles méthodes sur le cas de la détection de feux tricolores, l'objectif étant ici de répondre à quelques questions exploratoires : Contexte et objectifs Les profils sont exprimés dans l'espace distance-vitesse : 1 2 3 4 5 Quels sont les espaces de descripteurs adaptés pour modéliser des paquets de profils et y rechercher la signature caractéristique de feux tricolores ? Quels algorithmes d'apprentissage ? Quelles performances peut-on espérer obtenir ? Nombre de traces Zone Longueur du circuit Positionnement Nombre de feux Mesure de vitesse 143 Versailles (78) 25 km 44 GPS @ 1 Hz Doppler @ 10 Hz 0.0 0.1 0.2 0.3 0.4 0.5 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 FPR Image Functional Random classier ROC Naive Bayes Decision Tree k Nearest Neighbors Random Ferns Random Forest Image Functional Courbes ROC et bandes de confiance à 95% (méthode Threshold Averaging avec distribution binomiale) pour chaque combinaison approche x algorithme. Ratio de faux positifs (FPR) en abscisse et vrai positifs (TPR) en ordonnée Pour chaque combinaison [approche x algorithme], on entraîne un classifieur et on le teste selon une procédure 10-fold cross validation. Comparaison de courbes ROC (avec bandes de confiance à 90%) pour la méthode Random Forest avec l'approche image (rouge) et fonctionnelle (verte) Performances de chaque approche pour la méthode Random Forest Sensitivité Spécicité F-mesure Précision Roc Area Confusion 1 Temps 2 Image 64.2 % 96.3 % 77.7 % 70.3 % 94.0 % 6.13 % 0.32" Fonctionelle 82.6 % 97.2 % 85.6 % 84.1 % 97.5 % 2.81 % 1 Taux de confusion avec les signes stops 2 Temps d'apprentissage (en secondes / fenêtre) Tous les écarts sur les indicateurs sont significatifs (p < 0.01)

Apprentissage automatique pour la détection de feux ...recherche.ign.fr/jr/jr17/posters/Poster_Y_Meneroux_23_03_17_midi.pdf · Apprentissage automatique et comparaisons Données

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Apprentissage automatique pour la détection de feux ...recherche.ign.fr/jr/jr17/posters/Poster_Y_Meneroux_23_03_17_midi.pdf · Apprentissage automatique et comparaisons Données

CARTOGRAPHIE ET GÉOMATIQUE

Map-matching + lissage de Kalman

Extraction de N fenêtres glissantes

Calcul de la variable d'intérêt

distance

vit

ess

e

NettoyageInterpolation

Base d'entraînement

Speed

Variance

distance-vitesse

02

04

06

08

0

Approche fonctionnelle Approche image

Adaptation d'une méthode de reconnaissance d'images (Ozuysal et al)

Calcul de profils agrégés Décomposition des en ondelettes

5.16"

Conversion en carte de chaleur"densité de profils de vitesse"

Apprentissage automatique pour la détection defeux tricolores à partir de profils de vitesse

Yann Méneroux1

1 Institut National de l'Information Géographique et Forestière (IGN), Equipe COGIT, St Mandé, France

Conclusion et perspectives

L'expérimentation a montré que la méthode des forêts aléatoires semble la plus performante pour identifier la signature d'un feu tricolore dans un paquet de profils de vitesse, quelque soit l'approche utilisée, avec un taux de confusion marginal avec les stops. Les résultats démontrent également la supériorité de l'approche fonctionnelle sur tous les algorithmes testés.

D'autres algorithmes d'apprentissage statistique (tels que les réseaux de neurones fonctionnels) pourront également être testés. L'objectif dans un second temps sera d'étendre les résultats obtenus à d'autres éléments de l'infrastructure routière (éventuellement à l'aide d'autres sources de données enregistrées à bord du véhicule ou à l'aide des images satellitaires de l'IGN). La portée théorique de ces travaux devrait in fine permettre d'apporter des éléments de réponse aux interrogations suivantes :

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

TP

R

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

FPR

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

FPR

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

FPR

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

FPR

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

FPR

TP

R

Robustesse de l'approche aux changements d'environnement ? Combien de données faut-il avoir à disposition dans la base d'entraînement ? Quelles influences (sur les précisions de détection et de localisation) de la fréquence d'acquisition des capteurs, des erreurs de mesures et du nombre de traces observées ? Personnal

Website

[email protected], [email protected]

[email protected]

Arnaud Le Guilcher (COGIT, IGN)

Sébastien Mustière (COGIT, IGN)

Guillaume Saint Pierre (LIVIC, IFSTTAR)

Encadrement de thèse

Contact

Préparation de la base d'entraînement

Apprentissage automatique et comparaisons

Données

Données

Références

• 1) Andrieu, C. (2013). Modélisation fonctionnelle de profils de vitesse en lien avec l’infrastructure et méthodologie de construction d’un profil agrégé, thèse de doctorat• 2) Ozuysal, M., Fua, P., & Lepetit, V. (2007). Fast keypoint recognition in ten lines of code. In Computer Vision and Pattern Recognition. CVPR'07. IEEE Conference on (pp. 1-8).• 3) Gregorutti, B. (2015). Forêts aleatoires et selection de variables : analyse des données des enregistreurs de vol pour la securite aerienne. Paris VI.

L'arrivée récente de flottes de véhicules traceurs, mais aussi d'applications de conduite collaborative, rend possible l'accès à de grandes masses de données de conduite sur un même itinéraire.

Peut-on exploiter les profils de vitesse GPS de véhicules pour détecter de manière précise l’infrastructure routière permanente à l’aide d’algorithmes d’apprentissage statistique génériques ?

On cherche dans un premier temps à valider l'emploi de telles méthodes sur le cas de la détection de feux tricolores, l'objectif étant ici de répondre à quelques questions exploratoires :

Contexte et objectifs

Les profils sont exprimés dans l'espace distance-vitesse :

1 2

3

4

5

→ Quels sont les espaces de descripteurs adaptés pour modéliser des paquets de profils et y rechercher la signature caractéristique de feux tricolores ?

→ Quels algorithmes d'apprentissage ?

→ Quelles performances peut-on espérer obtenir ?

Nombre de traces

Zone

Longueur du circuit

Positionnement

Nombre de feux

Mesure de vitesse

143

Versailles (78)

25 km

44

GPS @ 1 Hz

Doppler @ 10 Hz

0.0 0.1 0.2 0.3 0.4 0.5 0.6

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

FPR

Image

Functional

Rando

mcla

ssifi

er R

OC

Naive Bayes Decision Tree k Nearest Neighbors Random Ferns Random Forest

Ima

geF

unct

iona

l

Courbes ROC et bandes de confiance à 95% (méthode Threshold Averaging avec distribution binomiale) pour chaque combinaison approche x algorithme. Ratio de faux positifs (FPR) en abscisse et vrai positifs (TPR) en ordonnée

Pour chaque combinaison [approche x algorithme], on entraîne un classifieur et on le teste selon une procédure 10-fold cross validation. Comparaison de courbes ROC (avec bandes de confiance à 90%) pour la méthode Random Forest avec l'approche image (rouge) et fonctionnelle (verte)

Performances de chaque approche pour la méthode Random Forest

Sensitivité

Spécificité

F-mesure

Précision

Roc Area

Confusion1

Temps2

Image

64.2 %

96.3 %

77.7 %

70.3 %

94.0 %

6.13 %

0.32"

Fonctionelle

82.6 %

97.2 %

85.6 %

84.1 %

97.5 %

2.81 %

1 Taux de confusion avec les signes stops2 Temps d'apprentissage (en secondes / fenêtre)

Tous les écarts sur les indicateurs sont significatifs (p < 0.01)