12
Extraction de motifs d’évolution dans les Séries Temporelles d’Images Satellites François Petitjean * Pierre Gançarski * Florent Masseglia ** * LSIIT (UMR 7005 CNRS/UdS) Pôle API – Bd Sébastien Brant 67412 Illkirch Cedex France {fpetitjean,gancarski}@unistra.fr ** INRIA Sophia Antipolis 2004 route des Lucioles 06902 Sophia Antipolis France [email protected] RÉSUMÉ. La détection de changements dans les séries temporelles d’images satellites est un domaine important avec des applications variées en étude de l’occupation des sols. La plu- part des méthodes existantes effectuent cette détection en étudiant les images deux à deux et en considérant par exemple, leurs différences. De fait, elles n’exploitent pas la totalité des don- nées fournies par les images. De plus, elles ne proposent pas de caractérisation des change- ments observés. Cet article propose une approche d’extraction de motifs d’évolution de ces sé- ries d’images. Notre méthode présente deux propriétés importantes. Premièrement, elle permet d’analyser la totalité des données fournies par les différentes images, sans sélection a priori. Deuxièmement, cette méthode a été spécifiquement conçue afin d’extraire des motifs d’évo- lutions non-majoritaires. Ce dernier point est particulièrement utile pour l’analyse de séries temporelles d’images satellites car le comportement de non-évolution est souvent majoritaire. Nos expérimentations démontrent la pertinence de notre approche pour l’extraction de motifs d’intérêt, et la signification des motifs d’évolutions extraits. ABSTRACT. Change detection in satellite image time series is an important domain with various applications in land study. Most previous works proposed to perform this detection by studying two images and analysing their differences. However, those methods do not exploit the whole set of images that is available today and they do not propose a description of the detected changes. We propose a sequential pattern mining approach for these image time series with two important features. First, our proposal allows for the analysis of all the images in the series and each image can be considered from multiple points of view. Second, our technique is specifically designed towards image time series where the changes are not the most frequent patterns that can be discovered. Our experiments show the relevance of our approach and the significance of our patterns. MOTS-CLÉS : Télédétection,Séries Temporelles d’Images Satellites, STIS, Extractions de Motifs Séquentiels KEYWORDS: Remote Sensing, Satellite Image Time Series, SITS, Sequential Pattern Extraction

Extraction de motifs d’évolution dans les Séries ... · PDF fileBRU 99, HOW 06], la régression et l’interpolation [JHA 94, ... nomie. Cependant, leur proposition ne permet l’extraction

  • Upload
    dothien

  • View
    218

  • Download
    3

Embed Size (px)

Citation preview

Page 1: Extraction de motifs d’évolution dans les Séries ... · PDF fileBRU 99, HOW 06], la régression et l’interpolation [JHA 94, ... nomie. Cependant, leur proposition ne permet l’extraction

Extraction de motifs d’évolution dans lesSéries Temporelles d’Images Satellites

François Petitjean * — Pierre Gançarski * — Florent Masseglia **

* LSIIT (UMR 7005 CNRS/UdS)Pôle API – Bd Sébastien Brant67412 Illkirch CedexFrance

{fpetitjean,gancarski}@unistra.fr

** INRIA Sophia Antipolis2004 route des Lucioles06902 Sophia AntipolisFrance

[email protected]

RÉSUMÉ. La détection de changements dans les séries temporelles d’images satellites est undomaine important avec des applications variées en étude de l’occupation des sols. La plu-part des méthodes existantes effectuent cette détection en étudiant les images deux à deux et enconsidérant par exemple, leurs différences. De fait, elles n’exploitent pas la totalité des don-nées fournies par les images. De plus, elles ne proposent pas de caractérisation des change-ments observés. Cet article propose une approche d’extraction de motifs d’évolution de ces sé-ries d’images. Notre méthode présente deux propriétés importantes. Premièrement, elle permetd’analyser la totalité des données fournies par les différentes images, sans sélection a priori.Deuxièmement, cette méthode a été spécifiquement conçue afin d’extraire des motifs d’évo-lutions non-majoritaires. Ce dernier point est particulièrement utile pour l’analyse de sériestemporelles d’images satellites car le comportement de non-évolution est souvent majoritaire.Nos expérimentations démontrent la pertinence de notre approche pour l’extraction de motifsd’intérêt, et la signification des motifs d’évolutions extraits.

ABSTRACT. Change detection in satellite image time series is an important domain with variousapplications in land study. Most previous works proposed to perform this detection by studyingtwo images and analysing their differences. However, those methods do not exploit the wholeset of images that is available today and they do not propose a description of the detectedchanges. We propose a sequential pattern mining approach for these image time series withtwo important features. First, our proposal allows for the analysis of all the images in theseries and each image can be considered from multiple points of view. Second, our techniqueis specifically designed towards image time series where the changes are not the most frequentpatterns that can be discovered. Our experiments show the relevance of our approach and thesignificance of our patterns.

MOTS-CLÉS : Télédétection,Séries Temporelles d’Images Satellites, STIS, Extractions de MotifsSéquentiels

KEYWORDS: Remote Sensing, Satellite Image Time Series, SITS, Sequential Pattern Extraction

Page 2: Extraction de motifs d’évolution dans les Séries ... · PDF fileBRU 99, HOW 06], la régression et l’interpolation [JHA 94, ... nomie. Cependant, leur proposition ne permet l’extraction

2 SAGEO’10.

1. Introduction

Alors que le domaine de la télédétection a subit un saut technologique avec l’ap-parition d’images à haute résolution, il s’apprête à en connaître un autre avec l’appa-rition de satellites (ex : V enµs, Sentinel-2) capables d’acquérir des séries temporellesd’images à haute fréquence d’acquisition (deux ou trois images par semaine voireplus). Ces Séries Temporelles d’Images Satellites (STIS) sont une source d’informa-tion importante pour l’analyse d’une scène. La principale utilisation actuelle de cesimages consiste à sélectionner deux images de ces séries et à étudier leurs différences,afin d’étudier les changements dans la scène. Cependant, les changement dans unescène peuvent être disséminés sur une longue période (ex : l’urbanisation d’une zonepeut prendre plusieurs années), ou peuvent être cycliques (ex : rotation des cultures).

Par conséquent, le nombre de combinaisons possibles d’évolutions est très impor-tant et l’analyse de la scène ne peut être réduite à l’analyse de deux images. Partantde ce constat, nous proposons une méthode permettant l’analyse d’une série tempo-relle d’images satellites dans sa globalité, et l’appliquons à une série de 35 imagesSPOT acquises sur une période de 20 ans. Notre approche s’appuie sur une méthodede fouille de données dédiée à l’extraction de motifs séquentiels [AGR 95, MAS 98].Cette méthode est typique de l’extraction de connaissances et permet la découvertede motifs d’évolutions fréquents à partir d’un ensemble d’enregistrements. Dans cetarticle, un enregistrement sera les différentes valeurs prises par un pixel au long d’unesérie d’acquisitions (i.e., son évolution dans le temps). Considérons par exemple unensemble de 24 images satellites acquises sur une période de deux ans, avec une fré-quence d’une image par mois. Un motif d’évolution fréquent qui pourrait être décou-vert dans ce type de données pourrait être “dans un premier temps, 15% des pixels ontdes réponses correspondant à de la végétation, puis leurs réponses correspondent à dessols nus, et enfin à des toits”. En d’autres termes, s’il existe un nombre suffisammentimportant de pixels ayant le même “comportement”, i.e., suivant la même évolution,alors ce comportement doit être découvert. Mentionnons ici que les relations de voisi-nage spatial des pixels ne sont pas utilisées dans cet article ; le but n’est pas d’extrairedes pixels selon leurs formes, mais d’extraire des schémas d’évolution typiques de sé-ries temporelles d’images satellites, et de fournir une représentation de cette évolutionayant un sens.

Une fois les motifs fréquents extraits, l’expert dispose de descriptions de zonesayant suivi la même évolution et d’un motif d’évolution la caractérisant. L’expertpeut alors y associer un sens thématique, comme la création d’une route, ou encoreune culture de blé. De plus, notre approche présente deux intérêts : elle supporte unéchantillonnage irrégulier des images et permet automatiquement d’ignorer des va-leurs aberrantes (nuage, étalonnage du capteur, etc. ).

Dans cet article, la section 2 décrit un bref état de l’art des méthodes dédiées àl’analyse de STIS. La section 3 introduit les concepts principaux de l’extraction demotifs séquentiels. La section 4 décrit quant à elle les prétraitements effectués sur lesdonnées pour la découverte de ces motifs. La section 5 introduit ensuite notre méthode

Page 3: Extraction de motifs d’évolution dans les Séries ... · PDF fileBRU 99, HOW 06], la régression et l’interpolation [JHA 94, ... nomie. Cependant, leur proposition ne permet l’extraction

Motifs d’évolution dans les STIS 3

d’extraction de motifs temporels dans des séries temporelles d’images satellites. Lasection 6 décrit les résultats obtenus sur une zone du bassin d’Arcachon. Finalement,nous concluons ce papier en section 7.

2. État de l’art : Analyse de STIS

La détection de changements dans une scène permet l’analyse de phénomènes ter-restres, au travers d’observations. Ces changements peuvent être de différents types, dedifférentes origines et de durées variées. La détection de changements permet, entreautres, d’étudier l’occupation des sols ou d’établir une cartographie des dommagessuite à une catastrophe naturelle. On peut distinguer trois grandes familles méthodo-logiques pour l’analyse de changements.

Les méthodes bi-temporelles, permettent de situer et d’étudier des changementsabrupts ayant lieu entre deux observations. Le phénomène à caractériser est généra-lement court dans le temps, et les observations fournissent une information sur l’étatde la scène avant le changement, et une après. Ce type de méthodes inclut la différen-ciation d’images [BRU 00, MEL 02], le ratio d’images [TOD 77] ou encore l’analysepar vecteurs de changement [JOH 98].

Une seconde famille de méthodes correspond à des techniques mixtes, princi-palement statistiques, s’appliquant généralement à deux images mais pouvant êtrecombinées pour en analyser plusieurs. Cette famille inclut la comparaison postclas-sification [FOO 01], la transformation linéaire des données (ACP ou MAF1) [NIE 98,BRU 99, HOW 06], la régression et l’interpolation [JHA 94, RID 98], ou encore l’ana-lyse fréquentielle (ex : décomposition de Fourier ou en ondelette) [AND 94, CEL 09].

Enfin, la dernière famille correspond à des méthodes dédiées à l’étude de sériestemporelles d’images. Ces méthodes sont généralement basées sur l’analyse de tra-jectoires radiométriques de pixels, afin de les comparer [KET 07] ou d’y détecter desruptures [KEN 07, VER 10].

Quel que soit le type de méthodes utilisées pour l’analyse de séries d’images satel-lites, il existe un décalage entre la quantité d’information que représentent ces sériestemporelles, et la capacité des algorithmes à les analyser. Ces algorithmes sont le plussouvent dédiés à l’analyse bi-date d’une scène et se concentrent sur la cartographiedes zones de changements et non sur leur caractérisation. Les méthodes bi-date sontde plus liées à des thématiques d’études spécifiques et sont incapables d’appréhenderdes changements ayant lieu au travers d’une STIS. Quant aux méthodes multi-date,elles sont souvent difficilement interprétables et ne permettent pas de caractériser lechangement. Elles se focalisent sur les données image par image et n’extraient pasl’information d’évolution disséminée au long d’une STIS.

Parallèlement, l’extraction de motifs séquentiels fréquents [AGR 95, MAS 98]permet d’extraire des motifs fréquents d’évolution d’une série de symboles. Ces mé-

1. Maximum Autocorrelation Factor

Page 4: Extraction de motifs d’évolution dans les Séries ... · PDF fileBRU 99, HOW 06], la régression et l’interpolation [JHA 94, ... nomie. Cependant, leur proposition ne permet l’extraction

4 SAGEO’10.

thodes permettent d’identifier les ensemble de séquences ayant suivi la même évolu-tion. De plus, elles permettent de caractériser cette évolution, en fournissant le motifpartagé par cet ensemble de séquences.

L’extraction de motifs d’évolution fréquents à partir de STIS a été introduit dans[JUL 06, JUL 08]. Les auteurs utilisent ces techniques pour la météorologie et l’agro-nomie. Cependant, leur proposition ne permet l’extraction de motifs que sur les sériesd’images mono-bande, ce qui est facteur limitant bien connu pour la discriminationdes objets observés.

L’étude que nous proposons, comme nous l’expliquons en section 4, porte surdes images multi-spectrale. Nous verrons que cette caractéristique, associée au grandnombre d’images que nous analysons, influe sur la complexité des motifs, leur perti-nence et la difficulté de leur extraction.

3. Recherche de motifs temporels fréquents

Les motifs temporels sont extraits à partir d’un ensemble d’enregistrements (sou-vent très volumineux). Ces enregistrements contiennent des valeurs définies sur unvocabulaire précis et se présentent sous forme de séquences de données comme l’in-dique la définition 1, adaptée à partir des définitions de [AGR 95].

Définition 1 Soit I = {i1, i2, ..., im}, un ensemble de m valeurs (ou items). SoitI = {t1, t2, ...tn}, un sous-ensemble de I. I est appelé un itemset.

Une séquence s est une liste ordonnée, non vide, d’itemsets notée< s1, s2, . . . , sn > où sj est un itemset. Une séquence de données est une sé-quence enregistrée dans l’ensemble des données à analyser.

La définition 2 exprime les conditions de l’inclusion d’une séquence s1 dans uneséquence s2. En d’autres termes, s1 est incluse dans s2 si chaque itemset de s1 estinclus dans un itemset de s2 en respectant l’ordre des itemsets dans s1 et dans s2.Cette définition est illustrée par l’exemple 1

Définition 2 Soit s1 =< a1, a2, . . . , an > et s2 =< b1, b2, . . . , bm > deux sé-quences. s1 est incluse dans s2 (s1 ≺ s2) si et seulement si il existe i1 < i2 < . . . < indes entiers tels que a1 ⊆ bi1 , a2 ⊆ bi2 , . . . an ⊆ bin .

Exemple 1 La séquence s1 =< (3) (4 5) (8) > est incluse dans la séquence s2 =<(7) (3 8) (9) (4 5 6)(8) > (i.e s1 ≺ s2) car (3) ⊆ (3 8), (4 5) ⊆ (4 5 6) et (8) ⊆ (8).En revanche la séquence s3 =< (3 8 9) (4 5) > n’est pas incluse dans s2 car (3 8 9)n’est inclus dans aucun itemset de s2.

Pour extraire des motifs temporels, la caractéristique retenue dans nos travauxsera la fréquence. La fréquence est basée sur le nombre d’apparitions par rapport

Page 5: Extraction de motifs d’évolution dans les Séries ... · PDF fileBRU 99, HOW 06], la régression et l’interpolation [JHA 94, ... nomie. Cependant, leur proposition ne permet l’extraction

Motifs d’évolution dans les STIS 5

au nombre d’enregistrements, comme l’indique la définition 3. Enfin, pour simpli-fier l’interprétation des résultats, seuls les motifs temporels les plus longs sont gardésdans l’ensemble des motifs extraits (C.f. la définition 4).

Définition 3 Une séquence de données sd supporte une séquence s (ou contribue ausupport de s) si s ≺ sd. Soit D un ensemble de séquences de données. Le supportd’une séquence s dans D est calculé comme étant le pourcentage des séquences dedonnées de D qui supportent s :

support(s) =|{sd ∈ D/s ≺ sd}|

|D|[1]

Soit minSupp un support minimum fixé par l’utilisateur. Une séquence dont le sup-port est supérieur à minSupp est une séquence fréquente.

Définition 4 L’ensemble FD des motifs temporels fréquents de D est constitué detoutes les séquences fréquentes sur D. L’ensemble LD des motifs temporels fréquentsmaximaux de D est constitué de toutes les séquences s dans FD telles que s n’estincluse dans aucune autre séquence de FD.

4. Préparation des données (STIS)

Les images utilisées dans cet article sont extraites de la base de données Littoraldu programme KALIDEOS2 et se situent dans le sud-ouest de la France. Nous avonsextrait de cette base de données une série de 35 images SPOT-1, SPOT-2 et SPOT-4(illustrée en figure 1).

Cette STIS s’étend sur une période de 20 ans ; les distributions annuelles et men-suelles des images sont données par le tableau 1. Ce tableau montre que la fréquenced’acquisition des images n’est pas régulière. Disposer de données acquise irréguliè-rement est un cas assez fréquent, pour lequel les méthodes d’analyses doivent êtrerobustes. Nous montrerons que notre méthode est capable d’utiliser la totalité desdonnées tout en étant robuste à la fréquence d’acquisition des images dans la série.

Années 1986–1989 1990–1994 1995–1999 2000–2004 2005–2006Nb 7 13 4 7 4

Mois J F M A M J J A S O N DNb 2 3 3 3 1 6 5 4 1 4 3 0

Tableau 1. Répartitions annuelle et mensuelle de la série d’images étudiée.

Avant d’intégrer la bases de données KALIDEOS, les produits SPOT sont orthorec-tifiés (garantissant qu’un pixel (x, y) couvre la même zone géographique au long de

2. http://kalideos.cnes.fr

Page 6: Extraction de motifs d’évolution dans les Séries ... · PDF fileBRU 99, HOW 06], la régression et l’interpolation [JHA 94, ... nomie. Cependant, leur proposition ne permet l’extraction

6 SAGEO’10.

Image 1 (16 juillet 1986) Image 2 (15 novembre 1988)...

Image 34 (3 juin 2006) Image 35 (1er juillet 2006)

Figure 1. Extrait de la STIS utilisée provenant de la Base de données LITTORAL –KALIDEOS. © CNES 2010 – Distribution Spot Image

la séquence d’images) et subissent des traitements radiométriques afin que les valeursdes pixels soient comparables d’une image à une autre. Ces traitements consistent àconvertir les comptes numériques fournis par le capteur en grandeurs physiques et àrestituer la contribution propre à la surface par correction des effets de l’atmosphère. Apartir du modèle radiométrique de l’instrument, les comptes numériques sont d’abordconvertis en réflectances (grandeur physique normalisée de l’éclairement solaire). Lescoefficients d’étalonnage absolu utilisés dans cette étape proviennent du suivi des cap-teurs SPOT effectué par le CNES. L’inversion de la réflectance de surface est faiteensuite par comparaison de la réflectance mesurée à des simulations au sommet del’atmosphère, réalisées pour les conditions géométriques et atmosphériques de la me-

Page 7: Extraction de motifs d’évolution dans les Séries ... · PDF fileBRU 99, HOW 06], la régression et l’interpolation [JHA 94, ... nomie. Cependant, leur proposition ne permet l’extraction

Motifs d’évolution dans les STIS 7

sure. L’élévation du terrain est prise en compte par la réalisation de simulations pourdiverses altitudes, incluant une pondération de la pression atmosphérique et des quan-tités d’aérosols et de vapeur d’eau. L’état de l’atmosphère au moment de l’acquisitionest quant à lui caractérisé à l’aide de sources météorologiques (NCEP pour la pres-sion et l’humidité), de sources de données ozone (TOMS ou TOAST) et de donnéesaérosols (SeaWIFs, Aeronet). A défaut, des valeurs climatologiques sont utilisées.

Une fois ces corrections effectuées, nous disposons de 35 images sur trois bandes :proche infra-rouge (PIR), rouge (R) et vert (V). À cela, nous ajoutons un quatrièmeattribut correspondant à l’indice de végétation NDVI3. Chaque séquence est ainsiconstruite comme la succession des quadruplet de valeurs (PIR, R, V, NDVI) pourchaque pixel (x, y) dans la série d’images.

Finalement, une étape de discrétisation est indispensable pour pouvoir analyserces données avec une méthode d’extraction de motifs. Nous avons donc appliqué, surchaque bande, une classification par l’algorithme K-MEANS [MAC 67]. Ainsi, pourchacune des bandes, nous avons rassemblé l’ensemble des valeurs de la série d’imagesafin de créer 20 tranches de valeurs par bande. Le fait de n’effectuer qu’un clusteringpar bande (et non un par bande et par image), permet de pouvoir comparer les tranchesd’une image à une autre.

Pour plus de lisibilité, les numéros de clusters ont été réordonnés de façon crois-sante en fonction des valeurs de leurs centroïdes ; les séquences sont donc des suitesde quadruplets (NIR,R,V,NDVI) de la forme :

(PIR1, R6, V3, NDV I16)→ · · · → (PIR12, R3, V14, NDV I19) [2]

où (PIR1, R6, V3, NDV I16) signifie que la valeur du pixel dans la première image setrouve dans la première tranche de proche infra-rouge, dans la 6ème tranche de rouge,dans la troisième tranche de vert et dans la 16ème tranche de NDV I .

5. Méthode d’extraction des motifs

Les étapes de pré-traitement décrites en section 4 permettent donc d’obtenir unesérie d’images dans lesquelles chaque pixel possède plusieurs valeurs. Considérons lasérie de 3 images réduites à 4 pixels (p1 à p4) illustrée par la figure 2 et où chaquepixel possède 3 valeurs (qui correspondent à 3 bandes, B1 à B3)4. Avec un supportminimum de 100%, il n’existe aucun motif fréquent dans ces images (aucun compor-tement n’est suivi par l’ensemble des pixels). Avec un support minimum de 50%, enrevanche, on trouve deux comportements fréquents :

1) < (B1, blanc;B2, blanc) (B1, gris;B2, rouge) >. Ce comportement estsuivi par les pixels p2 sur les images 1 et 2 (ou 3) et p3 sur les images 1 (ou 2) et3.

3. Par abus de langage, nous parlerons de quatrième bande.4. Nous utilisons des couleurs pour décrire les valeurs des bandes pour des questions didactiqueset de visualisation.

Page 8: Extraction de motifs d’évolution dans les Séries ... · PDF fileBRU 99, HOW 06], la régression et l’interpolation [JHA 94, ... nomie. Cependant, leur proposition ne permet l’extraction

8 SAGEO’10.

2) < (B1, blanc;B2, blanc) (B1, blanc;B2, blanc) >. Ce comportement estsuivi par p1 et p3 sur les images 1 et 2.

Notons, dans l’exemple ci-dessus, que les motifs peuvent être fréquents malgré undécalage temporel dans les images où ils sont supportés.

Figure 2. Une série de trois images composées de quatre pixels, chacun représentésur trois bandes.

En général, la recherche de motifs consiste à trouver des motifs avec des supportsélevés (très fréquents), la problématique est un peu différentes pour l’application auxSTIS. En effet, un motif ayant 80 % de support, s’interprète comme étant un motifsuivi par 80 % des séquences et donc par 80 % des zones géographiques de la scène.Cependant, il est très rare qu’il existe un comportement couvrant une si grande partiede la scène qui soit intéressant. Il est certes possible de trouver que 80 % des séquencessont passées par la dixième tranche de la bande rouge, mais ce type de comportementsne correspond généralement pas à un comportement intéressant. Il est donc nécessaired’appliquer des contraintes sur le processus d’extraction afin d’identifier des compor-tement locaux, i.e., entre 1 % et 10 % des séquences. Sur notre scène couvrant 81 km2,cela correspond à trouver des zones de moins d’un km2 jusqu’à 8 km2 ayant suivi uneévolution similaire au long de la série d’images.

Cependant, rechercher des motifs moins fréquents complexifie le processus d’ex-traction. Considérons un motif m ayant un support supérieur à 80 %. Si ce motif aun support de 80 %, c’est que 80 % des séquences suivent ce motif. Mais si 80 % lesuivent alors tout sous-ensemble de ces séquences suit le motif, et donc ce motif seraégalement identifié avec toutes les valeurs de support inférieures à celui-ci. Aussi,ces séquences fréquentes vont-elles inonder le processus d’extraction qui ne sera pascapable d’extraire les motifs ayant un support faible intéressant. C’est une des limi-tations principales dans la méthode mise en œuvre dans [JUL 06, JUL 08], celle-cine pouvant extraire que des motifs à supports élevés, empêchant l’identification decomportements minoritaires intéressants.

Ainsi, nous proposons dans cet article, un algorithme d’extraction de motifs fré-quents basé sur [MAS 98] modifiés en deux points :

1) pendant la phase de découverte des valeurs fréquentes, nous ne considéronsque les valeurs dont le support dans une image est compris dans un intervalle, ce quipermet d’éliminer un grand nombre de motifs non-pertinents.

Page 9: Extraction de motifs d’évolution dans les Séries ... · PDF fileBRU 99, HOW 06], la régression et l’interpolation [JHA 94, ... nomie. Cependant, leur proposition ne permet l’extraction

Motifs d’évolution dans les STIS 9

2) pendant les étapes suivantes, nous éliminons les séquences contenant deuxvaleurs successives identiques sur une bande. Par exemple, la séquence candidate< (PIR, 2) (R, 2) > est conservée mais pas la séquence < (PIR, 2) (PIR, 2) >.

6. Expérimentations / Résultats

Les images pré-traitées (voir section 4) ont une étendue de 202 500 pixels(450x450). Chaque pixel de chacune des 35 images étant décrit sur quatre attributs,cette série totalise 28 millions de valeurs à analyser.

La méthode détaillée en section 5 a été appliquée à la série d’images illustrée en fi-gure 1. Plusieurs centaines de motifs ont été découverts par ce processus d’extraction ;une carte a été générée pour chaque motif afin de pouvoir les sélectionner manuelle-ment. La figure 3 illustre trois motifs extraits de cette série.

(a) (b)

Figure 3. Présentation des résultats. La figure (a) illustre trois motifs extraits par laméthode proposée (une couleur par motif). L’image du 3 juin 2006 extraite de la STISest illustrée en figure (b) pour faciliter l’interprétation de ces résultats.

Nous avons vu que chaque séquence du jeu de données est identifiée par ses coor-données (x, y) dans les images. Un motif suivi par un ensemble de séquences peutdonc être visualisé sur une image, comme un ensemble de pixels de coordonnées(x, y). La figure 3(a) présente, sur ce principe, trois motifs extraits de la STIS (unpar couleur). Nous détaillons ci-dessous ces trois motifs ainsi que l’interprétation thé-matique qui en découle :

1) le motif < (PIR, 1) (NDV I, 20) > est représenté en vert. Ce motif corres-pond à des zones marécageuses, dont le niveau oscille entre un niveau très faible de

Page 10: Extraction de motifs d’évolution dans les Séries ... · PDF fileBRU 99, HOW 06], la régression et l’interpolation [JHA 94, ... nomie. Cependant, leur proposition ne permet l’extraction

10 SAGEO’10.

proche infra-rouge quand les zones sont recouvertes d’eau en hiver et un fort niveauNDVI en été, car la végétation apparait, et est de plus très irriguée et donc très chlo-rophyllienne. La représentation de ce motif est assez intéressante. En effet, ce motifest recentré sur l’évolution atomique de ces zones (deux états), alors que notre sériecouvre plusieurs années.

2) le motif < (R, 17) (R, 18 ; NDV I, 3) > est représenté en orange. Ce motifcorrespond à des zones urbaines s’étant densifiées. En effet, l’urbain répond fortementdans la bande rouge, d’où le niveau de départ élevé de 17. La densification urbainede ces zones au long de la série d’images est indiquée par le niveau suivant dans lerouge, passant dans la 18ème tranche, correspondant à une augmentation de 25 % de laréflectance. La présence d’urbain est de plus corroborée par le niveau final très faiblede NDVI indiquant une quasi-absence de végétation.

3) le motif < (NDV I, 2) (V, 20) (NDV I, 1) > est représenté en violet. Ce mo-tif correspond à des zones industrielles s’étant densifiées. La diminution de NDVI,passant de la deuxième à la première tranche, indique un recul du couvert végétal surces zones, d’autant que cette transition correspond à une diminution de 30 % de ré-flectance. Enfin, le niveau maximum atteint dans le vert corrobore la présence de toitsplats (type tôle ondulée) caractéristiques des zones industrielles.

Plusieurs remarques peuvent être faites sur cette extraction. Tout d’abord, commecette méthode permet d’éviter d’ignorer une valeur dans la série, les valeurs singulières(ex : nuage, bruit) sont automatiquement ignorés. De plus, seuls les pixels nuageuxdans une image sont ignorées, ce qui permet d’utiliser toutes les données disponibles,sans supprimer de données non-bruitées. Par ailleurs, notre méthode a permis, dansle même temps, d’extraire des comportements saisonniers (marais) et donc cycliques,ainsi que des comportements transversaux à la série temporelle (densification). C’estune propriété intéressante de notre approche permettant d’identifier différents typesde comportements. Enfin, en plus de fournir des groupes de séquences ayant évoluéde la même façon, notre méthode fournit une description des motifs supportés parles différentes séquences. Cette description peut permettre à l’expert de qualifier lesmotifs extraits, et peut par exemple être réinjectée comme une connaissance dans unprocessus plus global d’étude de la scène.

7. Conclusion

Les Séries Temporelles d’Images de Télédétection sont des données très richespour l’étude de l’occupation des sols, soit pour la discrimination d’un état d’occupa-tion des sols, soit pour l’étude de leurs évolutions. Notre méthode d’extraction de mo-tifs temporels nous a permis d’identifier des motifs d’évolutions pertinents que nousavons détaillés en section 6. Les motifs extraits correspondent aux état principauxd’évolution par lesquels passe une zone géographique (imagée par un ensemble depixels). Ces motifs d’évolution ont permis d’extraire aussi bien des comportement cy-cliques (marais) que des comportements d’évolution transversaux à la série d’images(densification). Par ailleurs, comme les méthodes d’extraction de motifs fréquents per-

Page 11: Extraction de motifs d’évolution dans les Séries ... · PDF fileBRU 99, HOW 06], la régression et l’interpolation [JHA 94, ... nomie. Cependant, leur proposition ne permet l’extraction

Motifs d’évolution dans les STIS 11

mettent de se focaliser sur les états principaux d’évolutions, elles sont robustes aubruit, qu’il soit lié au capteur ou à la météorologie. Enfin, les motifs extraits four-nissent fournissent une représentation centrée sur les principales étapes d’évolution,ce qui les rend facile à lire et à interpréter.

L’adaptation des techniques d’extraction de motifs fréquents aux images de télé-détection ouvre de nouvelles perspectives. Ces motifs constituent une connaissancequi pourra par exemple être réinjectée afin de les utiliser comme des évolutions typesdans des systèmes de prédiction. De plus, il serait intéressant d’étudier les résultats decette approche sur une série d’images à l’échelle intra-annuelle (e.g., agronomie). Ilserait également intéressant de contraindre le processus afin d’influer sur la longueurdes motifs extraits. Enfin, de la même façon que ces techniques permettent d’ignorerdes valeurs aberrantes, elles pourraient permettre de traiter des séries de longueursvariées.

Remerciements

Ce travail est supporté par le Centre National d’Études Spatiales et par ThalesAlenia Space sous le contrat de bourse de recherche n°1520011594.

8. Bibliographie

[AGR 95] AGRAWAL R., SRIKANT R., « Mining Sequential Patterns », Proceedings of the11th International Conference on Data Engineering (ICDE’95), 1995, p. 3–14.

[AND 94] ANDRES L., SALAS W., SKOLE D., « Fourier analysis of multi-temporal AVHRRdata applied to a land cover classification », International Journal of Remote Sensing,vol. 15, no 5, 1994, p. 1115–1121, Taylor & Francis.

[BRU 99] BRUZZONE L., PRIETO D., SERPICO S., « A neural-statistical approach to mul-titemporal and multisource remote-sensing image classification », IEEE Transactions onGeoscience and Remote Sensing, vol. 37, no 3, 1999, p. 1350-1359.

[BRU 00] BRUZZONE L., PRIETO D., « Automatic analysis of the difference image for un-supervised change detection », IEEE Transactions on Geoscience and Remote Sensing,vol. 38, no 3, 2000, p. 1171-1182.

[CEL 09] CELIK T., « Unsupervised Multiscale Change Detection In Multitemporal Synthe-tic Aperture Radat Images », 17th European Signal Processing Conference (EUSIPCO),vol. 15, 2009, p. 47–51.

[FOO 01] FOODY G., « Monitoring the magnitude of land-cover change around the southernlimits of the Sahara », Photogrammetric Engineering and Remote Sensing, vol. 67, no 7,2001, p. 841–848, ASPRS American Society for Photogrammetry and Remote Sensing.

[HOW 06] HOWARTH P., PIWOWAR J., MILLWARD A., « Time-Series Analysis of Medium-Resolution, Multisensor Satellite Data for Identifying Landscape Change », Photogramme-tric engineering and remote sensing, vol. 72, no 6, 2006, p. 653–663.

[JHA 94] JHA C., UNNI N., « Digital change detection of forest conversion of a dry tropicalIndian forest region », International Journal of Remote Sensing, vol. 15, no 13, 1994,

Page 12: Extraction de motifs d’évolution dans les Séries ... · PDF fileBRU 99, HOW 06], la régression et l’interpolation [JHA 94, ... nomie. Cependant, leur proposition ne permet l’extraction

12 SAGEO’10.

p. 2543–2552, Taylor and Francis.

[JOH 98] JOHNSON R., KASISCHKE E., « Change vector analysis : a technique for the multis-pectral monitoring of land cover and condition », International Journal of Remote Sensing,vol. 19, no 16, 1998, p. 411-426.

[JUL 06] JULEA A., MÉGER N., TROUVÉ E., « Sequential patterns extraction in multitem-poral satellite images », 17th European Conference on Machine Learning and the 10thEuropean Conference on Principles and Practice of Knowledge Discovery in Databases(ECML / PPKD), 2006, page 96.

[JUL 08] JULEA A., MÉGER N., TROUVÉ E., BOLON P., « On Extracting Evolutions fromSatellite Image Time Series », IEEE International Geoscience and Remote Sensing Sym-posium (IGARSS), vol. 5, 2008, p. 228-231.

[KEN 07] KENNEDY R. E., COHEN W. B., SCHROEDER T. A., « Trajectory-based changedetection for automated characterization of forest disturbance dynamics », Remote Sensingof Environment, vol. 110, no 3, 2007, p. 370–386.

[KET 07] KETTERLIN A., GANÇARSKI P., « Sequence similarity and multi-date image seg-mentation », Fourth Intl Workshop on the Analysis of Multitemporal Remote SensingImages, Leuven, Belgique, july 2007.

[MAC 67] MACQUEEN J., « Some Methods for Classification and Analysis of MultivariateObservations », Proceedings of 5th Berkeley Symposium on Mathematical Statistics andProbability, 1967, p. 281-297.

[MAS 98] MASSEGLIA F., CATHALA F., PONCELET P., « The PSP Approach for MiningSequential Patterns », Proceedings of the 2nd European Symposium on Principles of DataMining and Knowledge Discovery, 1998.

[MEL 02] MELGANI F., MOSER G., SERPICO S. B., « Unsupervised change-detection me-thods for remote-sensing images », Optical Engineering, vol. 41, no 12, 2002, p. 3288-3297, SPIE.

[NIE 98] NIELSEN A., CONRADSEN K., SIMPSON J., « Multivariate Alteration Detection(MAD) and MAF Postprocessing in Multispectral, Bitemporal Image Data : New Ap-proaches to Change Detection Studies », Remote Sensing of Environment, vol. 64, no

1, 1998, p. 1–19.

[RID 98] RIDD M. K., LIU J., « A comparison of four algorithms for change detection in anurban environment », Remote sensing of environment, vol. 63, no 2, 1998, p. 95–100,Elsevier Science.

[TOD 77] TODD W., « Urban and regional land use change detected by using Landsat data »,Journal of Research by the US Geological Survey, vol. 5, 1977, p. 527–534.

[VER 10] VERBESSELT J., HYNDMAN R., NEWNHAM G., CULVENOR D., « Detecting trendand seasonal changes in satellite image time series », Remote Sensing of Environment,vol. 114, no 1, 2010, p. 106 - 115.