Upload
solange-chiron
View
106
Download
4
Embed Size (px)
Citation preview
1
Étude de la formalisation des spécifications de bases de données
géographiques en vue de leur intégration
par Nils GesbertThèse préparée au laboratoire COGIT de l’IGN
Encadrement IGN : Sébastien MustièreDirectrice de thèse : Thérèse Libourel, LIRMM
(Montpellier)
2
Plan de la présentation
1. Contexte : problématique de l’intégration
2. Spécifications des bases de données géographiques
3. Structure générale du modèle : utilisation d’une ontologie
4. Procédures de représentation
5. Exemple d’utilisation
6. Prototype logiciel de saisie des spécifications
3
Contexte :plusieurs bases de données
géographiques pour représenter un même terrain
4
Différentes représentations du terrain— Différents niveaux de détail
— Différents points de vue
5
Plusieurs bases de données indépendantes
Problèmes posés par l’indépendance des bases :
— Informations redondantes entre bases, d’où :
— risques d’incohérences
— duplication du travail de mise à jour
— Utilisation simultanée de plusieurs représentations plus difficile
6
Intégration de schémas de bases de données
trois étapes principales
Schémas d’origine Schémas dansun modèle commun
Schémas appariés Schémas fédérés
Préintégration
Intégration
Déclaration des correspondancesSpécifications
Bases de données fédérées[Sheth et Larson 1990]
Modèles pour les BDG : MADS [Parent, Spaccapietra et al.], Perceptory [Bédard et al.], ...
Génération automatique du schéma intégré : projet Amber [Sotnykova 2003]
7
Spécifications des basesde données
géographiques
8
DéfinitionPortion de cours d'eau, réel ou fictif, permanent ou temporaire, naturel ou artificiel, homogène pour l'ensemble des attributs et des relations qui la concernent, et qui n'inclut pas de confluent.SélectionLe réseau hydrographique composé des objets <tronçon de cours d'eau> est décrit de manière continue.La continuité du réseau n'est toutefois pas toujours assurée dans les cas suivants :— arrivée d'un cours d'eau en ville— infiltration d'un cours d'eau (ex. perte en terrain calcaire)— arrivée d'un petit ruisseau temporaire dans une large plaine où son tracé se perd— zones de marais où les connexions et interruptions du réseau restent indicativesTous les cours d'eau permanents, naturels ou artificiels, sont inclus. Les cours d'eautemporaires naturels sont inclus, à l'exception des tronçons de moins de 200 msitués aux extrémités amont du réseau.Les cours d’eau temporaires artificiels ou artificialisés sont sélectionnés en fonction de leur importance et de l’environnement.Les talwegs qui ne sont pas marqués par la présence régulière de l’eau sont exclus.Tous les cours d’eau nommés de plus de 7,5 m de large sont inclus (tronçon de cours d’eau d’attribut <fictif> = « oui » superposé à un objet de classe <surface d’eau>).Fossé : Les gros fossés de plus de 2 m de large sont inclus lorsqu’ils coulent de manièrepermanente. Modélisation géométriqueA l'axe et à la surface du cours d’eau (tel qu’il se présente sur les photographies aériennes). L’orientation de l’objet définit le sens d’écoulement. Elle n’est pas significative dans les zones très plates (ex. marais) ni pour les canaux.Attribut : NatureDéfinition : attribut permettant de distinguer les tronçons de cours d’eau libres des obstaclesType : listeValeurs d'attribut : cours d'eau indifférencié / barrage / cascade / écluse
Critères contextuels
Critères géométriques
Critères relatifs à d’autres propriétés
Tronçon de cours d’eau BD Topo Pays
9
Définition — sélectionUn tronçon hydrographique correspond à l'axe du lit d'une rivière, d'un ruisseau ou d'un canal.La BDCarto contient :— tous les axes principaux, y compris dans la zone d'estran et dans les zones de marais, à l'exception des "culs-de-sac" d'une longueur inférieure à un kilomètre sauf s'ils appartiennent à un cours d'eau d'une longueur supérieure à un kilomètre ;— outre l'axe principal, les axes des bras secondaires d'une longueur supérieure à un kilomètre ou qui délimitent une île d'une superficie supérieure à dix hectares quand un cours d'eau se subdivise en plusieurs.Géométrie — constructionLes éléments du réseau d'hydrographie sont découpés en portions ayant les mêmes attributs. Le changement de valeur d'un attribut n'entraîne la création d'un tronçon que si la nouvelle valeur reste la même sur une longueur d'au moins un kilomètre ; sinon, le tronçon précédent est prolongé.Attributs[1] Etat0- inconnu : l'existence d'un écoulement est certaine, mais le tracé n'est pas connu avec précision. 1- continu 2- intermittent 3- fictif : assure la continuité de l'écoulement à l'intérieur des zones d'hydrographie (poste 51 des zones d’occupation du sol O-s-1), lorsque le tracé n'est pas connu avec précision. 4- abandonné, à sec[2] Largeur1- entre 0 et 15 m 2- entre 15 et 50 m 3- plus de 50 m[3] Nature1- cours d'eau naturel 3- canal, chenal : voie d'eau artificielle4- aqueduc, conduite forcée : tuyau ou chenal artificiel conçu pour le transport de l'eau (usage hydroélectrique, industriel...)7- estuaire : écoulement d'un cours d'eau dans la zone d'estran[4] Navigabilité
Contexte Géométrie
Tronçon hydrographique BD Carto
10
Structure actuelle des spécifications
Actuellement, on a une fiche de spécifications pour chaque classe du schéma conceptuel.
Cette fiche comprend quatre sections principales :
— définition générale
— critères de sélection
— règles de modélisation géométrique
— liste d’attributs avec définitions
et un certain nombre d’informations annexes.
Terrain Sélection Modélisation Base dedonnées(le représenter
comment ?)(représenter quoi ?)
Définition
11
Difficultés d’utilisation pour l’intégration
— texte libre.
— structures légèrement différentes d’une BD à l’autre.
— difficile de savoir a priori où trouver une information particulière.
— peu adaptées à un traitement automatique.
— comparaison de deux jeux de spécifications difficile.
Nous allons donc proposer un modèle pour représenter les spécifications de façon formelle et unifiée.
12
un aqueduc est un tronçon hydrographique dans la BD Carto
un aqueduc est une canalisation dans la BD Topo Pays
— utilisation de concepts non représentés par des classes
— regroupements en classes différents dans les différentes BD
Le tracé peut être interrompu en ville
— mélange entre conditions sur les entités du terrain et sur les objets de la base
Portion de cours d’eau, réel ou fictif, permanent ou temporaire, naturel ou artificiel, homogène pour l’ensemble des attributs et des relations qui la concernent, et qui n’inclut pas de confluent. (BD Topo Pays)
Problèmes rencontrés pour la formalisation
13
Structure généralede notre modèle
Utilisation d’une ontologie
14
Attribut
nom : String type
*
Terrain Sélection Modélisation Base dedonnées(le représenter
comment ?)(représenter quoi ?)
Ontologie Schéma
Spécifications
Structure générale du modèle
1..* * 1..* 1..*
ProcedureDeRepresentation représenté par participe à
baseConcernee description : String
baseProprietaire nom : String
Propriete
nom : String type dependPosition : boolean
*
TypeEntite Geographique
nom : String
ClasseBase
15
DéfinitionPortion de cours d'eau, réel ou fictif, permanent ou temporaire, naturel ou artificiel, homogène pour l'ensemble des attributs et des relations qui la concernent, et qui n'inclut pas de confluent.SélectionLe réseau hydrographique composé des objets <tronçon de cours d'eau> est décrit de manière continue.La continuité du réseau n'est toutefois pas toujours assurée dans les cas suivants :— arrivée d'un cours d'eau en ville— infiltration d'un cours d'eau (ex. perte en terrain calcaire)— arrivée d'un petit ruisseau temporaire dans une large plaine où son tracé se perd— zones de marais où les connexions et interruptions du réseau restent indicativesTous les cours d'eau permanents, naturels ou artificiels, sont inclus. Les cours d'eautemporaires naturels sont inclus, à l'exception des tronçons de moins de 200 msitués aux extrémités amont du réseau.Les cours d’eau temporaires artificiels ou artificialisés sont sélectionnés en fonction de leur importance et de l’environnement.Les talwegs qui ne sont pas marqués par la présence régulière de l’eau sont exclus.Tous les cours d’eau nommés de plus de 7,5 m de large sont inclus (tronçon de cours d’eau d’attribut <fictif> = « oui » superposé à un objet de classe <surface d’eau>).Fossé : Les gros fossés de plus de 2 m de large sont inclus lorsqu’ils coulent de manièrepermanente. Modélisation géométriqueA l'axe et à la surface du cours d’eau (tel qu’il se présente sur les photographies aériennes). L’orientation de l’objet définit le sens d’écoulement. Elle n’est pas significative dans les zones très plates (ex. marais) ni pour les canaux.Attribut : NatureDéfinition : attribut permettant de distinguer les tronçons de cours d’eau libres des obstaclesType : listeValeurs d'attribut : cours d'eau indifférencié / barrage / cascade / écluse
Utilisation de mots-clefs
16
«Ent. géog.»Cours d'eau
«Ent. géog.»
Élt du réseau hydro
«Ent. géog.»Canal
«Ent. géog.»Fossé
«Ent. géog.»
Aqueduc
«Ent. géog.»Rivière
«Ent. géog.»Nœud réseau
«Ent. géog.»Confluent
«Ent. géog.»Diffluent
«Ent. géog.»Source
«Ent. géog.»Perte
«Ent. géog.»Embouchure
«Ent. géog.»Acc. parcours
«Ent. géog.»Barrage
«Ent. géog.»Écluse
«Ent. géog.»Cascade
affluent de*
0..1
Exemple de propriété de la cascade :être touristique
Exemples de propriétés du cours d’eau :être navigable = f (position)être souterrain / au sol / sur pont = f (position)être permanent / intermittent / à sec = f (position)
Exemple : le réseau hydrographique
17
«Ent. géog.»Cours d'eau
«Ent. géog.»
Élt du réseau hydro
«Ent. géog.»Canal
«Ent. géog.»Fossé
«Ent. géog.»
Aqueduc
«Ent. géog.»Rivière
«Ent. géog.»Nœud réseau
«Ent. géog.»Confluent
«Ent. géog.»Diffluent
«Ent. géog.»Source
«Ent. géog.»Perte
«Ent. géog.»Embouchure
«Ent. géog.»Acc. parcours
«Ent. géog.»Barrage
«Ent. géog.»Écluse
«Ent. géog.»Cascade
«Objet de la base»Tronçon cours d’eau
«Objet de la base»Point d’eau
«Objet de la base»Cours d'eau nommé
«Objet de la base»Surface d’eau
affluent de*
0..1
Schéma BDTopo Pays
Ontologie
Sélection :largeur > 7,5 m
Modélisation :attribut Nature = source
Modélisation :Nature = cascade
Sélection :a un toponyme
Modélisation :axe à résolution 2,5 martificiel = ouidécoupé en tronçons aux changements d’attributs
Exemple : le réseau hydrographique
18
«Ent. géog.»Cours d'eau
«Ent. géog.»
Élt du réseau hydro
«Ent. géog.»Canal
«Ent. géog.»Fossé
«Ent. géog.»
Aqueduc
«Ent. géog.»Rivière
«Ent. géog.»Nœud réseau
«Ent. géog.»Confluent
«Ent. géog.»Diffluent
«Ent. géog.»Source
«Ent. géog.»Perte
«Ent. géog.»Embouchure
«Ent. géog.»Acc. parcours
«Ent. géog.»Barrage
«Ent. géog.»Écluse
«Ent. géog.»Cascade
«Objet de la base»Tronçon hydro
«Objet de la base»Nœud hydro«Objet de la base»
Cours d'eau
«Objet de la base»Z.O.S.
affluent de*
0..1
Ontologie
Schéma BDCartoSélection : largeur > 50 mModélisation : poste = 51 (eau libre)
Exemple : le réseau hydrographique
19
Détail des procéduresde représentation
20
(<aff. Attr.>, <aff. Attr.>, ...)(<nom attr.> = <expr.>, ...)
ProcedureDeRepresentation
baseConcernee
représenté par participe à
instancie
TypeEntiteGeographique
Propriete
AffectationAttribut
détermine la valeur de
modélisation RegleInstanciation
ClasseBase
Attribut
BlocRepresentation
Contrainte
sélection
Expression
valeur définie par
règle applicable si
Structure des procédures de représentation
sélection : <contrainte>
instanciation : <règle>; <règle> ...Instancie <nom classe>
Si <contrainte> Alors <règle_inst.>
valeur de
si oui
si non
a pour condition
Expression Conditionnelle
ValeurLitterale ValeurPropriete
<nom attr.> = <nom propr.>
<nom attr.> = Si <contrainte> Alors <valeur> Sinon <valeur>
21Relation (<nom de type d’entité géographique>, <type de relation>)
( [Non] <contrainte élémentaire> {Et|Ou} <contrainte élémentaire> ... )
Est <nom de type d’entité géographique>
<nom propriété> {>|=|<|=/=} <valeur numérique ou booléenne...>
<nom propriété>.<contrainte>
Vérifie "<texte libre>"
Contrainte
Contrainte Relation
Contrainte SurPropriete
décrite par
Contrainte Relation
Topologique
ContrainteRelationMétrique
Contrainte RelationAutre
relation avec
TypeEntite Geographique
est de type
Contraintes
porte sur
Propriete Contrainte
SurPropriete Complexe
ContrainteSur ProprieteSimple
operateurComparaison valeurSeuil
Contrainte Descriptive
negation : bool
ContrainteComplexe
operateurLogique
contraintes composantes
Contrainte Nature
22
Agrégation
Découpage
23
instancie
TypeEntiteGeographique
Propriete contenu dans
contenu dans
AffectationAttribut
détermine la valeur de
modélisation RegleInstanciation
ClasseBase
Attribut
RegleDecoupage
Contrainte
sélection
ContrainteAgregation
Expression
valeur définie par
règle applicable si
Agrégation et découpage
agrégation : <contr. agr.>
<bloc représentation>
Fin agrégation
découpage : <règle d.>; <règle d.>...
sections : <bloc représentation>
limites : <bloc représentation>
Fin découpage
ProcedureDeRepresentation
baseConcernee
représenté par participe à
BlocRepresentation
24
Exemple : bâtiments dans la BDTopo Pays
25
Moins de 20 m²
Altitude contour : 40 m
Altitude sommet : 70 m
Construction ponctuelle autrereligieuxBâtiment : industriel, agricole, commercial
Deux classes pour représenter les bâtiments
26
Tous les bâtiments de plus de 50 m² sont inclus.Les bâtiments faisant entre 20 et 50 m² sont sélectionnés s’ils sont à plus de 100 m d’une habitation et qu’ils ne sont pas d’aspect précaire.Les bâtiments de moins de 20 m² sont représentés par un objet de classe <construction ponctuelle> s’ils font plus de 50 m de haut ou sont explicitement désignés sur la carte en cours.
sélection :superficie > 50 "m²" Ou (
superficie > 20 "m²"Et (Non Relation (habitation, Distance < 100 "m"))Et (Non Est cabane)
)Ou hauteur ("maximale") > 50 "m"Ou Vérifie "spécifiquement désigné sur la carte en cours"
Sélection
27
AgrégationPlusieurs bâtiments contigus ou superposés de même « nature » et de même « fonction » sont généralement considérés comme un seul et même objet (seul le contour extérieur est saisi). Deux objets contigus ou superposés sont cependant représentés s’ils présentent les caractéristiques suivantes :
— différence de hauteur entre les deux bâtiments > 10 m environ— surface de chaque objet résultant de 400 m² environ ou plus
agrégation : (Même nature Et Même fonction Et Distance = 0 Et (Non Chacun superficie > 400 "m²") Et Différence hauteur < 10 "m") Ou (Chacun Est serre Et Distance < 3 "m")
Attributsattributs :
nature = Si Est arc_de_triomphe Alors "arc de triomphe"Sinon Si Est chateau Alors "château"Sinon Si Est eglise Alors "église"Sinon Si Est serre Alors "serre"Sinon Si Vérifie "remarquable dans le paysage par sa forme élevée"
Alors "tour, donjon, moulin"Sinon "indifférenciée";
fonction = Si Est gare Alors "gare"Sinon Si Est mairie Alors "mairie"Sinon Si Vérifie "réservé à des activités agricoles" Alors "agricole"Sinon "indifférenciée"
28
Instanciation
instanciation :Si superficie > 20 "m²" Alors (
Instancie batiment (geometrie = contour ("tel que vu d'avion"),nature = nature,fonction = fonction
);Si Vérifie "différence de hauteur entre sommet et contour > 10 m"
Alors Instancie construction_ponctuelle (nature = Si Est phare Alors "phare"
Sinon Si sommet.Est cheminee Alors "cheminée"Sinon "construction ponctuelle indifférenciée",
geometrie = sommet)
)Sinon Instancie construction_ponctuelle (
geometrie = centre ("altitude maximum"),nature = Si Est transformateur Alors "transformateur"
Sinon Si Est pylone_de_telecommunication Alors "antenne"Sinon "construction ponctuelle indifférenciée"
)
29
sélection : Non Est chateau_d_eauattributs :
nature = Si Est arc_de_triomphe Alors "arc de triomphe"Sinon Si Est chateau Alors "château"Sinon Si Est eglise Alors "église"Sinon Si Est serre Alors "serre"Sinon Si Vérifie "remarquable dans le paysage par sa forme élevée"
Alors "tour, donjon, moulin"Sinon "indifférenciée";
fonction = Si Est gare Alors "gare"Sinon Si Est mairie Alors "mairie"Sinon Si Vérifie "réservé à des activités agricoles" Alors "agricole"Sinon "indifférenciée"
agrégation :(Même nature Et Même fonction Et Distance = 0
Et (Non Chacun superficie > 400 "m²") Et Différence hauteur < 10 "m")Ou (Chacun Est serre Et Distance < 3 "m")
sélection :superficie > 50 "m²" Ou (
superficie > 20 "m²"Et (Non Relation (habitation, Distance < 100 "m"))Et (Non Est cabane) // Vérifie "d'aspect non précaire" ?
)Ou hauteur ("maximale") > 50 "m"Ou Vérifie "spécifiquement désigné sur la carte en cours"
instanciation :Si superficie > 20 "m²" Alors (
Instancie batiment (geometrie = contour ("tel que vu d'avion"),nature = nature,fonction = fonction
);Si Vérifie "différence de hauteur entre sommet et contour > 10 m" Alors
Instancie construction_ponctuelle (nature = Si Est phare Alors "phare"
Sinon Si sommet.Est cheminee Alors "cheminée"Sinon "construction ponctuelle indifférenciée",
geometrie = sommet)
)Sinon Instancie construction_ponctuelle (
geometrie = centre ("altitude maximum"),nature = Si Est transformateur Alors "transformateur"
Sinon Si Est pylone_de_telecommunication Alors "antenne"Sinon "construction ponctuelle indifférenciée"
)Fin agrégation
30
Mise en œuvre logicielle
31
32
33
34
35
36
37
38
39
40
Conclusion
Nous proposons un modèle pour représenter formellement des spécifications de bases de données géographiques.
— Représentation des spécifications par des liens entre une ontologie et le schéma de la base de données
— Langage formel pour décrire les règles de représentation des entités géographiques
41
Utilisations
— Utilisation pour l’intégration :
— détermination des correspondances interschémas
— vérification de la cohérence entre représentations
— Utilisation documentaire :
— métadonnées pour aider un utilisateur à trouver les données dont il a besoin
— mise en valeur de connaissances auparavant implicites sur la modélisation de l’espace géographique
42
Perspectives
— Procédures de représentation :
— associations entre objets de la base
— relations entre entités géographiques
— règles de modélisation géométrique
— Ontologie :
— traitement automatique du langage naturel pour sa création
— structure plus complexe avec différents types de liens, connaissances sur les entités…