Upload
baby
View
32
Download
0
Embed Size (px)
DESCRIPTION
PROJET DE RECHERCH E # 3 Évaluation et sélection de données sources “ le défi pour faciliter l'agrégation automatique des données géospatiales des systèmes décisionnels ”. John-William Cely-Pulido Étudiant Université Laval Yvan Bédard Directeur Titulaire de la Chaire - PowerPoint PPT Presentation
Citation preview
PROJET DE RECHERCHE # 3
Évaluation et sélection de données sources
“le défi pour faciliter
l'agrégation automatique des données géospatiales
des systèmes décisionnels”
John-William Cely-Pulido Étudiant Université Laval
Yvan Bédard Directeur Titulaire de la Chaire
Jean Brodeur Codirecteur Partenaire C.I.T. Sherbrooke
Marc Gervais Conseilleur Université Laval
InformationAgrégée
Information Agrégée
géospatiale
App..nOrganisation
•Besoin 1
•Besoin 2
•Besoin 3
•Besoin N.
.
.
.
.
•Utilisateur 1
•Utilisateur 2
•Utilisateur 3
•Utilisateur N.
.
.
.
.
Est-ce que les données correspondent aux besoins
Des utilisateurs?
Information Détaillée
App1
Diversité de besoinsDiversité de besoins
Information Détaillée
+Agrégée
Données
Sources
Plusieurs SourcesPlusieurs Sources Contexte
Données agrégéeDonnées agrégéess pour construire le cube. pour construire le cube. Données détaillées Données agrégées
Agrégation ou Généralisation Agrégation ou Généralisation
Généralisation? Agrégation ?
Difficulté d’automatisationCoûts élevés
Délais très longs
Solution:Chercher d’autres sources de données
Sources alternatives
Cartes à plus petites échelles
Toute intégration de données nécessite une Toute intégration de données nécessite une sélection à sélection à prioripriori des sources à intégrer (Hallen 1991) des sources à intégrer (Hallen 1991)
Les données géospatiales agrégées peuvent provenir Les données géospatiales agrégées peuvent provenir d'une d'une source distinctesource distincte des données détaillées (Bédard des données détaillées (Bédard et al. 2001) et al. 2001)
Le Problème
Sélectionner la meilleure source qui correspond aux besoins
Évaluer les efforts d'intégration/agrégation des différents jeux de données.
Organisation
Besoin 1Besoin 2
.
.
.Besoin n
Différents besoins vs. Plusieurs sourcesDifférents besoins vs. Plusieurs sources
Correspondance entre les objets à petite échelle et les objets détaillés.
Il devient nécessaire d’identifier les meilleures sources de données afin d’assurer une information de qualité.
L’approche
Besoin 1
Besoin 1Besoin 2Besoin 3
.Besoin n
Besoins
•plusieurs niveaux de granularité
•plusieurs époques
Sources
•Un seul niveau de granularité
•Une époque
Source
SPATIALETEMPORELLESEMANTIQUE
Analyse desEfforts
Critères de sélection : - Moins de travail- Moins cher- Plus accessible ......... .........
Critères d’évaluation: - Mise à jour
- Restructuration - Changement de forme ....... .......
L’approche
Besoin 2
Besoin 1Besoin 2Besoin 3
.Besoin n
Besoins
•plusieurs niveaux de granularité
•plusieurs époques
Sources
•Un seul niveau de granularité
•Une époque
Source
SPATIALETEMPORELLESEMANTIQUE
Analyse desEfforts
Critères de sélection : - Moins de travail
- Moins cher- Plus accessible ......... .........
Critères d’évaluation: - Mise à jour
- Restructuration - Changement de forme ....... .......
L’approche
Besoin 2
Besoin 1Besoin 2Besoin 3
.Besoin n
Besoins
•plusieurs niveaux de granularité
•plusieurs époques
Sources
•Un seul niveau de granularité
•Une époque
SPATIALETEMPORELLESEMANTIQUE
Analyse desEfforts
Source
L’approche
Besoin 3
Besoin 1Besoin 2Besoin 3
.Besoin n
Besoins
•plusieurs niveaux de granularité
•plusieurs époques
Sources
•Un seul niveau de granularité
•Une époque
SPATIALETEMPORELLESEMANTIQUE
Analyse desEfforts
Source
L’approche
Besoin N
Besoin 1Besoin 2Besoin 3
.Besoin n
Besoins
•plusieurs niveaux de granularité
•plusieurs époques
Sources
•Un seul niveau de granularité
•Une époque
SPATIALETEMPORELLESEMANTIQUE
Analyse desEfforts
Source
“Évaluation systémique de la qualité des données
Cadre TheóriqueUn processus à évaluer = Un processus à évaluer = Sélectionner la meilleure source Sélectionner la meilleure source mesure la mesure la
performance performance
Processus en Y -2TUP-
(Adaptation Track Unified Process)
Mesure la performance avec “Software Metrics”:
“Aider à quantifier la meilleure source “
Quel est le meilleur processus
Il y a un modèle pour gérer : (développement de systèmes d'information )
•Les risques d’imprécision fonctionnelle, et d’inadéquation aux besoins.
ETL
•Pour le ETL : ETL moins cher, le plus facile.
•Les efforts de ETL :les plus petits (Évaluer la procédure ETL)
EvaluationSelectGeospatialInformation
“Une approche pour optimiser le processus ETL spatial à partir de la sélection de données”
Évaluer et sélectionner la meilleure source
Évaluer et sélectionner la meilleure procédure
Merci !
”Évaluation systémique de la qualité des données
pour l’optimisation du
processus de peuplement des cubes des données
géospatiales”