12
PROJET DE RECHERCHE # 3 Évaluation et sélection de données sources “le défi pour faciliter l'agrégation automatique des données géospatiales des systèmes décisionnels” John-William Cely-Pulido Étudiant Université Laval Yvan Bédard Directeur Titulaire de la Chaire Jean Brodeur Codirecteur Partenaire C.I.T. Sherbrooke Marc Gervais Conseilleur

John-William Cely-Pulido Étudiant Université Laval

  • Upload
    baby

  • View
    32

  • Download
    0

Embed Size (px)

DESCRIPTION

PROJET DE RECHERCH E # 3 Évaluation et sélection de données sources “ le défi pour faciliter l'agrégation automatique des données géospatiales des systèmes décisionnels ”. John-William Cely-Pulido Étudiant Université Laval Yvan Bédard Directeur Titulaire de la Chaire - PowerPoint PPT Presentation

Citation preview

Page 1: John-William Cely-Pulido Étudiant  Université Laval

PROJET DE RECHERCHE # 3

Évaluation et sélection de données sources

“le défi pour faciliter

l'agrégation automatique des données géospatiales

des systèmes décisionnels”

John-William Cely-Pulido Étudiant Université Laval

Yvan Bédard Directeur Titulaire de la Chaire

Jean Brodeur Codirecteur Partenaire C.I.T. Sherbrooke

Marc Gervais Conseilleur Université Laval

Page 2: John-William Cely-Pulido Étudiant  Université Laval

InformationAgrégée

Information Agrégée

géospatiale

App..nOrganisation

•Besoin 1

•Besoin 2

•Besoin 3

•Besoin N.

.

.

.

.

•Utilisateur 1

•Utilisateur 2

•Utilisateur 3

•Utilisateur N.

.

.

.

.

Est-ce que les données correspondent aux besoins

Des utilisateurs?

Information Détaillée

App1

Diversité de besoinsDiversité de besoins

Information Détaillée

+Agrégée

Données

Sources

Plusieurs SourcesPlusieurs Sources Contexte

Page 3: John-William Cely-Pulido Étudiant  Université Laval

Données agrégéeDonnées agrégéess pour construire le cube. pour construire le cube. Données détaillées Données agrégées

Agrégation ou Généralisation Agrégation ou Généralisation

Généralisation? Agrégation ?

Difficulté d’automatisationCoûts élevés

Délais très longs

Solution:Chercher d’autres sources de données

Sources alternatives

Cartes à plus petites échelles

Toute intégration de données nécessite une Toute intégration de données nécessite une sélection à sélection à prioripriori des sources à intégrer (Hallen 1991) des sources à intégrer (Hallen 1991)

Les données géospatiales agrégées peuvent provenir Les données géospatiales agrégées peuvent provenir d'une d'une source distinctesource distincte des données détaillées (Bédard des données détaillées (Bédard et al. 2001) et al. 2001)

Page 4: John-William Cely-Pulido Étudiant  Université Laval

Le Problème

Sélectionner la meilleure source qui correspond aux besoins

Évaluer les efforts d'intégration/agrégation des différents jeux de données.

Organisation

Besoin 1Besoin 2

.

.

.Besoin n

Différents besoins vs. Plusieurs sourcesDifférents besoins vs. Plusieurs sources

Correspondance entre les objets à petite échelle et les objets détaillés.

Il devient nécessaire d’identifier les meilleures sources de données afin d’assurer une information de qualité.

Page 5: John-William Cely-Pulido Étudiant  Université Laval

L’approche

Besoin 1

Besoin 1Besoin 2Besoin 3

.Besoin n

Besoins

•plusieurs niveaux de granularité

•plusieurs époques

Sources

•Un seul niveau de granularité

•Une époque

Source

SPATIALETEMPORELLESEMANTIQUE

Analyse desEfforts

Critères de sélection : - Moins de travail- Moins cher- Plus accessible ......... .........

Critères d’évaluation: - Mise à jour

- Restructuration - Changement de forme ....... .......

Page 6: John-William Cely-Pulido Étudiant  Université Laval

L’approche

Besoin 2

Besoin 1Besoin 2Besoin 3

.Besoin n

Besoins

•plusieurs niveaux de granularité

•plusieurs époques

Sources

•Un seul niveau de granularité

•Une époque

Source

SPATIALETEMPORELLESEMANTIQUE

Analyse desEfforts

Critères de sélection : - Moins de travail

- Moins cher- Plus accessible ......... .........

Critères d’évaluation: - Mise à jour

- Restructuration - Changement de forme ....... .......

Page 7: John-William Cely-Pulido Étudiant  Université Laval

L’approche

Besoin 2

Besoin 1Besoin 2Besoin 3

.Besoin n

Besoins

•plusieurs niveaux de granularité

•plusieurs époques

Sources

•Un seul niveau de granularité

•Une époque

SPATIALETEMPORELLESEMANTIQUE

Analyse desEfforts

Source

Page 8: John-William Cely-Pulido Étudiant  Université Laval

L’approche

Besoin 3

Besoin 1Besoin 2Besoin 3

.Besoin n

Besoins

•plusieurs niveaux de granularité

•plusieurs époques

Sources

•Un seul niveau de granularité

•Une époque

SPATIALETEMPORELLESEMANTIQUE

Analyse desEfforts

Source

Page 9: John-William Cely-Pulido Étudiant  Université Laval

L’approche

Besoin N

Besoin 1Besoin 2Besoin 3

.Besoin n

Besoins

•plusieurs niveaux de granularité

•plusieurs époques

Sources

•Un seul niveau de granularité

•Une époque

SPATIALETEMPORELLESEMANTIQUE

Analyse desEfforts

Source

“Évaluation systémique de la qualité des données

Page 10: John-William Cely-Pulido Étudiant  Université Laval

Cadre TheóriqueUn processus à évaluer = Un processus à évaluer = Sélectionner la meilleure source Sélectionner la meilleure source mesure la mesure la

performance performance

Processus en Y -2TUP-

(Adaptation Track Unified Process)

Mesure la performance avec “Software Metrics”:

“Aider à quantifier la meilleure source “

Quel est le meilleur processus

Il y a un modèle pour gérer : (développement de systèmes d'information )

•Les risques d’imprécision fonctionnelle, et d’inadéquation aux besoins.

Page 11: John-William Cely-Pulido Étudiant  Université Laval

ETL

•Pour le ETL : ETL moins cher, le plus facile.

•Les efforts de ETL :les plus petits (Évaluer la procédure ETL)  

EvaluationSelectGeospatialInformation

“Une approche pour optimiser le processus ETL spatial à partir de la sélection de données”

Page 12: John-William Cely-Pulido Étudiant  Université Laval

Évaluer et sélectionner la meilleure source

Évaluer et sélectionner la meilleure procédure

Merci !

”Évaluation systémique de la qualité des données

pour l’optimisation du

processus de peuplement des cubes des données

géospatiales”