34
Réutilisation de corpus et capitalisation d’analyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza* (*) LIMSI-CNRS (**) SOAD-R&D-EDF SA

Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Embed Size (px)

Citation preview

Page 1: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Réutilisation de corpus et

capitalisation d’analyses

Helka Folch*, Benoit Habert*, David Leray*,

Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

(*) LIMSI-CNRS

(**) SOAD-R&D-EDF SA

Page 2: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

1. Problématique de la Fouille de Données Complexes à EDF

Données multi-sources et multi-relationnelles Début de solution : l’analyse secondaire Périmètre de nos travaux

2. Architecture globale

3. Réutilisation de corpus et capitalisation d’analyses

Structuration Une journée dans la vie d’une étude…

4. Conclusion et perspectives (le passage à l’échelle)

Plan

Page 3: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

D’après le SBF, un des syndicat de la boulangerie, M. X, boulanger du quartier Q achète son four à l’entreprise Bidule et sa farine à la minoterie Maichin ; par l’enquête « comment être boulanger au 21ième siècle et rester séduisant », on sait qu’il est abonné à « Boulangerie Magazine » dans lequel on trouve souvent la publicité pour Bidule ; sur son site web, M. X nous apprend qu’il fabrique un pain bio et qu’il référence la minoterie Meichin et M. Y qui comme lui produit un pain bio ; à EDF, on sait qu’il a un profil de consommation P et a déménagé l’an dernier

1. Problématique de la Fouille de Données Complexes à EDF

multi-sources

multi-relationnelles

Page 4: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

D’après le SBF, un des syndicat de la boulangerie, M. X, boulanger du quartier Q achète son four à l’entreprise Bidule et sa farine à la minoterie Maichin ; par l’enquête « comment être boulanger au 21ième siècle et rester séduisant », on sait qu’il est abonné à « Boulangerie Magazine » dans lequel on trouve souvent la publicité pour Bidule ; sur son site web, M. X nous apprend qu’il fabrique un pain bio et qu’il référence la minoterie Meichin et M. Y qui comme lui produit un pain bio ; à EDF, on sait qu’il a un profil de consommation P et a déménagé l’an dernier

D’après le SBF, un des syndicats de la boulangerie, M. X, boulanger du quartier Q achète son four à l’entreprise Bidule et sa farine à la minoterie Maichin ; par l’enquête « comment être boulanger au 21ième siècle et rester séduisant », on sait qu’il est abonné à « Boulangerie Magazine » dans lequel on trouve souvent la publicité pour Bidule ; sur son site Web, M. X nous apprend qu’il fabrique un pain bio et qu’il référence la minoterie Meichin et M. Y qui comme lui produit un pain bio ; à EDF, on sait qu’il a un profil de consommation P et a déménagé l’an dernier.

Comment tirer le meilleur parti de toutes ces informations

comment stocker

comment analyser

comment faire partager

par « l’enquête comachètedu quartier Q

M. Y.

syndicats

abonné

référence

profil de consommation P e

Maichin

?

M. X.

Meichin

1. Problématique de la Fouille de Données Complexes à EDF

Page 5: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

L’analyse secondaire comme définie et pratiquée à EDF« réutiliser des données déjà capitalisées avec des objectifs d’analyse qui ne sont pas ceux pour lesquels elles étaient initialement collectées »

Le recours à l’analyse secondaire est motivé par :

les coûts

les gains méthodologiques apportés

Des précautions méthodologiques…

la mise à disposition des traces du contexte de l’analyse initiale, des stratégies, des hypothèses d’analyse en plus des données brutes.

1. Problématique – Début de solution : l’analyse secondaire

Page 6: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Lancement d’une analyse secondaire sur la problématique « déterminer les motivations, événements déclenchants de la rénovation »

Étude réalisée à partir de 9 analyses primaires dont :

L’appréciation de trois systèmes domotiques

Le retour d’expérience de la rénovation de logements sociaux

La climatisation fixe réversible dans une optique de mesure de la satisfaction

Zoom sur l’analyse primaire « la climatisation fixe réversible »

Segment de marché : les particuliers

Méta-données descriptives : sexe, âge, profession, type de logement

Méta-données issues de l’analyse : remarques du sociologue sur les réticences, les motifs d’investissement dans ce type d’appareil, la gestion de la nouvelle installation.

1. Problématique – l’analyse secondaire, un exemple concret

Page 7: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

D’après le SBF, un des syndicat de la boulangerie, M. X, boulanger du quartier Q achète son four à l’entreprise Bidule et sa farine à la minoterie Maichin ; par l’enquête « comment être boulanger au 21ième siècle et rester séduisant », on sait qu’il est abonné à « Boulangerie Magazine » dans lequel on trouve souvent la publicité pour Bidule ; sur son site web, M. X nous apprend qu’il fabrique un pain bio et qu’il référence la minoterie Meichin et M. Y qui comme lui produit un pain bio ; à EDF, on sait qu’il a un profil de consommation P et a déménagé l’an dernier

1. Problématique - Contexte

Page 8: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Les travaux décrits aujourd’hui portent uniquement sur la réutilisation de données contenant du texte

Approche multi-métier : sociologues, « data-miners » et chargés d’étude marketing

Sources de données traitées :

Bases de capitalisation d’entretiens

Forums de discussion

Enquêtes de satisfaction

Absence d’hypothèse de départ…

Absence d’ontologie

1. Problématique – Périmètre de nos travaux

Page 9: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Etude souhaitée : « potentiel d’utilisation de la climatisation réversible auprès des clients d’EDF SA »

Deux analyses primaires

Ecrivains dont Arthur Rimbaud et Charles Baudelaire

Dixit, base de capitalisation d’entretiens construite par le Département d’études de la Branche Commerce

Signalétiques associées : date de naissance, type d’écrits, segment de marché, tarification ...

Stratégies et contextes d’analyse primaire : méthode de constitution des corpus, objectifs des analyses, commanditaires, dates…

• Ecrivains : méthode Benoît Habert, ATALA, Benoît Habert, février 2005

• Dixit : capitalisation d’enquêtes menées à la Branche Commerce, Jean Vidal, 2000 - 2004

1. Problématique – L’exemple de l’ATALA

Page 10: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Transformer

RDF

Dixit

Écrivains

Recherche Filtrage Exportation

Importation

Et

Annotation

Alceste

et

Temis

Structuration de données

Analyse et fouille de données complexes

TROIE

ACHILLES

Données Brutes Données Structurées

2. Architecture globale

Page 11: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

E : Vous choisiriez le gaz ?P : Oui, je pense. Si je devais faire une installation dans ma propre maison ce serait plutôt vers le gaz que je me dirigerais.E : A cause du coût ?P : Oui voilà.. A cause du coût et de la chaleur. La chaleur n’est pas la même. Peut-être que maintenant les installations sont plus performantes mais..E : En tout cas vous leur demanderiez : s’il n’y a pas une autre chaleur électrique ?P : Oui, j’essaierais de voir s’il n’y a pas une autre solution. Je vois qu’à la maison, en plein hiver les chauffages sont pratiquement mis à fond et on n’a pas l’impression d’avoir chaud. La maison est très bien isolée, ce n’est pas ça.. En plus on a une dalle chauffante, au rez-de-chaussée, qui est allumée en permanence et par rapport à ça, on arrive sans allumer les convecteurs à une température constante de 19°. Ce qui est bien. Dans la journée on éteint les convecteurs puisqu’il n’y a personne et la température de la dalle maintien un minimum de chaleur. C’est surtout sur ce point là que j’insisterais.E : Donc, si nouveau fournisseur, vous lui poseriez quoi, comme question ?P : Je leur demanderais de prouver, par A plus B, que la chaleur électrique est aussi performante que celle au gaz, au niveau confort.

$FILE: Intitule: Structure de l'offre destinée aux clients résidentielsf_DateFinEtude: 07/10/2001ReferenceMKM: STUDEO 13109valmeth: 1 Entretien individuel,2 Table ronde - Entretiens de groupevalmetbis: 1 Entretien individuelintext: Externedemographie: ParticuliersMarcheAff: ParticuliersMarcheseg: Particulierssexe1: femmesexbis: age1: 53agbis: csp: secrétaire de directioncspbis: nombre1: effectif1: stat: propiétairemaison: maisonchiffre_1: principalechauffage: gazenergie1: électricité,gaztarif1: basecodepostal1: 35740Doc_Type: Fiche signalétique d'entretienValeurMethod: Entretien individuellogtab: 1yn: Externesegment: Particuliers

export

3. Structuration : TROIE

Page 12: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

entretien_1_1

de type entretien

entretien_brut

/dixit1/data/entretien_brut1.xml

methodologie entretien_individuel

false

particuliers

interne_EDF

segment_de_marche

donnéesGeo36740

données personne

X

femme

sécretaire de direction

X

53

truetruetrue

données logement

donnéesEnergies

électricitégazbasegaz

données_geodonnées_socio

code_postal

données_logement

sexe

age fonctio

n

personnes_au_foyer

enfants_de_moins_de_15_ans

principale

maison

propriétaire

don

nées_energie

bag

_2

energies

_1

puissance

s_tarifs

chau

ffage

entretien_1_1

de type entretien

entretien_brut

/dixit1/data/entretien_brut1.xml/dixit1/data/entretien_brut1.xml

methodologie entretien_individuel

false

particuliers

interne_EDF

segment_de_marche

donnéesGeo3674036740

données personne

XX

femmefemme

sécretaire de directionsécretaire de direction

XX

5353

truetruetruetruetruetrue

données logementdonnées logement

donnéesEnergiesdonnéesEnergies

électricitéélectricitégazgazbasebasegazgaz

données_geodonnées_socio

code_postal

données_logement

sexe

age fonctio

n

personnes_au_foyer

enfants_de_moins_de_15_ans

principale

maison

propriétaire

don

nées_energie

bag

_2

energies

_1

puissance

s_tarifs

chau

ffage

3. Structuration : TROIE

Page 13: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

Analyste

TEMIS

ALCESTE

TEMIS

ALCESTE

Structuration

Analyse_1.rdf

Analyse_1.rdf

Je suis un analyste moderne

et j’utilise des logiciels d’ADT et

je lis FT

Production des résultats

Export vers des logiciels d’analyse, import des résultats et des interprétations

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdfAnalyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

3. Une journée dans la vie d’une étude… : ACHILLES

Page 14: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

3. Requêtage et filtrage

Page 15: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

3. Requêtage et filtrage

Page 16: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

3. Requêtage et filtrage

Page 17: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdfAnalyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

3. Requêtage et filtrage

Page 18: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

3. Requêtage et filtrage

Page 19: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

3. Requêtage et filtrage

Page 20: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

3. Requêtage et filtrage

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

Page 21: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

3. Requêtage et filtrage

Page 22: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

3. Requêtage et filtrage

Page 23: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

3. Requêtage et filtrage

Page 24: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

3. Requêtage et filtrage

Page 25: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

3. Requêtage et filtrage

Page 26: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Analyste

TEMIS

ALCESTE

Structuration

Analyse_1.rdf

Analyse_1.rdf

Analyse_1.rdf

Je suis un analyste moderne

et j’utilise des logiciels d’ADT et

je lis FT

Production des résultats

Export vers des logiciels d’analyse, import des résultats et des interprétations

3. export/import

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdfAnalyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

Page 27: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdfAnalyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

Analyste

TEMIS

ALCESTE

Structuration

Analyse_1.rdf

Analyse_1.rdf

Analyse_1.rdf

Je suis un analyste moderne

et j’utilise des logiciels d’ADT et

je lis FT

Production des résultats

Export vers des logiciels d’analyse, import des résultats et des interprétations

3. export/import

Page 28: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdfAnalyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

Analyste

TEMIS

ALCESTE

Structuration

Analyse_1.rdf

Analyse_1.rdf

Analyse_1.rdf

Je suis un analyste moderne

et j’utilise des logiciels d’ADT et

je lis FT

Production des résultats

Export vers des logiciels d’analyse, import des résultats et des interprétations

3. export/import

Page 29: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Analyste

TEMIS

ALCESTE

Structuration

Analyse_1.rdf

Analyse_1.rdf

Analyse_1.rdf

Je suis un analyste moderne

et j’utilise des logiciels d’ADT et

je lis FT

Production des résultats

Export vers des logiciels d’analyse, import des résultats et des interprétations

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdfAnalyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

3. export/import

Page 30: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Analyste

TEMIS

ALCESTE

Structuration

Analyse_1.rdf

Analyse_1.rdf

Analyse_1.rdf

Je suis un analyste moderne

et j’utilise des logiciels d’ADT et

je lis FT

Production des résultats

Export vers des logiciels d’analyse, import des résultats et des interprétations

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdfAnalyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

3. export/import

Page 31: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Analyste

TEMIS

ALCESTE

Structuration

Analyse_1.rdf

Analyse_1.rdf

Analyse_1.rdf

Je suis un analyste moderne

et j’utilise des logiciels d’ADT et

je lis FT

Production des résultats

Export vers des logiciels d’analyse, import des résultats et des interprétations

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

« chaleur »« froid »

(1)

Eventuellement, retour en arrière

Segment de marché = particuliers

Analyste

Je veux les documents ayant trait à la chaleur et au froid

Je veux uniquement les documents reprenant l’avis de particuliers

(2)

(1)

(2)

Validation

Analyse_1.rdfAnalyse_1.rdf

Benoit veut connaître le potentiel d’utilisation

de la climatisation réversible auprès des clients d’EDF SA….

Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.

3. export/import

Page 32: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Construction de deux prototypes s’appuyant sur XML/RDF

Un modèle conceptuel générique sous forme de triplets

Un langage logique facilitant le requêtage

Des exports plus aisés

Il reste quand même des améliorations à apporter !!!!

Interfaçage avec des bases de données afin de réduire les temps de chargement et de traitement

Passage à l’échelle réaliste

Amélioration de l’ergonomie des deux logiciels de manière à rendre l’utilisation d’XML transparente pour l’utilisateur final

Rendre l’architecture plus adaptée au travail collaboratif (partage des études, accès aux annotations de chacun, possibilité d’enrichir les interprétations)

Réflexion sur la normalisation sémantique des méta-données limitée actuellement à la syntaxe

4. Conclusion et perspectives

Page 33: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Construction de deux prototypes s’appuyant sur XML/RDF

Un modèle conceptuel générique sous forme de triplets

Un langage logique facilitant le requêtage

Des exports plus aisés

Il reste quand même des améliorations à apporter !!!!

Interfaçage avec des bases de données afin de réduire les temps de chargement et de traitement

Passage à l’échelle réaliste

Amélioration de l’ergonomie des deux logiciels de manière à rendre l’utilisation d’XML transparente pour l’utilisateur final

Rendre l’architecture plus adaptée au travail collaboratif (partage des études, accès aux annotations de chacun, possibilité d’enrichir les interprétations)

Réflexion sur la normalisation sémantique des méta-données limitée actuellement à la syntaxe

4. Conclusion et perspectives

Page 34: Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*, Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*

Vous pouvez reprendre une activité normale...

Et maintenant...

Remerciements chaleureux à

Brad Pitt

pour son inspiration de tous les instants !