13
Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes sur la recherche en linguistique dans l’Ouest

Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes

Embed Size (px)

Citation preview

Page 1: Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes

Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie

Une plate-forme logicielle dédiée à la cartographie de corpus

Journées portes ouvertes sur la recherche en linguistique dans l’Ouest

Page 2: Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes

Équipe ISLanD – Laboratoire GREYC – Université de Caen 2

Problématique de recherche

Fournir des aides personnalisées à la lecture rapide Cartographie de corpus Catégorisation d’ensembles de textes

Cadre d’étude Ressources lexicales Texte, intertexte, corpus Parcours interprétatifs

Comment fournir aux utilisateurs des vues « pertinentes » sur un corpus de textes ?

Page 3: Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes

Équipe ISLanD – Laboratoire GREYC – Université de Caen 3

Page 4: Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes

Équipe ISLanD – Laboratoire GREYC – Université de Caen 4

Corpus de textes

Page 5: Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes

Équipe ISLanD – Laboratoire GREYC – Université de Caen 5

Ensembles de lexies

Outil ThemeEditor

Page 6: Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes

Équipe ISLanD – Laboratoire GREYC – Université de Caen 6

Dispositifs Lucia

Outil LuciaBuilder

Page 7: Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes

Équipe ISLanD – Laboratoire GREYC – Université de Caen 7

Carte mettant en évidence des groupes de textes

Carte mettant en évidence les textes du corpus

Page 8: Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes

Équipe ISLanD – Laboratoire GREYC – Université de Caen 8

Carte mettant en évidence les textes du corpus

Page 9: Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes

Équipe ISLanD – Laboratoire GREYC – Université de Caen 9

Carte mettant en évidence des groupes de textes

Page 10: Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes

Équipe ISLanD – Laboratoire GREYC – Université de Caen 10

Plate-forme ProxiDocs

Cartographie et catégorisation de corpus de textes ;

Interactive et centrée utilisateur ; Traitements statistiques :

ACP, CHA, KMeans, etc. Java, SVG, Open-source,

http://www.info.unicaen.fr/~troy/proxidocs

Page 11: Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes

Équipe ISLanD – Laboratoire GREYC – Université de Caen 11

ProxiDocs, c’est aussi...

Cartographie interactive en 3 dimensions

Cartographie dynamique prenant en considération la dimension temporelle des textes du corpus Approche diachronique

Cartographie des pages retournées par des moteurs de recherche Aide à la constitution de corpus provenant du Web Analyses d’ensembles de pages Web

Page 12: Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes

Équipe ISLanD – Laboratoire GREYC – Université de Caen 12

Utilisations actuelles de la plate-forme ProxiDocs

Analyse thématique d’ensembles de documents électroniques

Observation et étude de métaphores conceptuelles (Projet IsoMeta)

Analyse terminologique d’articles scientifiques médicaux (Projet CISMeF)

Page 13: Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes

Équipe ISLanD – Laboratoire GREYC – Université de Caen 13

Merci de votre attention

Pour plus d’information :

Sur ProxiDocs :

http://www.info.unicaen.fr/~troy/proxidocs

Sur les logiciels de l’équipe ISLanD :

http://www.greyc.unicaen.fr/island/logiciel/