19
1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribué pour la création de bases de connaissa pédagogiques sur le Web Gaëtan DUSSA Jean-Pierre PECUCH Laboratoire PSI, INSA de Rou {dussaux, pecuchet}@insa-rouen. http://ironweb.insa-rouen.

1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

Embed Size (px)

Citation preview

Page 1: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

1Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

IronWEB : Une architecture distribuéepour la création de bases de connaissances

pédagogiques sur le Web

Gaëtan DUSSAUXJean-Pierre PECUCHET

Laboratoire PSI, INSA de Rouen{dussaux, pecuchet}@insa-rouen.fr

http://ironweb.insa-rouen.fr

Page 2: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

2Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

Le potentiel du Web ...

• Des sources d’information– sites Web des écoles et universités– des laboratoires de recherche– pages perso– entreprises, organismes, assoc– …

• les problèmes rencontrés– donner accès à cette information– qualifier l’information pertinente

Page 3: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

3Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

Des sources d’information

• sites Web des écoles et universités

• des laboratoires de recherche• pages perso• entreprises, organismes, assoc• …

Page 4: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

4Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

les problèmes rencontrés

• donner accès à cette information• qualifier l’information pertinente

Page 5: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

5Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

Quelques constats

• Limite des outils de recherche– indexation automatique

• caractère automatique• résultats bruités

– indexation manuelle• information pertinente• information trop générale et silence

– métamoteurs ou agents intelligents• interrogation de plusieurs outils• adaptation au moins puissant

Page 6: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

6Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

L’objectif d’IronWEB

• Fournir aux étudiants des "moteurs de recherche" spécialisés dans leur domaine

• Construction automatique de ces moteurs de recherche

• exploiter, factoriser, utiliser les différentes expériences de navigation des enseignants

Page 7: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

7Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

IronWEB - côté enseignant (1/2)

• Un serveur de signets– valeur ajoutée pour l’enseignant

(usage nomade de ses signets)– création d’une base de

connaissances avec ces signets, qui sont des pages pertinentes

– catégorisation des signets en fonction du département de l’enseignant

Page 8: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

8Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

IronWEB - côté enseignant (2/2)

• Une base de connaissances construite automatiquement– indexation du contenu des pages

pointées par les signets (algorithme de Lamrous)

– regroupement des différentes arborescence de signets

– une base de cas avec les histoires des découvertes des pages pertinentes

Page 9: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

9Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

IronWEB - côté étudiant

• Des moteurs de recherche spécialisés pour chaque département– Un moteur de recherche par mots

clés• à partir de l’indexation plein texte

– un annuaire• navigation dans les arborescences de

signets des enseignants regroupées

– Une aide à la recherche• exploitation de la base de cas

Page 10: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

10Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

Architecture à l’INSA de Rouen

Servlets

ServeurWEB

Serveur d’ObjetsDistribués

RMI

Index

Moteurd’Indexation

Méthode des Barycentres

RMI

Gestionnairede Connexions

CORBA

ProxyAuthentification

Gestionnairede Connexions

CORBA

ProxyAuthentification

Gestionnairede Connexions

CORBA

ProxyAuthentification

Gestionnairede Connexions

CORBA

ProxyAuthentification

Gestionnairede Connexions

CORBA

ProxyAuthentification

Signets

Les bases de connaissances

CFI

ASI

MECA

GM

EPEnseignants

CFI

ASI

MECA

GM

EP

Etudiants

+ Enseignants

à l’I NSA de Rouen

Base de Cas Index

Signets

Base de Cas Index

Signets

Base de Cas Index

Signets

Base de Cas Index

Signets

Base de Cas Index

Page 11: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

11Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

Choix technologiques (1/3)

• 100% JAVA• Une architecture distribuée

– RMI– CORBA

• Un serveur WEB– Apache + Jserv– Servlets

Page 12: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

12Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

Choix technologiques (2/3)

• Un SGBD - JDBC– Oracle– Bientôt PostgreSQL (Linux) - Gratuit

• Gestion et consultation des bookmarks– Par applet– Bientôt une version javascript plus

légère pour la consultation

Page 13: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

13Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

Choix technologiques (3/3)

• L’algorithme d’indexation

CorbaRMI

the

f(27)

f(31)

Zone de pertinence

Déc

rois

sanc

e de

la p

erti

nenc

e

A Detailed Comparison of CORBA, DCOM and J ava/RMIhttp:/ /www.execpc.com/~gopalan/misc/compare.html

Nombre de mots : 5 994Nombre de mots diff érents : 1 068

Occurrences la plus élevée : 411

Page 14: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

14Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

Capture d’écran - côté enseignant

Alimentation en ligne à l’aide d’une bookmarklet

Importation de signets existants

Page 15: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

15Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

Capture d’écran - côté enseignant

Applet de consultation / organisation des signets

Page 16: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

16Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

Capture d’écran - côté étudiant

• Le moteur de recherche

Page 17: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

17Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

Capture d’écran - côté étudiant

• L’annuaire

Page 18: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

18Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

Perspectives

• Court terme– Finir expérimentation dép GM

• Implémenter la base de cas• S’affranchir d’Oracle et Windows au

profit de PostgreSQL et Linux

– Etendre à l’INSA Rouen

• Long terme– interconnecter tous les INSA

Page 19: 1 Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB IronWEB : Une architecture distribuée pour la création de bases de connaissances pédagogiques

19Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB

Architecture IronWeb distribué

Les bases de connaissances

Signets

Hiérarchies

I ndex

Base de cas

Servlets

ServeurWEB

Serveur d’ObjetsDistribués

RMI

Moteurd’Indexation

Méthode des Barycentres

RMI

Pro

xys

CFIEP

GMMECA

ASIEnseignants

CFIEP

GMMECA

ASIEtudiants

Les bases de connaissances

Signets

Hiérarchies

I ndex

Base de cas

Servlets

ServeurWEB

Serveur d’ObjetsDistribués

RMI

Moteurd’Indexation

Méthode des Barycentres

RMI

Pro

xys

ESCGCU

GEGMA

GPI

ESCGCU

GEGMA

GPI

Enseignants

Etudiants

Les bases de connaissances

Signets

Hiérarchies

I ndex

Base de cas

Servlets

ServeurWEB

Serveur d’ObjetsDistribués

RMI

Moteurd’Indexation

Méthode des Barycentres

RMI

Pro

xysGBAGCUGEI

GMMGMGP

GPI

Enseignants

GBAGCUGEI

GMMGMGP

GPI

Etudiants

Les bases de connaissances

Signets

Hiérarchies

I ndex

Base de cas

Servlets

ServeurWEB

Serveur d’ObjetsDistribués

RMI

Moteurd’Indexation

Méthode des Barycentres

RMI

Pro

xys

BGEE

GPTSUGCUGMC

IGEGM

GMDSGM

Enseignants

BGEE

GPTSUGCUGMC

IGEGM

GMDSGM

Etudiants

Métamoteur GCU Métamoteur GM

fusion des signets fusion des index fusion des arborescences fusion des bases de cas----------------------------------------------------------------- description des moteurs en XML fusion = élimination des doublons + classement moteurs homogènes donc fusion cohérente