24
Projet ORI-OAI Outil de Référencement et d’Indexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Embed Size (px)

Citation preview

Page 1: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Projet ORI-OAIOutil de Référencement et d’IndexationRéseau de portails OAI

Réunion techniqueParis, 20 et 21 juin 2007

Page 2: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 2

Fonctionnalités de la version 2 (et autres …)Fonctionnalités de la version 2 (et autres …)

A étudier rapidement pour éventuelle mise en place en V2

Poids pour la V2: plus fort au plus faible

On est capable, mais à voir selon les besoins

Pas dans la V2 car pas mûr à ce jour

Page 3: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 3

Moteur de workflow: ori-oai-workflow

Workflow-spring Formulaire spécifique aux versions/relations LOM

(et autres formats ?). Idée de METS / FRBR ? Gestion de plusieurs fiches de MD. Ex: une fiche

TEF initialise une fiche LOM avec les champs communs, et ensuite il faut compléter les critères pédagogiques

Dépôt et saisie des droits sur les ressources (WebDAV)

Droits informés dans les MD (METS ?) Côté ORI-OAI :

étude/modifications/documentation d'un protocole de communication avec Moodle, Scenari, Hal, Chainedit, Claroline, et autres ... (suivant les besoins exprimés) WS du frontal

Page 4: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 4

Moteur de workflow: ori-oai-workflow

Workflow-spring Migration des fiches de MD dans un autre format /

Possibilité de décliner la description d'une même ressource en plusieurs formats. Ex: passer de LOM à LOM-fr quand il sera disponible

Interface d’administration des utilisateurs, rôles, permissions. On ne gère que les membres des rôles

Faire de la recherche de fiches depuis le Workflow Suivant la faisabilité : intégration du workflow dans l'IHM

du Search ( un seul et même outil ...) Plus d'ergonomie, plus rapide car basé sur un index, tri, etc. Intégration technique, technologies différentes

Page 5: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 5

Moteur de workflow: ori-oai-workflow

Workflow-spring Plusieurs modèles de templates par format

Au moment de la création d’une fiche, on choisit ou non un de ces templates

Support d’un LDAP autre que supann (AD par ex.)

Dans la partie profil, ajouter des propriétés Langue par défaut de tous les champs Le champ auteur est rempli automatiquement car identifié Etc. à spécifier clairement

Afficher en parallèle le formulaire et le rendu de cette fiche de MD

Ajout de conditions et fonctions suivant les besoins exprimés

Page 6: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 6

Moteur de workflow: ori-oai-workflow

MD-editor Amélioration de la signalisation des erreurs Amélioration des champs obligatoires Quand champs répétables, ne pas proposer un

champ déjà sélectionné. Ex.: la langue: ne pas montrer “français” si déjà sélectionné

Auto-complétion (modifier widget créé par Orbéon ?)

Défilement sans se limiter à 10 Sélection avec la souris dans la liste

Page 7: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 7

Moteur de workflow: ori-oai-workflow

MD-editor LOM-fr (suivant sa disponibilité) Déclinaison des Xforms LOM en lom-bib et autres

lom-bib: tout le LOM avec des “plier-déplier” Nouveaux formats supportés suivant les

demandes du groupe fonctionnel Autre financement ?

Classification UNIT limitée à 2 niveaux Ne la limiter à aucun nombre de niveaux

Traduction des mots en auto-complétion

Page 8: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 8

Indexeur: ori-oai-indexing

Généraliser à Spring Indexation plein texte

PDF, PPT, DOC, etc. Problème des documents non publics

Crawler web (ou établissement fournit son plein texte) Trouver le bon lien vers le document visé Crawler intelligent

Définir plusieurs cas d’utilisation et de paramétrage (en fonction de l’entrepôt)

Est-ce que l’on indexe que les documents locaux en plein texte ou aussi les moissonnés ?

Renforcer la disponibilité du module indexing Se rendre indépendant des autres modules: mettre les

fiches aussi dans le module ?

Page 9: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 9

Indexeur: ori-oai-indexing

Indexation des documents en différentes langues Utilisation d’un Analyzer à la fois Comment

indexer en anglais les documents en ? indexer en français les documents fr ?

Configuration des noms de MD encodés dans liusConfig.xml Ou on enlève de la config et le module calcule lui-même le

nom de MD Ou on a une interface graphique

Répartir les accès à l’index pour la montée en charge

Highlighting sur MD Highlighting sur document

Page 10: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 10

Indexeur: ori-oai-indexing

Voir pour l’analyzer à utiliser Veut-on un analyzer qui retrouve « cheval » alors

qu’on a cherché sur « chevaux » ? Gestion de plusieurs indexes: le search dit

quel index il veut utiliser Ex: Gestion des langues: 1 index par langue et

repository ou workflow envoie la fiche et dit dans quelle langue elle est

On peut gérer plusieurs indexes, les sauvegarder indépendamment pour les refusionner en cas de problème

Page 11: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 11

Indexeur: ori-oai-indexing

Remarques fonctionnelles: Indexation en texte intégral

Problèmes Lien vers la ressource disséminé dans une fiche de présentation

dans l’établissement PDF protégé non « indexable » PDF qui a des liens vers d’autres PDF Pas de droits en lecture

Solution peu évidente à étudier L’entrepôt OAI fournit en plus de la fiche de MD l’index plein

texte Permettrait de gérer les documents protégés Mettre en place un protocole d’échange TOUS les entrepôts OAI doivent être modifiés

Un index sur les MD et un index sur texte intégral ou fusion des 2 ?

Page 12: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 12

Entrepôt OAI: ori-oai-repository

Requêtes Lucene diverses pour paramétrer les fiches à exposer en OAI

Documenter comment limiter des entrepôts à certains moissonneurs Filtrage IP Authentification

Interface d’administration

Page 13: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 13

Moissonneur OAI: ori-oai-harvesting

Documenter comment protéger l’interface d’administration

Amélioration de l’interface d’administration Gérer ou bien documenter le bouton

« rafraîchir » Date à mettre à zéro lors de suppression d’une

récolte Spécifications à spécifier par les

spécificateurs

Page 14: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 14

Moteur de recherche: ori-oai-search

Traduction des fichiers de messages RSS Problème de référencement dans Google

Enlever le jsessionid La première page est un forward

Créer le client XFire avec Spring et donner en paramètre l’URL du WS avec « ?WSDL »

Personnalisation des interfaces de recherche en portlet

Boutons radio, cases à cocher, etc. Autre mode de recherche thématique

(cases à cocher)

Page 15: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 15

Moteur de recherche: ori-oai-search

Internationalisation des champs de recherche Ex: si on est en mode « en », on cherche sur le titre

LOM en anglais, et on affiche le titre anglais Rebond sur une nouvelle recherche par clic

sur un champ de résultat Montrer la requête dans la page de résultats

de la recherche avancée Enregistrement des recherches en portlet Internationalisation en portlet Highlighting sur MD

Voir les champs à afficher de cette façon

Page 16: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 16

Moteur de recherche: ori-oai-search

Désactiver la remontée à la racine dans la recherche thématique dans certains cas quand on arrive dans la rech. Thématique depuis rebond d’une fiche de MD

Garder à court terme (session) les requêtes jouées pour les rejouer rapidement

Highlighting sur document Dans les résultats, quand on passe la souris sur un

nom d’auteur, afficher dans une bulle le rôle de cette personne dans la fiche LOM

Version PDF de la fiche imprimable Ajouter une config pour masquer des branches de

vocabulaires

Page 17: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 17

Moteur de recherche: ori-oai-search

Opérateur booléen (à expliquer à Yohan !!!!!), etc. Ne proposer que les valeurs réellement indexées

dans les listes déroulantes de la recherche avancée Post-catégorisation des résultats

Affine les résultats Utiliser l’approximation (utilisation du ~ de Lucene)

Ou proposer comme Google les résultats plus retrouvés. Ex. je cherche chereux, le moteur de recherche me propose de plutôt prendre cheveux

Connexion et vision uniquement des documents auxquels j’ai droit

Interface d’administration ?

Page 18: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 18

Gestionnaire de vocabulaires: ori-oai-vocabulary

VDEX (plat, hiérarchique) Optimiser le chargement de gros

vocabulaires Certains sont chargés au lancement du module et

sont cachés même après redémarrage. Ex: on ne recharge le vocabulaire LDAP que tous les 2 mois; etc.

Contrainte si le vocabulaire lance la génération depuis indexing au démarrage: indexing doit être lancé avant vocabulary

Proposer une solution d’éditeurs de vocabulaires locaux. Ex: XXE

Support du multilingue pour les vocabulaires récupérés via le moteur d'indexation

Page 19: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 19

Gestionnaire de vocabulaires: ori-oai-vocabulary

Fonctionnalités globales Nouveaux référentiels suivant les nouveaux

formats supportés et besoins exprimés (Harpege ? Thésaurus de mots-clés ? etc.)

Interface d’administration générale

Page 20: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 20

Serveur de stockage: ESUP-serveur-WebDAV

Consolidation du serveur Docs, tests, etc.

Amélioration des procédures d’installation Interface d’administration

Espaces persos Espaces spécifiques Groupes Règles de définition des groupes shibboleth

Possibilité de brancher les groupes LDAP par simple config

Passage à supann 2 Version quick-start

Page 21: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 21

Généralités

Identifiants uniques Système ARK ? On référence une URL sous forme d’identifiant

unique Ex. ARK:http://foobar.zaf.org/ark:/12025/654xz321/s3/f8.05v.tiff\_______________/ \__/ \____/ \______/ \_________/

URL d’accès au document pérenne On référence une URL pérenne qui « pointe » vers

un document WebDAV ou autre Au moment du dépôt de la ressource, on fait le lien entre

l’URL pérenne et notre document WebDAV ou externe On peut lancer des routines toutes les nuits pour identifier

les liens morts Lors d’un renommage du document depuis le worflow, on

met à jour la correspondance entre l’URL pérenne et le lien réel

FRBR et EAP

Page 22: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 22

Généralités

Mise à jour du site ori-oai-commons

Avec docs d’infos sur architecture, install globale ORI-OAI, doc. de Gilles, FAQ

Documenter comment protéger les accès à tous les WS

Cache intelligent sur tous les modules: si l’information distante n’est pas dispo, on garde le cache même expiré

Amélioration du packaging Uniformiser: incohérence entre les modules dans

Targets de déploiement ANT (deploy, all, all-servlet, …) Chemins deploy.home

Page 23: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 23

Généralités

Statistiques De recherche

Côté ori-oai-search ? D’accès aux documents

Côté ESUP-serveur-WebDAV ou gestionnaire d’URL pérennes D’accès à l’application

Tous les modules ?

Gestion des commentaires pédagogiques dans le LOM Annotation des MD et des documents personnels et

partagés (plugin Firefox annozilla ? ) Gérer des références bibliographiques et les partager

Je crée ma liste que je diffuse avec informations et commentaires sur la ressource et la liste

Page 24: Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Réunion technique Paris, 20 et 21 juin 2007

Paris, 20 et 21 juin 2007 Réunion technique 24

Généralités

Favoris TOP 10 des ressources les plus demandées Enregistrer des propres favoris

Rendu cocoon inJAC JCR / Jackrabbit Connexion avec LMS

Moodle, etc. Projet CEPIA ?