Transcript
Page 1: Visibilité et web de données

Visibilité et web de donnéesRéflexions autour du projet

Agnès SimonSébastien Peyrard

Bibliothèque nationale de France

SemWeb.pro 2014

Page 2: Visibilité et web de données

Connaissez-vous data.bnf.fr ?

Page 3: Visibilité et web de données

Enjeu

Des contenus à valeur ajoutéeque la BnF souhaite diffuser sur le web.

180 000 visites/mois (octobre 2014)

Page 4: Visibilité et web de données

Référencement naturel

Des pages HTML Des URI stables et pérennes Un peu de sémantique

<div itemscope="itemscope" itemtype="http://schema.org/Book" xmlns:v="http://rdf.data-vocabulary.org/#" typeof="v:Work"><div class="ctxtoolbar"></div><h1><strong><span itemprop="name">L'attaque du moulin</span>

Page 5: Visibilité et web de données

Le web sémantique dans tout ça ?

Organiser la masse

Développer les liens, en interne et avec l'extérieur

Page 6: Visibilité et web de données

Organiser la masse

Toutes les contributions d'un même auteur Toutes les éditions d'une même oeuvre

http://data.bnf.fr/ark:/12148/cb13893514m

http://data.bnf.fr/ark:/12148/cb13911746t

Edition

Auteur

Oeuvre

Page 7: Visibilité et web de données

Alignements et clustering

Page 8: Visibilité et web de données

Alignements et clustering : travaux en cours

Alignement simple Bibliothèque Nazca « Commence par » et

lien auteur

Perspectives : Alignements avancés :

algorithmes prédictifs (nuages de mots)

Clustering : algorithmes Minhashing, Meanshift

Page 9: Visibilité et web de données

Créer des liens, créer des services

« Auteurs nés en 1515 »

Page 10: Visibilité et web de données

Développer les liens

Des liens vers le web …et les institutions

culturelles

Politique d’identifiants (ISNI)

Favoriser la réutilisation des données

Page 11: Visibilité et web de données

Merci de votre attention

agnes[POINT]simon[at]bnf.frsebastien[POINT]peyrard[at]bnf.fr


Recommended