Upload
jean-delahousse
View
2.331
Download
0
Embed Size (px)
DESCRIPTION
La présentation positionne schema.org dans l'historique des langages et modeles utilises pour le balisage de page web. On s'interesse ensuite a la mise en oeuvre de fonctionnalites de plus en plus "semantique" de la part des moteurs de recherche, et a l'echange entre les moteurs qui offrent une meilleure visibilite aux contenus les mieux balisés. On détaille ensuite le modele Schema.org et a quoi ressemble le balisage en microdata. On montre que le travail fait pour avoir un meilleur referencement web, peut egalement etre utilisé pour avoir des fonctionnalités de recherche plus avancées dans l'intranet.
Citation preview
jean-delahousse.net
Schema.org
Jean Delahoussehttp://jean-delahousse.net
Introduction à Schema.org ou le SEO par la sémantique
jean-delahousse.net
Balisage des pages web : historiqueLangages et Modèles
• 1989 : HTML (W3C) – Métadonnées html
• 2005 : Microformats (CommerceNet)– hCalendar, hCard, hNews, hAtom…
• 2008 : RDFa (W3C)– Ontologies du sémantic web : foaf, DublinCore…
• 2010 : Open Graph (Facebook)
• 2010 : HTML5/Microdata (W3C)
jean-delahousse.net
Des moteurs de plus en plus sémantiques
jean-delahousse.net
Des moteurs de plus en plus sémantiques
jean-delahousse.net
Juin 2011: création d’une modélisation commune pour le contenu des pages web
Un modèle adapté aux langages de balisage Microdata et RDFa
“Schema.org est une collaboration entre Bing, Google, Yahoo! Et Yandex pour faciliter la tâche des webmaster quand ils nous procure des données qui nous permettent de mieux diriger les utilisateurs vers leurs sites.” http://schema.org/docs/faq.html
Schema.org
jean-delahousse.net
RichSnippets for banana bread
jean-delahousse.net
RichSnippets for banana bread
jean-delahousse.net
Rich Snippets Testing Tool
jean-delahousse.net
Acheter un vélo et comparer les prix
jean-delahousse.net
http://schema.org/docs/full.htmlThe type hierarchy schema : extrait
jean-delahousse.net
Les attributs et relations pour Person
jean-delahousse.net
Exemple de balisage microdata
jean-delahousse.net
L’échange
• Les moteurs demandent aux entreprises plus de données structurées, plus de connaissances réutilisables par des systèmes automatisés
• En échange ils offrent aux entreprises – une meilleure visibilité de leurs contenus par le
RichSnippets– une prise en compte des contenus dans les
filtrages à facettes
jean-delahousse.net
Mise en place : méthode
Modèles de balisage adaptés aux contenus
de l’entreprise
Choix de vocabulaires contrôlés adaptés
lieux, sociétés, personnalités…
Traitement de balisage des pages webBases de données
Contenus
Alignement des modèles
Text MiningExtraction Personnes, lieux, produits..
pour enrichir le balisage
jean-delahousse.net
Mise en placeretraiter le stock de contenus
Réutilisation du balisage existant
métadonnées, codes xiti, fil d’ariane, microformats
Bases de données
ContenusText Mining
Enrichissement balisage
Personnes, lieux, produits..
Archives
jean-delahousse.net
Schema.org pour l’intranet• Construire des fonctions de recherche avancées dans les sites
web ou l’intranet : recherche à facette, index des sujets… en s’appuyant sur le balisage microdata / schema.org
Bases de données
Contenus
Page dans l’intranet Moteur de recherche intranet
Balisage de la page
jean-delahousse.net
Etendre le modèle en fonction de ses besoins
• Un mécanisme d’extension permet d’enrichir les classes et propriétés présentes dans Schema.org pour construire un schéma tenant compte des spécificités de l’organisation
• Etendre une classe : Person– Person/Engineer
• Etendre la propriété : musicGroupMember– musicGroupMember/leadVocalist – musicGroupMember/leadGuitar
jean-delahousse.net
Bases de données
Schema.org et Open Dataun exemple : data.bnf.fr
Traitements de publicationMulti-canalBases de
données
Contenus
Données structurées
RDF
HTML + microdata
Contenus
jean-delahousse.net
Vie de Schema.org
• Un groupe de travail dirigé par Dan Brickley pour l’évolution de Schema.org
• Des propositions d’évolutions provenant de différentes communautés– http://
www.w3.org/wiki/WebSchemas/SchemaDotOrgProposals
• Une mailing list de discussion– http://lists.w3.org/Archives/Public/public-vocabs/
• Des outils de test du balisage – http://www.google.com/webmasters/tools/richsnippets
jean-delahousse.net
Une ligne directrice pour les évolutions
• Objectif : Structurer les pages web pour améliorer la recherche
• La question n’est pas : comment décrire une voiture ? Mais comment je peux améliorer le balisage de pages qui parlent de voitures
• Simplifier le travail des webmasters et éditeurs
• Avoir un consensus entre les moteurs de recherche
Un seul objectif final : des services de recherche plus efficaces
jean-delahousse.net
Exercice
Faire une page web décrivant en microdata et en s’appuyant sur la modélisation Schema.org un événement :
« Le débat télévisé, sur Antenne2, entre F. Hollande, membre du PS et N. Sarkosi, membre de l’UMP, le 2/5/2012 »
jean-delahousse.net
Sur l’auteur
KnowledgeConsult vous accompagne dans la définition et la mise en place de votre stratégie de
gestion des connaissances, travail collaboratif, gestion et diffusion de
contenus et données.KnowledgeConsult.com
Jean Delahousse, Directeur Associé chez KnowledgeConsult, est un expert des architectures de gestion et publication des contenus et des données, du web sémantique et de l’open-data.Il conseille les entreprises, média, éditeurs, administrations et centres de recherche pour construire et mettre en œuvre leur stratégie de valorisation des contenus et données. Mail : jean.delahousse dot knowledgeconsult.comBlog : jean-delahousse.net
Tweeter : @jdelahousse