34
Recherche universelle et web sémantique Ou la quête d'une meilleure visibilité... 7 juin 2011 Laurent Bourrelly – Olivier Tassel

Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Embed Size (px)

DESCRIPTION

Quelle est l’importance de l’influence des recommandations pour vos listings de recherche universelle ? Comment pouvez-vous réussir à mettre ces recommandations en application pour vendre de bons listings et quelles plates-formes devez-vous connaître ? Comment la recherche sémantique et les bouts de codes modifient-ils le comportement des utilisateurs ? Cette séance vous apportera toutes les réponses. Par Laurent Bourrelly et Olivier Tassel - le juin 2011 à SMX Paris.

Citation preview

Page 1: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Recherche universelle et web sémantique Ou la quête d'une meilleure visibilité...

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 2: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Parmi les 10 résultats de la 1ère page (et parfois les autres), un mélange de résultats co-existent. Ils sont issus de plusieurs canaux internes au moteur (Images, Actualités, Maps, Real Time, Vidéo, etc.).

Recherche Universelle

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 3: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Web sémantique

Ne pas confondre avec la recherche sémantique.

Standards qui formalisent des informations, permettant un traitement automatique.

Organisme de standardisation : World Wide Web Consortium (W3C)

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 4: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

MicroFormats

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Permettre le traitement automatique des données reconnaissables par les humains.

Les microformats sont des petits modèles de code HTML pour représenter des choses communément publiées comme des personnes, des événements, des billets de blog, des critiques et des mots-clés dans les pages Web. Source : microformats.org

Page 5: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Organisation des microformats

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Mouvement libre et spontané. CommerceNet met un peu d’ordre. Wiki ouvert à tous. Pas de standards stricts.

Page 6: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Vraiment si libre et ouvert ?

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Source : http://microformats.org/wiki/rel-nofollow

Page 7: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Un peu d'histoire

7 juin 2011 Laurent Bourrelly – Olivier Tassel

2003 : rel= ‘friend’ par Tantek 2004 : Real World Semantics hCard et hCalendar 2005 : microformats.org (CommerceNet) OpenID rel= ‘nofollow’ 2006 : +++ de microformats (OAuth) Spécification GRDDL 2008 : SearchMonkey (Yahoo!) 2009 : Google ‘Rich Snippets’

Page 8: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Principales Onebox actives sur Google.fr

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 9: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Qu'est-ce qu'une Onebox ?

Résultat(s) supplémentaire(s) ajouté(s) par Google aux résultats de recherche classique

Ces Onebox sont présentes de manière arbitraire par Google en fonction du mot clé recherché et de critères non communiqués...

Il peut y avoir plusieurs Onebox au sein d'une même page de résultats.

Les Onebox permettent d'offrir une visibilité nettement accrue à des sites positionnés même au delà de la 1ère page dans le cadre des résultats classiques.

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 10: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Google Onebox Images Sitemap Images

Optimisation « on-page »

Attribut Alt de la balise <img>

Nom du fichier image

Contexte sémantique

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 11: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Sitemap Vidéos

Optimisation « on-page »

<title> de la page de lecture

Contexte sémantique

Remarques Plus de chances d'être visible via une plateforme (Youtube,...) qu'un hébergement en direct. Alternative au sitemap : code source formaté via mRSS, Facebook Share, RDFa

Google Onebox Vidéos

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 12: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Sitemap Actualités

Remarque Tous les sites ne peuvent prétendre à apparaître dans Google Actualités (et donc dans cette onebox). L'astuce consiste donc à passer par des sites de Communiqués de presse présent dans Google

Actualités

Google Onebox Actualités

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 13: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Google Onebox Définitions Il serait légitime de penser qu'un code source avec les balises Html dédiées (<dd>, <dt>,...) permet d'avoir les prérequis à l'insertion de son site dans cette Onebox mais de nombreux exemples contredisent ce point.

L'élément récurrent à la présence d'un site dans cette Onebox est constitué par l'URL qui contient le mot clé « glossaire » ou encore « lexique ».

Wikipedia occupe la plupart du temps cette Onebox

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 14: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

ou

Google Localbox

(Type Rich Snippet)

Malgré l'existence d'un balisage de code source de type microformats, les sites présents dans cette Onebox sont dû fait de leur inscription dans Google Adresses.

Outre le respect des consignes d'inscription dans Google Adresses, le nombre et la note des avis relatifs à sa page Adresse joue un rôle primordial !

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 15: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Google Onebox Shopping Il existe également un balisage de code de type microformats mais il semble que l'intégralité des sites listés dans cette Onebox proviennent de la soumission du fichier XML listant les caractéristiques de ses produits (Google Merchant Center) à Google

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 16: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Principales Rich Snippets actifs sur Google.fr

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 17: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Qu'est-ce que les Rich Snippets ? Possibilité de passer d'un format de résultat classique :

A un format de résultat enrichi grâce à un balisage spécifique du code source et permettant de disposer d'une meilleure visibilité :

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 18: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Avis

Personnes

Entreprises et Organisations

Recettes

Évènements

Fils d'Ariane

Types de données supportés par Google

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 19: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Les microdonnées

RDFa

Formats de données supportés par Google

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 20: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Les propriétés

Le balisage du code source (microformats)

Google Rich Snippets : avis simple

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 21: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Les propriétés

Le balisage du code source (microformats)

Google Rich Snippets : avis globaux

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 22: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Les propriétés

Google Rich Snippets : personnes

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 23: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Le balisage du code source (microformats)

Google Rich Snippets : personnes

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 24: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Les propriétés

Google Rich Snippets : évènements

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 25: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Le balisage du code source (microformats)

Google Rich Snippets : évènements

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 26: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Les propriétés

Google Rich Snippets : recettes

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 27: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Le balisage du code source (microformats)

Google Rich Snippets : recettes

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 28: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Les propriétés

Le balisage du code source (RDFa)

Google Rich Snippets : fils d'ariane

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 29: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Google Rich Snippets : social search Dans un avenir proche :-)

Une réponse face à l'intégration de Facebook dans les SERP de Bing...

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 30: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Schema.org : un nouveau protocole basé sur les microdonnées

Entente entre les 3 principaux moteurs de recherche (Google, Bing et Yahoo!) à l'image du site sitemaps.org

L'objectif est de :

n  Faciliter la vie des webmasters dans leur façon de structurer les données n  Permettre aux moteurs de recherche d'aller encore plus loin dans la compréhension des données présentes sur les sites web n  Offrir aux internautes une meilleure expérience utilisateur

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Page 31: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Schema.org : types de données

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Œuvres : livres, films, enregistrements audio, recettes, séries télé, ...

Éléments non textuels embarqués : audio, image, vidéo, ...

Évènements

Organisations

Personnes

Les lieux, restaurants, commerces

Produits, services

Avis

Au total, plus de 300 types de données sont gérés par le protocole schema.org !

Page 32: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

7 juin 2011 Laurent Bourrelly – Olivier Tassel

Schema.org : FAQ

J'ai déjà formaté / Je m'apprête à formater les données de mon site via le protocole Microformats / RDFa / Microdonnées, dois-je appliquer dès maintenant les consignes de Schema.org ?

n  A notre sens, non...Ce protocole n'est encore qu'à l'état de brouillon (version 0.9 à ce jour) et nous avons peu de visibilité sur l'implémentation de Schema.org dans les moteurs de recherche (et encore moins sur leur version francophone!)

Les microformats / RDFa,... seront-ils encore supportés par Google ?

n  Le site schema.org indique que ces formats seront encore supportés par les moteurs. Cependant, nous vous conseillons de démarrer un veille active sur le sujet car, en toute logique, ce nouveau protocole permettra de bénéficier des dernières avancées en matière de visibilité.

Page 33: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Comprendre et suivre

7 juin 2011 Laurent Bourrelly – Olivier Tassel

OUTILS Site officiel sur les microformats : http://microformats.org/ MicroFormats Events http://microformats.org/wiki/events IRC http://microformats.org/wiki/irc hCard Creator http://microformats.org/code/hcard/creator hCalendar Creator http://microformats.org/code/hcalendar/creator XFN Creator http://gmpg.org/xfn/creator hReview Creator http://microformats.org/code/hreview/creator MicroFormats Transformer Optimus http://microformatique.com/optimus/ Outil Google de test des extraits enrichis http://www.google.com/webmasters/tools/richsnippets Extension Firefox Operator https://addons.mozilla.org/fr/firefox/addon/operator/ Extensions Wordpress http://wordpress.org/extend/plugins/tags/microformats Extension hCard et hCalendar pour Joomla http://extensions.joomla.org/extensions/contacts-and-feedback/contact-details/13339 http://extensions.joomla.org/extensions/calendars-a-events/events/events-calendars/13581

RESSOURCES Section d’aide Google pour les extraits enrichis et le balisage structuré http://www.google.com/support/webmasters/bin/topic.py?topic=21997 Tag ‘microformat’ sur Technorati http://technorati.com/tag/microformats SearchMonkey de Yahoo! (fermé) http://developer.yahoo.com/searchmonkey/ Tag ‘microformat’ sur Dev Opera http://dev.opera.com/articles/tags/microformat/ Groupe MicroFormat de Drupal http://groups.drupal.org/microformats-in-drupal MicroInformatique http://microformatique.com Tutoriaux sur les microformats http://www.xfront.com/microformats/ BIG DADDIES Tantek Çelik http://tantek.com/ Matt Mullenweg http://ma.tt/ Kevin Marks http://epeus.blogspot.com/ Chris Messina http://chrismessina.me/b John Allsopp http://johnfallsopp.com/ Tim Berners-Lee’s ThinkTank http://www.w3.org/DesignIssues/

Page 34: Recherche universelle, micro formats et recherche sémantique - SMX Paris 2011 par Laurent Bourrelly et Olivier Tassel

Comprendre et suivre

7 juin 2011 Laurent Bourrelly – Olivier Tassel

EN FRANÇAIS Version française de microformats.org (incomplet) http://microformats.org/wiki/Main_Page-fr Opquast http://www.opquast.com/ Recherche Google sur les blogs en français http://www.google.fr/search?hl=fr&ie=UTF-8&q=microformats&lr=lang_fr&tbm=blg&tbs=lr:lang_fr Tag ‘web sémantique’ sur Clever-Age.com http://www.clever-age.com/veille/blog/tags/web-semantique/

LIVRES EN ANGLAIS Microformats Made Simple par Emily P. Lewis Microformats : Empowering Your Markup for Web 2.0 par John Allsopp Programming the Semantic Web par Toby Segaran Semantic Web for the Working Ontologist par Dean Allemang et James Hendler EN FRANÇAIS Microformat : hCard, hCalendard, Contextobjects in Spans, hResume, hReview, hAtom par Livres Groupe Sémantique et multimodalité en analyse de l’information, recherche d’information et web rta. par Collectif Un système ontologique pour le Web sémantique et les données techniques. par Chimene Fankam Le Web sémantique : Revue I3 par Jean Charlet, Philippe Laublet et Chantal Reynaud