View
7.715
Download
1
Category
Preview:
DESCRIPTION
Le Web sémantique est l’un des derniers grands défis de Google : Comprendre le sens et l’intention qui se cachent derrière une recherche par mot clé. Cette conférence présente à la fois les développements de Google dans ce domaine, le Knowledge Graph, l’Author Rank, mais également comment les entreprises peuvent en tirer profit et adapter leurs stratégies de référencement naturel pour gagner en visibilité et anticiper les évolutions du moteur et des utilisateurs. Des conseils concrets sur l’intégration des micro formats l’utilisation du cocon sémantique, la création de contenus à partir des entités nommées et open data pour déployer des stratégies innovantes où l’utilisateur est, de nouveau, au cœur des dispositifs SEO ! Présentation lors de SMX Paris 2013 part : 1ère Position, Mondeca et hREF. Compte rendu complet de SMX Paris 2013 sur : http://www.1ere-position.fr/blog/smx-paris-2013-compte-rendu
Citation preview
1
1 SMX PARIS – 6 ET 7 JUIN 2013
RÉFÉRENCEMENT SÉMANTIQUE 3.0
David Degrelle Fondateur de 1ère Position @david_degrelle
2
2 SMX PARIS – 6 ET 7 JUIN 2013
LES DÉBUTS DU WEB SÉMANTIQUE : LE BALISAGE HTML
2
<TITLE> : Pour indiquer le titre du document web <META> Description : Indiquer une description de la page web <META> Keywords : Pour renseigner les mots clés (obsolète) <H1> : Pour indiquer le titre visible dans une page web H2, H3, …, H6 : Les intertitres <P> : Pour indiquer un paragraphe
<STRONG> : Pour mettre un texte en gras ALT (attribut) : Pour décrire le contenu d’une image <ul>, <li>, <ol> : Pour indiquer une liste ordonnée
Mais ces balises ne suffisent pas…
3
3 SMX PARIS – 6 ET 7 JUIN 2013
LE DÉFI DE LA SÉMANTIQUE POUR GOOGLE
Un fruit charnu (baies roses) ?
Une étendue de mer entourée de terre ?
Une ouverture dans un bâtiment ?
Une armoire informatique ?
Exemple d’une recherche dans Google sur le mot clé : baie
Mais quel type de baie recherchait l’internaute ?
4
4 SMX PARIS – 6 ET 7 JUIN 2013
KNOWLEDGE GRAPH : LE MEILLEUR DE GOOGLE EN SÉMANTIQUE ?
Lancée le 4 décembre 2012 en France. Comprendre les relations entre les choses : objets, personnes, faits, documents tous formats. Recherche prédictive basée sur l’intention.
Source : http://www.1ere-position.fr/blog/knowledge-graph-google-france-recherche-semantique
6
6 SMX PARIS – 6 ET 7 JUIN 2013
RICH SNIPPETS SUR GOOGLE 1/2 Permettent d’ajouter des informations « enrichis », dans les pages de résultats Google : une photo, des notes, des prix, …
7
7 SMX PARIS – 6 ET 7 JUIN 2013
RICH SNIPPETS SUR GOOGLE 2/2 Mais également la durée d’une recette avec parfois les calories, des infos sur des évènements, bientôt les conditions de neige ?
8
8 SMX PARIS – 6 ET 7 JUIN 2013
INTEGRER DES RICH SNIPPETS A SON SITE
Pour développeur : En fonction des types d’informations : Applications, auteurs, évènements, musique, produits, recettes, avis, ajouter dans le code HTML des balises telles que définies par Schema.org
Pour webmaster/référenceur : Google met à disposition depuis mai 2013 un outil WYSIWYG pour générer facilement le code HTML : https://www.google.com/webmasters/markup-helper/
9
9 SMX PARIS – 6 ET 7 JUIN 2013
TESTER L’INTÉGRATION DES RICH SNIPPETS
Outil de Google pour vérifier l’intégration technique, théorique, des rich snippets http://www.google.com/webmasters/tools/richsnippets
10
1
0 SMX PARIS – 6 ET 7 JUIN 2013
SUIVRE LES DONNÉES STRUCTURÉES DANS GOOGLE WEBMASTER TOOLS
Dans Google Webmaster Tools : http://www.google.com/webmasters/tools/?hl=fr Aller dans > Optimisation > Données structurées pour avoir le nombre de pages contenant des metadonnées prises en compte par Google.
11
1
1 SMX PARIS – 6 ET 7 JUIN 2013
AJOUTER UNE PHOTO AUTEUR DANS LES PAGES GOOGLE
1ère étape : Créer un profil Google Plus : https://plus.google.com/?hl=fr 2ème étape : Authentifier le site en ajoutant un lien vers les sites ou les blogs sur lesquels vous publiez (Direct Connect de Google). http://support.google.com/plus/bin/answer.py?hl=fr&answer=1711199
3ème étape : Authentifier l’auteur en créant une page auteur sur le site, indiquant nom, prénom et un lien vers la page profil Google+, avec l’attribut rel=me, rel=author ou ?rel=author dans l’url
Source : http://www.1ere-position.fr/blog/ajouter-photo-google-page-auteur-wordpress
12
1
2 SMX PARIS – 6 ET 7 JUIN 2013
AUTHENTIFIER UNE PAGE PRO GOOGLE+
1 – Créer une page PRO sur Google+ : https://plus.google.com/pages/create
2 – Intégrer le badge Google+ https://developers.google.com/+/plugins/badge/config
Ou un lien <a rel="publisher" href=https://plus.google.com/xxxx>Sur Google+</a> Ou via une balise LINK dans le HEAD de la page : <link rel="publisher" href="https://plus.google.com/ID" />
3 – Ajouter un lien depuis la page PRO Google+ vers le site à authentifier
http://www.journaldunet.com/solutions/expert/50713/comment-optimiser-le-referencement-d-une-page-google--d-entreprise.shtml
13
1
3 SMX PARIS – 6 ET 7 JUIN 2013
MOTS CLÉS ET CONTENU EN SEO SÉMANTIQUE
14
1
4 SMX PARIS – 6 ET 7 JUIN 2013
LA RECHERCHE DES MOTS CLÉS EN SEO SÉMANTIQUE
Google proposait un outil « magique », la Wonder Wheel qu’il a arrêté en 2011.
Source : http://www.abondance.com/actualites/20110816-11046-pourquoi-la-roue-magique-a-t-elle-disparu-des-resultats-de-google.html
15
1
5 SMX PARIS – 6 ET 7 JUIN 2013
LES REMPLAÇANTS GOOGLE DE LA ROUE MAGIQUE…
L’outil de suggestions de mots clés et thèmes de recherche https://adwords.google.com/o/KeywordTool ainsi que les recherches associées (en bas des résultats de Google)
16
1
6 SMX PARIS – 6 ET 7 JUIN 2013
GOOGLE SUGGEST ET UBERSUGGEST
http://www.ubersuggest.org
17
1
7 SMX PARIS – 6 ET 7 JUIN 2013
LES AUTRES OUTILS DE RECHERCHE DE MOTS CLÉS ET DE SENS
95% des sites francophones 18 millions de mots clés francophones
webtools.seeurank.com
2,9 millions de sites en France 6 millions de mots clés francophones
fr.semrush.com
18
1
8 SMX PARIS – 6 ET 7 JUIN 2013
DICTIONNAIRE ELECTRONIQUE DES SYNONYMES : VOYAGE
www.crisco.unicaen.fr/des/
19
1
9 SMX PARIS – 6 ET 7 JUIN 2013
STRATÉGIE DE COCON SÉMANTIQUE
Page Cible : Mot-clé concurrentiel à cibler
Création de pages
complémentaires avec co-
occurence
Analyse de l’environnement
sémantique
• Analyser l’univers sémantique du mot-clé à cibler : Co-occurrence, saisonnalité, etc. • Type d’actualités : curation, nouvelle, éditoriale, etc.
• Structurer les pages complémentaires => Longue Traîne liée directement ou connexe au mot-clé principal.
• Réaliser un texte de 500 mots minimum en relation avec le mot-clé à positionner
Segmentez vos idées pour dynamiser vos mots-clés concurrentiels !
20
2
0 SMX PARIS – 6 ET 7 JUIN 2013
Accueil
Catégorie A Site d’Autorité 1
Page A
Page B
Page C
Page D
ON-SITE OFF-SITE
Site d’Autorité 2
Site d’Autorité 3
Site d’Autorité 4
Site d’Autorité 5 An
cre
s vi
a m
en
u d
e n
avig
atio
n
Maillage interne Liens VERS l’extérieur
LE COCON SÉMANTIQUE EN ILLUSTRATION
Sites thématiques proches et complémentaires
22
2
2 SMX PARIS – 6 ET 7 JUIN 2013
RÉFÉRENCEMENT SÉMANTIQUE : SYNTHÈSE
Repenser vos mots clés, ne pas cibler que les synonymes, travailler la longue traîne selon les attentes et contextes de recherches de VOS utilisateurs
Définir des Persona selon vos cibles de prospects/clients, créer des personnages fictifs représentatifs par groupe thématique
Créer du contenu pertinent et régulièrement, qui répond aux différentes questions posées par les internautes, intégrer une démarche d’OpenData
Créer une arborescence en appliquant le principe de cocon sémantique (siloing), co-occurrence, contenus frais
Intégrer les metadonnées (rich snippet), authentifier le site sur Google+, page auteur et page pro et l’open graph, les boutons de partages sociaux
Créer des blogs thématiques, ultra-spécialisés sur 1 sujet en particulier, autour du site principal et animer vos communautés via les réseaux sociaux !
24
2
4 SMX PARIS – 6 ET 7 JUIN 2013
Web Semantique et SEO Gilles Delaporte, Mondeca GILLES.DELAPORTE@MONDECA.COM
25
2
5 SMX PARIS – 6 ET 7 JUIN 2013
PRÉSENTATION
• Gilles Delaporte: Directeur Marketing et Commercial
• Plus 15 ans expérience autour de la gestion de l’information et des connaissances
• A assister à la naissance et l’émergence du Web Sémantique
• L’accompagne depuis 10 ans chez Mondeca
• Organisation, structuration et enrichissement des contenus
26
2
6 SMX PARIS – 6 ET 7 JUIN 2013
QUELQUES MOTS SUR LE WEB SEMANTIQUE
Un ensemble de technologies, d’outils et de standards
Pour une information plus accessible, compréhensible, partageable
Construire des solutions interopérables et automatisables
Du Web 1.0 au WEB 3.0 …. Ou de la page à la « donnée »
Data
27
2
7 SMX PARIS – 6 ET 7 JUIN 2013
STANDARDS ET POINTS IMPORTANTS
Standards portés par le W3C
• OWL pour les ontologies et modèles
• RDF pour la description des ressources et objets d’informations
• SKOS pour la gestion de référentiels ou métadonnées
• SparQL pour l’interrogation
Notions importantes:
• Multilingue : Unicode
• Identification unique : URI
• Des Vocabulaires partagés
• Des terminologies de description
• Un langage proche de l’humain
Information est décomposée en: sujet , prédicat , objet
doc.html a pour auteur Fabien , doc.html a pour thème Musique
Elles forment un graphe
28
2
8 SMX PARIS – 6 ET 7 JUIN 2013
DES POSTULATS
Le savoir est ce qui me permet de rendre une donnée utile
• Transforme la donnée en information et l’information en savoir
Un savoir utile devient encore plus utile s’il est partagé
• Une donnée inutile ou incomplète l’est encore plus en étant partagée
Le contenu sémantique des données est plus durable que tout format, tout mode de stockage et toute application qui les utilise
Ce qui est durable:
• Les sujets, les entités, les objets dont on parle
Ce qui l’est moins:
• Les phrases, les morceaux de textes, certains contenus…
Le durable mérite l’investissement…
29
2
9 SMX PARIS – 6 ET 7 JUIN 2013
POUR CRÉER DE LA VALEUR AVEC LE WEB SÉMANTIQUE
1
2
3
De l’intelligence, des ressources:
pour décrire, comprendre, organiser
Des outils, des traitements, de l’automatisme:
• pour traiter les contenus, assister les utilisateurs
Des moyens d’exposition de la richesse des contenus
• Recherche, exploration dynamique, classification, publication
30
3
0 SMX PARIS – 6 ET 7 JUIN 2013
LE LINKED OPEN DATA
Un ensemble d’initiatives, de données, de vocabulaires, de langages disponibles… mais aussi le mouvement Open data
Dublin Core
Basic Geo
31
3
1 SMX PARIS – 6 ET 7 JUIN 2013
ET POUR LE SEO?
Être visible : présent sur les moteurs de recherche en bonne place
Etre compris: améliorer le taux de transformation
Etre accessible: par différents points d’entrées , par le jeu des relations
Savoir Retenir : richesse des contenus, des services, de la personnalisation
Le Web sémantique va aider sur ces différents axes. Il va constituer un cadre pour l’intelligence métier, offrir les moyens de doper les services et de pouvoir constituer des « contenus intelligents »
32
3
2 SMX PARIS – 6 ET 7 JUIN 2013
ET DE LA METHODE
Enrichir les contenus par de la sémantique:
• Structuration et organisation
• Identification des «entités», des sujets, des «POI»
• Repérage de concept
• Mise en relation
• Agrégation
Des métadonnées, des liens, de nouveaux contenus, de l’exploration intelligente
33
3
3 SMX PARIS – 6 ET 7 JUIN 2013
CHAINE DE TRAITEMENT
Inférence
Ajout métadonnées
Contrôle Qualite
Content Annotation
Pilotage du Workflow
linguistique référentiels
pose metadatas
Content Classification
Classification basée sur des règles métier
publication dynamique
Ontologie et référentiels
Alimente les composants
Seri
alis
atio
n f
lux
Rules Editor
34
3
4 SMX PARIS – 6 ET 7 JUIN 2013
ET ENSUITE?
Vocabulaire pour les métadonnées, définit les attributs ou propriétés utilisables pour décrire une « chose »
1) Les métadonnées traduites dans le formalisme Schema.org (autres aussi)
2) Ajoutées aux contenus entre des balises de type /div
➤ Pour être « comprises » et « utilisées » par les moteurs de recherche web
Conduit à améliorer l’identification du contenu
Permet une meilleure exposition des résultats
Améliore le taux de transformation via les rich Snippets
Différents tests annoncent de 15 % à 30% de plus en CTR
36
3
6 SMX PARIS – 6 ET 7 JUIN 2013
ET LA GRANDE QUESTION
Est-ce que l’utilisation de schema.org améliore le ranking!
Google dit qu’il n’utilise pas les « meta » pour son algo de ranking… mais:
Le contenu est mieux identifié
Une page avec dans le texte paris et dans les metas «PARIS» ne pourra faire qu’améliorer la réponse, d’autant si le PARIS est un identifiant connu!
Aussi:
It would be better to ask “will schema.org metadata help people find my pages using Google”, to which the answer is yes (phil barker)
37
3
7 SMX PARIS – 6 ET 7 JUIN 2013
MAIS ENCORE PLUS LOIN
RDF est un langage formel, il autorise la mise en œuvre de raisonnements
Des règles pourront être appliquées sur les contenus pour:
• Classifier automatiquement ces contenus
• Compléter l’information
• Poser des liens entre contenus
Exemple de règle: si doc A porte la métadonnée « ville » des « usa » et nom d’un « joueur » de basket ou d’une « équipe » de basket et le terme « basket », alors affecter la catégorie IPTC, sport, basket, NBA
La classification permet d’affecter le contenu à une catégorie, un thème, un profil client etc… utilisée pour:
• la recherche à facettes ( filtrage dynamique des résultats de recherche)
• La navigation dynamique dans un portail
39
3
9 SMX PARIS – 6 ET 7 JUIN 2013
ET DANS UN MONDE IDEAL
La recherche sur Google ramène en tête une page « hub » sur le sujet ➤ Pérenne, durable, qu’on peut garder dans ses favoris
De cette page « hub » on peut naviguer vers ➤ Une fiche descriptive style dictionnaire
➤ Des dossiers pour approfondir
➤ Des sujets reliés : liens vers d’autres pages « hub »
➤ Des articles, des discussions sur les forums
➤ Eventuellement des pages de référence hors site
De toute page on peut naviguer vers les pages « hubs » des sujets dont traite la page, les pages « hub » sont donc une cible prioritaire du SEO
Elles sont produites automatiquement à partir des métadonnées, règles et classification depuis un TripleStore
40
4
0 SMX PARIS – 6 ET 7 JUIN 2013
PAGES HUB
Produites à partir du graphe formé par les différentes assertions générées
Organisés autour d’index ou de taxonomies ( plans de classements)
41
4
1 SMX PARIS – 6 ET 7 JUIN 2013
PAGE HUB OU TOPIC PAGE
By jean delahousse
46
4
6 SMX PARIS – 6 ET 7 JUIN 2013
AUTOUR DES SUJETS, CONCEPTS ET TERMINOLOGIES
Poser des métadonnées c’est bien… mais encore faut il que celles-ci répondent aux sujets et thèmes traités, qu’elles soient réutilisables, reconnues, organisées…
La constitution d’un référentiel constitue la première opération et se poursuit tout au long de la vie des contenus et productions.
Ce référentiel va servir aux rédacteurs comme aux outils pour « traiter » et enrichir les textes.
Le processus est dit d’annotation et consiste en la pose automatique de métadonnées pour des textes en s’appuyant sur ces référentiels. Une révision peut être faite ou non…
47
4
7 SMX PARIS – 6 ET 7 JUIN 2013
EXEMPLE TOURISME
Constitues à partir des différentes études, publications de la destination, ainsi que des blogs et des pages facebook.
"L'identité du Territoire" repose sur une écoute et une analyse fine du territoire. Il s'agit de recueillir et analyser les images et valeurs identitaires du Territoire véhiculées par les acteurs culturels et touristiques. Puis de les relier aux mots des gens, de la marque et du territoire. à partir d'un corpus fourni par la Destination et ajustée par des entretiens terrain
mots métiers sont à la fois disponibles auprès de différents producteurs de données du LOD ( thésaurus, listes autorités…) mais aussi constitués par les producteurs de contenus
50
5
0 SMX PARIS – 6 ET 7 JUIN 2013
La production de contenus à l’heure du web sémantique par Julien Barras, hREF JULIEN@HREF.FR
51
5
1 SMX PARIS – 6 ET 7 JUIN 2013
PRÉSENTATION
• Julien Barras : fondateur et dirigeant de l’agence éditoriale hREF
• Précédemment directeur du développement de Benchmark Group pendant 10 ans
• A ce poste, création de 200 000 pages de contenus web avec une forte composante structuration, data et SEO (dictionnaire, villes, voyages, prénoms…)
• Ces contenus uniques = apport de trafic SEO et d’image de marque >> Notion de « patrimoine éditorial »
• Création d’une agence éditoriale, hREF, ayant pour vocation d’aider ses clients à développeur leur patrimoine éditorial.
52
5
2 SMX PARIS – 6 ET 7 JUIN 2013
QUELS TYPES DE CONTENUS VISER AUJOURD’HUI ?
Double phénomène :
• Allongement incessant du nombre de mots dans les requêtes sur Google
• Knowledge Graf : Google « se réserve l’audience » sur les requêtes courtes
Restons chez Google…
53
5
3 SMX PARIS – 6 ET 7 JUIN 2013
QUELS TYPES DE CONTENUS VISER AUJOURD’HUI ?
Le travail autour des contenus doit tenir compte de ces phénomènes liés au web sémantique et aux choix de Google.
• Produire des contenus plus riches, mieux choisis, plus massifs : importance de la méthodologie de conception des contenus
• Enrichir et structurer les contenus pour les mettre au niveau du web sémantique et maximiser son SEO
• Ne pas perdre de vue la place de l’humain dans ce système
54
5
4 SMX PARIS – 6 ET 7 JUIN 2013
PLACE DE L’HUMAIN DANS LA DÉMARCHE EDITO-SEO
Avant la technique, ne pas perdre de vue que l’homme est au cœur du système :
• Le lecteur > importance du SEO pour le capter, mais aussi (et avant tout) importance de la qualité du contenu pour le retenir
• Le rédacteur > son but = aller à la rencontre des lecteurs et des moteurs. En amont : une conception solide du projet. En aval de son travail : des enrichissements automatisés des contenus.
• Le client > connaître et respecter ses valeurs, ses objectifs, son discours. Cela doit imprégner toute la démarche avec un regard critique à toutes les étapes.
56
5
6 SMX PARIS – 6 ET 7 JUIN 2013
CONCEPTION D’UN PRODUIT ÉDITORIAL
Produire des contenus plus riches, mieux choisis, plus massifs : Comment faire concrètement ?
3 temps principaux dans la conception :
• Organiser,
• Filtrer,
• Enrichir
57
5
7 SMX PARIS – 6 ET 7 JUIN 2013
ORGANISER
Mots clés du champ lexical
Identifier les mots clés significatifs d’un champ lexical Importance de la sémantique et de l’association des mots clés dans l’univers étudié !
58
5
8 SMX PARIS – 6 ET 7 JUIN 2013
ORGANISER
Expressions clés pertinentes
Viser seulement les mots clés les plus génériques ne peut être suffisant. Associer entre eux les mots clés pour obtenir des expressions clés permet de commencer à tisser son « cocon sémantique »
59
5
9 SMX PARIS – 6 ET 7 JUIN 2013
FILTRER
Popularité de l’expression insuffisante
Tester la popularité de chaque expression permet de déterminer celles à travailler et celles à exclure. Sans négliger la pertinence éditoriale ! Ne pas créer des « trous » artificiels dans des dossiers pour des raisons SEO…
60
6
0 SMX PARIS – 6 ET 7 JUIN 2013
FILTRER
Positionnement client déjà optimal
Inutile de travailler des expressions sur lesquelles son site est déjà leader !
61
6
1 SMX PARIS – 6 ET 7 JUIN 2013
FILTRER
Concurrence trop forte
Inutile de travailler des expressions si la concurrence est de toute évidence trop bien armée.
62
6
2 SMX PARIS – 6 ET 7 JUIN 2013
ENRICHIR
Mots clés secondaires
Les expressions visées suffisent rarement à faire le tour de la question tant en SEO qu’en intérêt lecteur. >> Poursuite de l’analyse en greffant des mots clés secondaires à travailler.
63
6
3 SMX PARIS – 6 ET 7 JUIN 2013
ENRICHIR
Linking interne
Conception d’un linking interne au projet + liant le projet aux contenus préexistant
64
6
4 SMX PARIS – 6 ET 7 JUIN 2013
ENRICHIR
Autour de chaque expression clé, complétée de mots clés secondaires et d’un maillage de lien, on peut greffer un titre, des accroches, des arguments…
Mais sans oublier la démarche inverse ! Partir de l’argument, l’idée, la vision, et les décliner pour qu’ils soient optimisés pour le référencement…
>> Fin de la conception du produit éditorial et place à la production.
65
6
5 SMX PARIS – 6 ET 7 JUIN 2013
Enrichir ses contenus par des données structurées
66
6
6 SMX PARIS – 6 ET 7 JUIN 2013
DONNÉES STRUCTURÉES
L’écriture web orienté « sémantique » implique l’ajout de tags spécifiques au sein même du contenu (rich snippets). Mais la structuration du contenu en amont permet d'aller plus loin :
• Plus de pages, plus précises, avec plus de contenus : elles peuvent être filtrées, classées, catégorisées
• Automatisation de la création du code html des pages gérant les tags appropriés au balisage sémantique
• Intégration des données et des tags au sein de l’éditorial même (plus élégant, plus contextuel) et utilisation des champs données pour une mise en page graphique tournée vers l'utilisateur, plutôt que vers des tableaux de données
• Mise en place d'un linking interne automatisé s'appuyant sur les termes les plus importants, création de pages pivots = contribution à l'amélioration du SEO "classique"
67
6
7 SMX PARIS – 6 ET 7 JUIN 2013
DONNÉES STRUCTURÉES
Une « donnée » n’est pas forcément un chiffre : ce peut être une catégorie, un caractère…
Faire un effort dans la collecte et l’enrichissement de banque de données peut représenter un double apport éditorial :
• Les données en elles-mêmes représentent souvent un produit éditorial qualitatif, si elles sont bien mises en musique.
• Ces données représentent dès lors une source exclusive d’information pour une exploitation éditoriale originale.
Exemple : Encyclopédie des villes de France, sur le Journal du Net.
68
6
8 SMX PARIS – 6 ET 7 JUIN 2013
Un projet ambitieux de référencement sémantique ? Consultez-nous ! David Degrelle de 1ère Position : davidd@1ere-position.fr Gilles Delaporte de Mondeca : gilles.delaporte@mondeca.com Julien Barras de hREF : julien@href.fr
Recommended