102
SEO L'aventure des développeurs/référenceurs web et le prochain défi stratégique des entreprises Travail de diplôme réalisé en vue de l’obtention du diplôme HES par : Nicolas MESSER Conseiller au travail de diplôme : Alexandre BODER, Chargé d'enseignement HES Carouge, 9 juillet 2010 Haute École de Gestion de Genève (HEG-GE) Filière Informatique de Gestion

SEO L'aventure des développeurs/référenceurs web et le ... · SEO* est l’acronyme anglais pour "Search Engine Optimization", ... Introduction ... Abstraction du concept Link

Embed Size (px)

Citation preview

SEO L'aventure des développeurs/référenceurs web et le prochain défi stratégique des entreprises

Travail de diplôme réalisé en vue de l’obtention du diplôme HES

par :

Nicolas MESSER

Conseiller au travail de diplôme : Alexandre BODER, Chargé d'enseignement HES

Carouge, 9 juillet 2010 Haute École de Gestion de Genève (HEG-GE)

Filière Informatique de Gestion

Déclaration

Ce travail de diplôme est réalisé dans le cadre de l’examen final de la Haute école de

gestion de Genève (HEG), en vue de l’obtention du titre d'informaticien de gestion.

L’étudiant accepte, le cas échéant, la clause de confidentialité. L'utilisation des

conclusions et recommandations formulées dans le travail de diplôme, sans préjuger

de leur valeur, n'engage ni la responsabilité de l'auteur, ni celle du conseiller au travail

de diplôme, du juré et de la HEG.

« J’atteste avoir réalisé seul le présent travail, sans avoir utilisé des sources autres que

celles citées dans la bibliographie. »

Fait à Genève, le 9 juillet 2010

Nicolas MESSER

Search Engine Optmization Nicolas MESSER 2/102

Remerciements

Je tiens à remercier particulièrement Alexandre Boder, pour son accompagnement et

ses conseils toujours judicieux.

J'aimerais également remercier les trois spécialistes du référencement qui ont répondu

à mon questionnaire. Ce sont Scott Smith, a.k.a Caveman, consultant indépendant

(www.thecaveman.org), Dejan Petrovic, directeur de Dejan SEO (www.dejan.com.au)

et David Degrelle a.k.a DavidD, fondateur et président 1ère Position SA

(http://www.1ere-position.fr).

Je tiens également à remercier les deux responsables des sites web qui se sont mises

à dispositions pour des interviews. Ce sont Véronique Murbach, conceptrice web de la

HEG Genève et Nicolas Pittet, responsable de l'équipe web de l'EIA-FR.

Et à ne pas oublier, je remercie toutes les autres personnes qui m’ont apporté leur aide

et leur soutien tout au long de la rédaction de ce mémoire.

Search Engine Optmization Nicolas MESSER 3/102

Sommaire

Ce mémoire est le fruit de la réalisation de mon travail de diplôme, effectué dans le

cadre de ma formation à la Haute Ecole de Gestion (HEG) de Genève. Ce travail

finalise ma formation en vue de l’obtention du diplôme de Bachelor en Informatique de

Gestion.

Tout au long de la réalisation de ce mémoire, j’ai été suivi et conseillé par M. Alexandre

Boder, Chargé d’enseignement HES à la HEG.

SEO* est l’acronyme anglais pour "Search Engine Optimization", connu comme

référencement ou optimisation pour les moteurs de recherche en français. L'objectif de

ce procédé est d'orienter le positionnement d'une page web dans les pages de

résultats (SERPs*) des différents moteurs de recherche.

L’optimisation des pages web pour les moteurs de recherche représente donc un

véritable enjeu car il permet d'augmenter de façon significative le nombre de visiteurs

du site d’une entreprise et par ce fait le nombre de clients potentiels atteignable.

L'objectif poursuivi par ce mémoire est premièrement, de passer en revue l'histoire et

le fonctionnement des moteurs de recherche qui sont pour une grande partie

responsable du fait qu'aujourd'hui le SEO fait partie du projet de création d'un site web.

Pour cela, je présenterai dans la première partie un bref aperçu de l'histoire des

moteurs de recherche ainsi que les bases du fonctionnement des moteurs de

recherche et l'utilisation des internautes.

Deuxièmement, le mémoire aura pour objectif de présenter les différentes techniques

et bonnes pratiques du référencement naturel*, de les décrire et de les évaluer par

rapport à leur difficulté d'implémentation et leur efficacité. Pour mieux illustrer ces

concepts, je réaliserai une analyse du site de la HEG et je proposerai des

changements ou des améliorations dans le cas échéant à partir des mes propres

expériences de création et optimisation des pages web.

Dans la troisième partie de ce mémoire je présenterai deux outils gratuits à disposition

pour les référenceurs. Ces outils devront permettre d'évaluer les efforts d'optimisation

et dans le meilleur des cas de connaître le retour sur l'investissement (ROI*). Comme

dans la deuxième partie, je proposerais des exemples à partir de notre cas d'étude

avec le site de la HEG.

Search Engine Optmization Nicolas MESSER 4/102

De plus une réflexion sur les technologies issues du Web 2.0 et de son influence sur la

façon d'orienter le référencement pour capter une communauté spécifique d'usagers

sera réalisée dans la quatrième partie. La HEG devra avoir un intérêt particulier de

conforter sa présence auprès "d'une clientèle" jeune particulièrement friande de ces

technologies. Nous allons donc découvrir le monde des médias sociaux en faisant

l'état des services exploite par la HEG.

Et finalement, j'essayerai de faire quelques projections pour l'avenir du référencement

dans la dernière partie de ce mémoire. Quelles sont les technologies les plus

prometteuses à venir et connaître et quelle sera l'influence du monde mobile sur le

référencement.

Pourtant, il ne sera pas possible de couvrir tous les aspects du référencement dans le

cadre de ce mémoire. Le sujet est beaucoup plus complexe que ces quelques pages

qui ne pourront être autre chose qu'un bon point de départ pour qui aimerait s’initier au

référencement.

Search Engine Optmization Nicolas MESSER 5/102

Table des matières

Déclaration......................................................................................................... 1  Remerciements.................................................................................................. 2  Sommaire ........................................................................................................... 3  Table des matières ............................................................................................ 5  Liste des Figures............................................................................................... 7  Guide de lecture ................................................................................................ 8  A propos de l'auteur et ses motivations ....................................................... 10  Introduction ..................................................................................................... 11  Partie 1 : Introduction sur les moteurs de recherche .................................. 14  

Chapitre 1: Bref aperçu de l'histoire des moteurs de recherche.................... 14  Chapitre 2: Le fonctionnement des moteurs de recherche ............................ 16  Chapitre 3 : Comment les moteurs de recherche sont utilisés par les

internautes................................................................................................ 21  Conclusion (partie 1) .................................................................................. 23  

Partie 2 : Le cas d'étude HEG......................................................................... 25  Comment développer un site accueillant le SEO?..................................... 25  

Chapitre 1 : Considérations avant le projet...................................................... 26  Analyse des mots-clés ............................................................................... 26  La longue traîne ......................................................................................... 28  Analyse mots-clés de la HEG .................................................................... 29  Choix du nom de domaine ......................................................................... 31  

Chapitre 2 : Applications des Best Practices................................................... 33  La balise <title> .......................................................................................... 34  La balise Meta <description> ..................................................................... 35  Propositions d'amélioration des balises <title> et <description>................ 36  Les balises d'en-tête .................................................................................. 37  Propositions d'amélioration de la balise <h1>............................................ 39  L'optimisation des liens .............................................................................. 39  L'optimisation des images .......................................................................... 42  Le plan du site ............................................................................................ 42  Arborescence d'un site............................................................................... 44  Utilisation du fichier robots.txt .................................................................... 44  La structure des URL ................................................................................. 46  Proposition d'amélioration de la structure URL .......................................... 47  Faciliter la navigation.................................................................................. 47  Respect des standards W3C ..................................................................... 47  Proposition d'autres améliorations ............................................................. 48  

Chapitre 3 : "Black hat" – les stratégies à éviter ............................................. 49  Conclusion (partie 2) .................................................................................. 51  

Search Engine Optmization Nicolas MESSER 6/102

Partie 3 : Le suivi et l'évaluation des résultats............................................. 54  Chapitre 1 : Comment suivre les stratégies mises en place........................... 55  

Circulation par moteurs de recherche. ....................................................... 59  La circulation par mot-clé ........................................................................... 60  

Chapitre 2 : ROI dans l'optimisation pour les moteurs de recherche............ 61  Indicateur : nombre de visiteurs ................................................................. 61  Indicateur : nombre de vues par pages...................................................... 61  Exemple calcul rendement pour la HEG .................................................... 61  

Chapitre 3 : Evaluer à quelle fin ? ..................................................................... 62  Conclusion (partie 3) .................................................................................. 63  

Partie 4 : L'influence des médias sociaux .................................................... 64  Chapitre 1 : Aperçu des médias sociaux populaires....................................... 66  

Facebook.................................................................................................... 66  Twitter ........................................................................................................ 66  LinkedIn...................................................................................................... 67  Wikipedia.................................................................................................... 68  Autres services sociaux.............................................................................. 68  

Chapitre 2 : Quel gain apporté par les médias sociaux? ................................ 68  Conclusion (partie 4) .................................................................................. 69  

Partie 5 : Le future de l'optimisation ............................................................. 71  Chapitre 1 : La recherche universelle ............................................................... 71  Chapitre 2 : Nouvelles technologies à venir et connaître ............................... 73  

SearchWiki – la recherche personnalisée.................................................. 73  L'interprétation du Flash............................................................................. 74  OCR – La reconnaissance optique de caractères ..................................... 74  Les microformats........................................................................................ 74  

Chapitre 3 : Le monde mobile............................................................................ 76  Conclusion (partie 5) .................................................................................. 78  

Conclusion....................................................................................................... 79  Bilan personnel ............................................................................................... 81  Bibliographie ................................................................................................... 82  Glossaire .......................................................................................................... 86  Annexes ........................................................................................................... 90  

Search Engine Optmization Nicolas MESSER 7/102

Liste des Figures

Figure 0-1. Pyramide du référencement par Rand Fishkin de SEOmoz .............8  Figure 1-1. Distribution des parts de marché des moteurs de recherche .........14  Figure 1-2. L'interface de Google en 1998........................................................15  Figure 1-3. L'interface de Google en 2010........................................................15  Figure 1-4. Présentation du concept du Page Rank .........................................16  Figure 1-5. Concept du fonctionnement des Spiders ........................................18  Figure 1-6. Cycle de vie d'une requête..............................................................19  Figure 1-7. Page de résultat de Google ............................................................20  Figure 1-8. Le triangle d'or de Google...............................................................22  Figure 1-9. Nombre de mots-clés utilisés dans une requête en janvier 2010 ...23  Figure 2-1. Outil de recherche mots-clés AdWords de Google.........................27  Figure 2-2. Le principe du "Long Tail" ...............................................................28  Figure 2-3. Site HEG avant 2010 ......................................................................33  Figure 2-4. Site HEG actuel ..............................................................................34  Figure 2-5. Extrait du site de la HEG sur la page de résultat de Google ..........36  Figure 2-6. Balise d'en-tête <h1> du site actuel de la HEG ..............................38  Figure 2-7. Balise d'en-tête <h1> de l'ancien site de la HEG............................38  Figure 2-8. Abstraction du concept Link Building ..............................................41  Figure 2-9. Application possible du link building pour le site de la HEG ...........41  Figure 2-10. Extrait du code d'un sitemap exemple en format XML .................43  Figure 2-11. Plan du site HEG ..........................................................................43  Figure 2-12. Principe du fichier robots.txt..........................................................45  Figure 2-13. Fichier robots simple du site Abondance ......................................45  Figure 2-14. Résultat de la validation W3C.......................................................48  Figure 2-15. Représentation visuelle du Cloaking.............................................50  Figure 2-16. Formulaire pour annoncer du spam à Google ..............................53  Figure 3-1. Aperçu du Dashboard de GWT.......................................................58  Figure 3-2. Informations sitemap de GWT ........................................................58  Figure 3-3. Erreurs d'indexation de GWT..........................................................58  Figure 3-4. Aperçu du Dashboard de Google Analytics ....................................59  Figure 3-5. Aperçu de la circulation par moteurs de recherche ........................59  Figure 3-6. Aperçu de la circulation par mot-clé................................................60  Figure 4-1. Le principe du marketing viral .........................................................65  Figure 4-2. Site de la HEG sur Facebook .........................................................66  Figure 4-3. Réaction de la CFF sur Twitter .......................................................67  Figure 4-4. Profile de la HEG chez LinkedIn .....................................................67  Figure 4-5. Page Wikipedia de la HEG .............................................................68  Figure 4-6. Résultats Facebook et LinkedIn chez Google pour la HEG............69  Figure 5-1. Représentation visuelle du principe "Universal Search" .................72  Figure 5-2. Application du microformat hCard...................................................75  Figure 5-3. Comparaison accès mobile entre les sites de la HEG et TPG .......77  

Search Engine Optmization Nicolas MESSER 8/102

Guide de lecture

Méthodologie

J'ai acquis la base pour ce mémoire par la lecture et l'étude des livres, des articles et

des sites web mentionnés dans la bibliographie. Par la suite, j'ai défini une première

structure du mémoire en essayant de suivre le plus prêt possible le concept de la

pyramide du référencement de Rand Fishkin de SEOmoz.

Figure 0-1. Pyramide du référencement par Rand Fishkin de SEOmoz

Le noyau dur de ce mémoire est la 2ème partie avec le cas d'étude où nous verrons des

exemples concrets des concepts de l'optimisation des pages web pour les moteurs de

recherche.

Par rapport à la pyramide du référencement, nous passerons le plus de temps à

construire le fondement représenté par les deux premiers niveaux et nous allons

seulement toucher un peu les possibilités plus avancées du troisième niveau.

Search Engine Optmization Nicolas MESSER 9/102

Mais nous allons consacrer un peu plus de temps au quatrième niveau qui est un sujet

d'actualité et important dans le contexte du cas d'étude de ce mémoire.

Pour soutenir ou contredire mes affirmations et mes théories, j'ai questionné trois

experts du domaine et conduit des interviews avec des responsables des sites web

des Haute écoles de la Suisse occidentale.

Enfin, pour rester à jour avec les événements dans le monde du référencement, j'e me

suis abonné à deux Podcasts hebdomadaires, SEO 101 et SEO Rockstars, de

Webmaster Radio.

Voici encore quelques informations pour vous faciliter la lecture de ce mémoire pour

conclure ce petit guide de lecture.

Le glossaire

En fin de ce mémoire vous trouverez un glossaire complet des termes rencontrés lors

de votre lecture. Celui-ci reprend l’ensemble des abréviations, termes techniques et

spécifiques liés au sujet traité dans ce mémoire. Lors de votre lecture les mots signalés

par une astérisque (ex : mot*) sont systématiquement repris et explicités dans le

glossaire.

Utilisation des notes de bas de pages

Afin d’alléger le texte et d’en faciliter la lecture, il a été choisi d’insérer dans le texte des

notes de bas de page pour signaler, les sources des documents de références. Toutes

ces références figureront également dans la bibliographie.

Raccourcissement d'URL

Pour faciliter le suivi des liens référencés dans ce mémoire, le service Bit.ly a été

utilisé. Voici un exemple pour le lien du site de la HEG : http://bit.ly/heg-ge

Représentation codage HTML

Pour distinguer l'utilisation du code HTML, ces parties de textes ont un formatage

spécial. Voici un exemple avec la balise titre :

<title>Haute école de gestion de Genève - Bienvenue à la

HEG</title>

Search Engine Optmization Nicolas MESSER 10/102

A propos de l'auteur et ses motivations

Etudier le sujet de l'optimisation pour les moteurs de recherche n'est pas une exigence

pour obtenir un diplôme en informatique (de gestion) ou devenir un développeur pour

le web.

A l'heure actuelle, il n'existe même pas de formation ou certification officielle à ce sujet

à part quelques exceptions qui ne sont pas reconnues officiellement dans l'industrie.

C'est tout d'abord l'initiative et le savoir technique de la personne qui désire devenir un

spécialiste dans le domaine qui sont le plus importants.

Dans ce contexte, je me permets de faire l'affirmation que les informaticiens de gestion

sont dans une situation de départ avantageuse pour faire de l'optimisation pour les

moteurs de recherche.

L'interdisciplinarité que demande ce travail extrêmement intéressant est le cœur des

études de l'informaticien de gestion. Il est confronté aux nouvelles technologies en

même temps qu'il apprend les bases du côté gestion d'entreprise et de marketing.

Il doit être capable de comprendre et répondre à des questions dans ces différents

domaines et d'appliquer les bonnes pratiques. En même temps, il doit être capable de

présenter ces principes à d’autres personnes, qu’ils soient des membres de l'équipe ou

des clients, dans la poursuite de la bonne conduite d'un projet.

Quelque chose que vous verrez par la suite de ce mémoire est un atout indispensable

dans le travail d'un référenceur. Car il ne doit pas toujours être facile d'expliquer les

méthodes employées et de justifier les honoraires pour un référenceur.

Par contre, il est certain que l'expertise dans le domaine de l'optimisation est un métier

du futur. Et encore une fois, je dirais que les informaticiens de gestion vont être parmi

ceux qui se trouvent dans une excellente position pour mettre les pieds sur ce marché

à l'épreuve du temps.

Ceci dit, je ne suis pas un des experts renommés du référencement et des moteurs de

recherche. Mais l'intérêt très fort à ce sujet était l'opportunité parfaite pour dédier mon

mémoire à ce sujet et mettre mes pieds dans ce monde attrayant.

"Organize the world's information and make it universally accessible and useful." – Mission statement by Google

Search Engine Optmization Nicolas MESSER 11/102

Introduction

L'optimisation pour les moteurs de recherche est en même temps une science et un

art. Une fois étudiées, les bases de l'optimisation peuvent apparaître comme du bon

sens pour quelqu'un de familier avec le développement web. Mais souvent les

concepts plus avancés ne sont pas si évidents et plutôt difficiles à comprendre et la

mise en œuvre peut même soulever des questions pour les spécialistes du domaine.

De plus, les moteurs de recherche ont une grande influence sur les résultats qu'on

peut obtenir avec les changements et améliorations apportés en permanence à leurs

algorithmes.

Google, le leader des moteurs de recherche, a publié une vidéo1 à ce sujet et on peut

estimer qu'en moyenne 350 à 400 changements ou améliorations sont apportés par

année. Donc, si vous effectuez une recherche chez Google pour "optimisation des

moteurs de recherche", "SEO" ou n'importe quelle autre terme similaire, vous allez

retrouver un grand nombre d'articles qui favorisent des stratégies dépassées et

inefficaces aujourd'hui.

Parce que les moteurs de recherche ont évolué de manière significative les dernières

années, la majorité de ces stratégies ne sont plus recommandées et d'autres même

considérées comme du spam. Et parce que le succès des moteurs de recherche

dépend considérablement de la pertinence de résultats de recherche, les essais de

manipuler ces résultats sont traités très sérieusement par les dernières.

L'accès "illimité" aux informations se trouvant sur Internet est la raison majeure pour

laquelle les moteurs de recherche deviennent de plus en plus un point d'entrée d'une

session d'Internet pour les internautes d'aujourd'hui.

Avec la possibilité de chercher et de consulter l'information sur un bien ou service à

n'importe quel moment, avoir un bon placement dans les pages de résultats devient

critique pour la survie des entreprises dans ce monde connecté.

Il n'est pas exagéré de dire que les entreprises font face à une concurrence sans

précédent pour le temps et l'argent des consommateurs en ligne.

1 Google Webmaster Help YouTube Channel. How many search algorithm changes were

made in 2009? http://bit.ly/google-changes (consulté le 15.05.2010)

Search Engine Optmization Nicolas MESSER 12/102

Tout simplement avoir un site web ne suffit plus aujourd'hui. Pour apparaître dans les

meilleures positions des recherches effectuées par vos clients potentiels un site

optimisé à cet effet est indispensable. Comme avec tout grand projet, cela prendra du

temps pour la mise en place et la "maintenance" dans le futur.

Le grand plus de l'optimisation est que ce n'est pas forcement lié à un coût. Les

concepts de bases ne sont pas trop compliqués pour quelqu'un avec des

connaissances dans le domaine du développement web. Il se peut même que vous

disposé déjà d'une personne qui s'occupe de vos besoins en ce qui concerne votre

présence sur le web sans s'être occupée de l'optimisation à ce moment. Clairement, le

temps consacré à ce projet représente un coût, mais si vous n'avez pas besoin

d'engager un consultant externe, la plus-value à long terme sera supérieure à cet

investissement.

L'optimisation pour les moteurs de recherche n'est certainement pas de la physique

quantique, mais ceci peut être un sujet très détaillé et technique.

Tout au cours de ce mémoire, vous allez faire connaissance avec l'art de l'optimisation

pour les moteurs de recherche et apprendre comment implémenter de façon efficiente

et simple ces stratégies pour votre site web à l'exemple d'un cas d'étude.

Pourtant nous allons nous concentrer sur Google dans ce mémoire, vous aurez

certainement également de bons résultats avec les deux autres grands moteurs de

recherche, Yahoo et Bing (Microsoft), en suivant les recommandations de ce mémoire.

Si vous vous intéressez plus aux différences entre les différents moteurs de recherche,

je vous recommande de lire les deux articles2 par Rand Fishkin de SEOmoz qui a

réalisé une étude plus avancée entre Google et Bing.

Il est également important de préciser que nous allons nous occuper par l'optimisation

dans les résultats naturels, connus sous "organic search results", et non pas les

résultats payants3. Même si certains concepts pourront également s'appliquer à ceux-

là, c'est un tout autre domaine que nous n'aurons pas le temps de traiter en détails.

2 SEOmoz.org, Rand Fishkin. Google vs. Bing: Correlation Analysis of Ranking Elements

http://bit.ly/goog-vs-bing (consulté le 04.07.2010) SEOmoz.org, Rand Fishkin. Bing vs. Google: Prominence of Ranking Elements

http://bit.ly/goog-vs-bing-2 (consulté le 04.07.2010) 3 Pay per click. In : Wikipedia http://bit.ly/liens-sponsorises (consulté le 20.06.2010)

Search Engine Optmization Nicolas MESSER 13/102

Une simple indication qu'une campagne complémentaire avec des liens sponsorisés*

pourrait surtout au début de vos efforts d'optimisation fournir des résultats plus rapide.

Centrer l'optimisation de son site web autour de Google, surtout pour les pays

occidentaux, a du sens avec une part de marché d'environs 65% des recherches

effectuées (voir Figure 1-1. Distribution des parts de marché des moteurs de

recherche).

Dans un dernier point, avant de conclure cette introduction, j'aimerais clarifier les

termes de référencement et optimisation. Généralement, lorsque votre site sera

présent dans les bases de données (indexes*) des moteurs de recherche, on dira qu'il

est référencé. L'optimisation est le processus d'augmenter la visibilité et d'améliorer le

positionnement de votre site dans les SERPs* (search engine results page) une fois

votre site a été indexé par les moteurs de recherche.

Tout au long de mes recherches, j'ai pu constater que surtout pour les francophones

ces termes sont souvent utilisés de manière "impropre" et mélangée mutuellement. Je

vous prie donc de m'excuser au cas où j'aurais fait de même dans les pages de ce

mémoire.

Search Engine Optmization Nicolas MESSER 14/102

Partie 1 : Introduction sur les moteurs de recherche Pour pouvoir mettre en place une bonne stratégie de référencement et d'implémenter

les concepts d'optimisation, il est important d'avoir une idée comment fonctionnent les

moteurs de recherche.

Chapitre 1: Bref aperçu de l'histoire des moteurs de recherche Pendant la dernière décennie, nous avons tous pu assister à l'évolution d'un des plus

grands phénomènes de notre ère – l'Internet. A la source d'un projet pour le

département de la Défense (DoD) des Etats-Unis, l'Internet comme nous le

connaissons est né au CERN4 à Genève, il y a un peu plus de 20 ans.

L'accès public à Internet a fondamentalement changé la communication et le partage

d'informations en contournant les frontières existantes. Et avec une estimation

d'environs 8 milliards de pages indexées aujourd'hui, on peut comprendre la nécessité

d'un outil de recherche pour cet espace énorme.

Avec l'explosion de l'information accessible par l'Internet et la popularité des moteurs

de recherche pour retrouver ces informations, il est devenu important d'avoir une

bonne visibilité dans les SERP et la course autour de l'optimisation a commencé.

Pourtant il y a eu plusieurs petits projets au début de cette ère, le premier grand

moteur de recherche qui a pu s'établir a été AltaVista. Mais au cours des années, seul

3 moteurs de recherche ont réussi à résister au temps dans les pays occidentaux.

Figure 1-1. Distribution des parts de marché des moteurs de recherche5

4 CERN. Le berceau du Web. http://bit.ly/berceau-Web (consulté le 15.05.2010) 5 Net Applications. Search Engine Market Share. http://bit.ly/market-share (consulté le

22.06.2010)

Search Engine Optmization Nicolas MESSER 15/102

Et depuis juillet 2009, ce paysage se résume à deux grands noms, Google et

Microsoft, ce dernier qui maintenant fait tourner le moteur de Yahoo avec ses propres

technologies.6

Aujourd'hui, l'empire de Google dans ce domaine pour le monde occidental est

incontesté et commence à s'intégrer dans la vie des humains par une diversité de

services, différents du simple outil de recherche de départ.

Mais la constante du succès du moteur de recherche de Google semble être l'interface

pionnier du moteur qui n'a pas changé depuis son début.

Figure 1-2. L'interface de Google en 1998

Cette interface qui depuis le tout début se concentre sur un champ de saisie et un

bouton de recherche est la représentation de cette constante de succès. Et on

remarque également que déjà tout au début Google semble avoir apprécié le mot

BETA pour ces services.

Figure 1-3. L'interface de Google en 2010

6 Mashable. Yahoo-Microsoft Search Deal : The Key Facts http://bit.ly/yahoo-microsoft

(consulté le 19.06.2010)

Search Engine Optmization Nicolas MESSER 16/102

Google n'a jamais essayé de devenir un portail comme ses concurrent Microsoft et

Yahoo. Et la comparaison des deux interfaces séparées de plus de 10 ans relève

seulement un aperçu plus moderne.

Chapitre 2: Le fonctionnement des moteurs de recherche En résumé, le travail des moteurs de recherche est de roder les pages indexées et de

retourner seulement celles qui sont similaires au mot-clé saisi par l'internaute dans un

ordre trié d'importance.

L'importance de ce trie est pour la grande majorité déterminée par le nombre et la

pertinence des liens externes et internes qui pointent vers votre site. Dans ce même

concept, il y a un autre facteur qui intervient dans la détermination de l'importance d'un

lien, c'est celui de l'autorité.

Le concept d'utiliser les liens comme méthode pour mesurer l'importance d'un site a

été pour une première fois utilisée par Google dans la forme du fameux algorithme

PageRank* (PR). Pour vous aider à comprendre le principe de base de cet algorithme,

je vais essayer de le résumer le plus brièvement et simplement possible.

Figure 1-4. Présentation du concept du Page Rank7

7 Matt Cutts. Straight from Google: What you need to know http://bit.ly/page-rank (consulté le

29.05.2010)

Search Engine Optmization Nicolas MESSER 17/102

Brièvement, ce concept dit que chaque lien est un vote pour le site vers lequel celui-ci

pointe, mais pas tous les liens ont un poids équivalent. Une page peut améliorer son

PR par l'accumulation de nouveaux liens de même qu'elle transmet une partie du sien

quand elle pointe un lien vers un autre site.

Google a changé et amélioré l'algorithme du PR des multiples fois dans le passé, mais

le concept de base évoqué précédemment est toujours applicable et utile à connaître

et comprendre.

L'impact des liens sur le positionnement dans les SERPs a plusieurs fois été démontré

dans le passé. L'exemple le plus fameux est sans doute celui de la page biographie de

l'ancien président des Etats-Unis, George Bush, connu sous le nom "misérable

failure"8. Ce mot-clé a été utilisé par des milliers de personnes dans le texte d'ancrage

vers la page de biographie de la maison blanche et elle s'est par la suite positionnée

en tête pour ce mot-clé pendant très long temps.

Ce phénomène qui est aujourd'hui connu sous le nom de "Google Bombing*"9 a depuis

été essayé d'être reproduit par des spammers pour influencer le positionnement de

leurs sites. Pour éviter que ceci se répète Google semble avoir invente le TrustRank*

(TR) qui s'ajoute au PR dans l'évaluation et classement des résultats.

Néanmoins l'existence et l'application de ce concept par Google est contesté et peu de

détails sont connus sur le fonctionnement par rapport au PR. Sachez donc, si vous ne

faites rien de douteux, vous n'aurez pas à vous faire de soucis à ce sujet. Nous

n'allons donc pas consacrer plus de temps à ce concept.

8 BBC News. 'Miserable failure' links to Bush http://bit.ly/miserable-failure (consulté le

23.03.2010) 9 Search Engine Land. Google Kills Bush's Miserable Failure http://selnd.com/google-bomb

(consulté le 29.05.2010)

Search Engine Optmization Nicolas MESSER 18/102

La grande question qui se pose est comment les moteurs de recherche obtiennent

toutes ces informations. C'est un processus complètement automatisé qui est effectué

par les "Spiders*", également appelés "Crawler" ou "Robots", des moteurs de

recherche. Chaque moteur dispose de spiders qui vont suivre les liens sur la toile et

faire ce travail d'indexation.

Figure 1-5. Concept du fonctionnement des Spiders

L'indexation d'un lien correspond au processus algorithmique d'analyse et de triage

dans l'index des moteurs de recherche par rapport aux facteurs d'influence du

positionnement.

Search Engine Optmization Nicolas MESSER 19/102

Voici donc en image les détails du "cycle de vie" d'une requête d'après Google.

Figure 1-6. Cycle de vie d'une requête10

En résumé, on peut donc dire que l'affichage se décompose principalement en trois

étapes.

1. L'indexation et par la suite l'extraction des pages depuis l'index qui répondent au(x) mot(s) clé(s) de la requête effectuée par l'internaute.

2. Le classement des résultats par pertinence. 3. Et finalement l'affichage.

Nous avons vu les bases pour les deux premiers points de notre liste et ce qui se

cache en dessous de l'interface utilisateur. Examinons maintenant le troisième point de

l'affichage.

10 Google. Informations sur la société : Technologie Google http://bit.ly/technologie-google

(consulté le 29.05.2010)

Search Engine Optmization Nicolas MESSER 20/102

L'interface de Google qui a été mise à jour le 4 mai de cette année et propose

beaucoup de "nouveaux" fonctionnalité ressemblant très fort à celle de Bing, le

moteurs de Microsoft.

Figure 1-7. Page de résultat de Google

La zone 1 contient les liens sponsorisés ou liens commerciaux connus sous le nom

AdWords chez Google. Parfois ce type de liens est également affiché tout au début

des SERPs. Ce sont des zones publicitaires payées par des annonceurs selon un

système d'enchères avec paiement au clic appelé PPC (Pay Per Clic).

La zone 2 représente ce qu'on appelle les liens organiques ou naturels qui sont fournis

par l'algorithme du moteur de recherche qu'on vient d'étudier. Et c'est d'ailleurs

l'espace sur lequel porterait ce mémoire dans le but de vous aider à mieux positionner

vos pages.

La zone 3 est le phénomène récent appelé "Universal Search". Dans notre exemple,

on voit un extrait de Google Maps, mais avec une autre requête nous verrons peut-être

des images, vidéos ou autres types de résultats affichés. Vous pouvez lire plus sur ce

sujet dans le 1er chapitre de la 5ème partie de ce mémoire qui est dédié au futur de

l'optimisation.

Search Engine Optmization Nicolas MESSER 21/102

Le changement apporté par Google le 4 mai 201011 est visible sur la partie gauche à

côté de la zone avec les résultats. Ceux-ci vous permettent de limiter vos recherches

sur un certain type de résultats comme les images sans devoir encore une fois

effectuer votre requête dans le moteur de recherche d'images de Google. Et beaucoup

d'autres fonctionnalités comme la possibilité de limiter les résultats affichés sur des

liens découverts dans les dernières 24 heures.

Chapitre 3 : Comment les moteurs de recherche sont utilisés par les internautes Comment procèdent les internautes? Existe-t-il un schéma qu'on a pu relever à la

majorité des recherches effectuées? Ceci était très clairement le cas dans le passé et

s'applique toujours pour une grande partie des recherches effectuées sur les moteurs.

Souvent l'internaute commence sa recherche avec un mot-clé global et petit à petit

ajoute des termes plus spécifiques pour cibler les résultats.

De comprendre le comportement des internautes n'est pas seulement un point très

important pour les moteurs de recherche qui investissent des ressources énormes

dans ce domaine pour améliorer leurs algorithmes et de servir des résultats plus précis

et plus rapides.

La facilité d'utilisation est quelque chose qui est souvent étudiée en relation avec des

interfaces graphiques de logiciels. Dans ces études l'application des outils "eye-

tracking" qui poursuit les mouvements des yeux de l'utilisateur génèrent des "heat-

map" montrant les endroits les plus focalisés par l'utilisateur. L'entreprise Enquiro a

réalisé ce même genre d'étude en analysant les SERPs des différents moteurs de

recherche. Cette étude montre que les internautes donnent beaucoup plus d'attention

aux titres et mots-clés accentués dans les résultats naturels qui s'affichent en haut de

la page. En fait, les internautes scannent les résultats affichés dans une forme qui

ressemble à la lettre F.

11 Official Google Blog. A spring metamorphosis : Google's new look http://bit.ly/google-2010

(consulté le 19.06.2010)

Search Engine Optmization Nicolas MESSER 22/102

Ce concept est souvent référence sous le terme de "Golden Triangle"12 et montre

l'importance de l'optimisation pour obtenir des meilleurs positionnements dans les

SERPs.

Figure 1-8. Le triangle d'or de Google

12 Enquiro. Enquiro Develops Google's Golden Triangle. http://bit.ly/golden-triangle (consulté le

29.05.2010)

Search Engine Optmization Nicolas MESSER 23/102

Dans ce même concept du triangle d'or, on parle également de la ligne de flottaison,

en anglais "the fold" qui commence sur la figure précédente à partir de la zone noire.

Le placement de celle-ci dépend très fort de la résolution de l'écran de l'utilisateur. Peu

importe sur quelle page de résultats votre site se positionnera, il est préférable d'être

placé en dessus de cette ligne. Encore plus parce que le nombre de liens affichés

avant la ligne de flottaison peut changer suivant l'intégration de liens sponsorisés et

des résultats verticaux s'affichant en tout début de la page de résultats.

Il a également été observé qu'on veut absolument être présent dans les premières

trente positions, donc les trois premières pages de résultats. Ceci car des études dans

le passé ont montré que très peu d'internautes dépassent cette fatidique troisième

page de résultats lors de leurs recherches.

Pourtant ces conclusions datent d'un temps ou la majorité des recherches ont été

effectuées avec un seul mot-clé. Ceci semble avoir changé dans les trois dernières

années vu que la plupart des internautes utilisent entre deux et trois mots-clés pour

leurs recherches. Ce phénomène semble être liée au désir de recevoir des résultats

plus pertinents et on en déduit que de plus en plus de personnes sont également

d'accord de consulter les pages de résultats arrières des moteurs de recherche.

Figure 1-9. Nombre de mots-clés utilisés dans une requête en janvier 201013

Conclusion (partie 1)

Les recherches qui se font par les internautes sur les moteurs comme Google sont

réalisées avec intention. L'internaute a envie de retrouver son contenu par le chemin

13 Trellian. Keyword and Search Engine Statistics. http://bit.ly/keyword-stats (consulté le

29.05.2010)

Search Engine Optmization Nicolas MESSER 24/102

direct plutôt que de tomber dessus par hasard. L'optimisation pour les moteurs de

recherche est certainement une des meilleures et plus importantes méthodes pour

atteindre les clients aujourd'hui peu importe la taille de l'entreprise en question.

Comprendre le fonctionnement et étudier le comportement des moteurs de recherche

est une partie importante du travail pour chaque référenceur sérieux. Les moteurs

changent et améliorent leurs algorithmes en permanence et il faut suivre leurs

évolutions pour avoir un succès continu et ne pas perdre de positions dans les SERPs.

On a également appris que les spiders des moteurs de recherche ne sont en principe

rien d'autre que des logiciels qui viennent inspecter votre site. Et comme tous les

logiciels, ces spiders ont des forces qu'il faudra utiliser pour faciliter leurs travaux et

des faiblesses qu'il faudra essayer de neutraliser. Il est important de comprendre que

même si vos pages on été lues par un spider cela n'est pas une garantie qu'elle sera

indexée. Mais dans le 1er chapitre de la 3ème partie de ce mémoire nous allons étudier

comment on peut vérifier si votre site a correctement été indexé par les spiders.

Apprendre tout sur les moteurs de recherche et savoir comment optimiser son site web

pour atteindre des meilleurs positionnements est un processus difficile avec l'évolution

permanente des meilleures pratiques et les nouvelles opportunités d'optimisation.

Il existe une grande quantité de sources sur le web et un vaste choix de livres sur ce

sujet. Avec le volume d'informations accessibles, il peut être difficile de séparer le bon

grain de l'ivraie et savoir suivre les bonnes consignes. Dans la suite de ce mémoire, je

présenterai le noyau dur et les bases de mes recherches à partir d'un cas d'étude avec

le site de la Haute école de Gestion (HEG) qui faciliterait votre entrée dans ce

domaine.

Malheureusement, le monde de l'optimisation est trop grand pour découvrir tous les

concepts et stratégies en détails. Mais vous retrouvez toutes mes sources dans les bas

de page et la bibliographie et je vous donnerais également les références pour les

parties qu'on n'aura pas le temps de développer en détails pour continuer votre lecture

et agrandir vos connaissances et compétences dans ce domaine.

Si j'ai appris une chose pendant mes recherches, c'est qu'il faut se méfier des gens qui

vous vendent leurs services avec l'argument de vous placer en tête des SERPs. Donc,

je ne peux pas vous promettre une montée spectaculaire de votre site web, mais je

vous assure que les pratiques dans ce mémoire répondent aux normes des moteurs

de recherche majeurs et vont vous aider dans le travail d'optimisation.

Search Engine Optmization Nicolas MESSER 25/102

Partie 2 : Le cas d'étude HEG

Comment développer un site accueillant le SEO?

L'optimisation pour les moteurs de recherche commence bien avant le vrai projet de

création d'un site web. Pourtant du travail d'optimisation sur un site déjà existent est la

situation la plus courante qu'un référenceur est amené à faire.

Mais les spécialistes du domaine confirment qu'il est beaucoup plus facile d'optimiser

un site qui n'existe pas encore au lieu d'adapter les bonnes pratiques connues à un

site qui est déjà en ligne.

Ceci ne se limite pas à la stratégie globale du site en développement, mais à nos jours

comporte également le choix d'un CMS, l'architecture et la rédaction du contenu du site

en question.

De plus, des facteurs autres que l'application des bonnes pratiques connues sont

connus pour avoir une influence sur le classement des résultats des moteurs de

recherche. Ce ne sont pas seulement les mots-clés dans le titre et la densité* des

mots-clés dans le texte principal qui font foi.

L'âge d'un site ou la relevance des liens et son texte d'ancrage vers un site font

également partie de l'algorithme de classement des moteurs de recherche. En plus,

l'autorité et la popularité générale d'un site sont aussi des facteurs qui sont pris en

considération et ceux-là ne sont souvent pas gagnés dès la mise en ligne d'un site,

mais sont atteints par le temps.

On voit que l'optimisation d'un site web comporte beaucoup d'aspects différents de la

vie d'une entreprise et nécessite la collaboration de multiples personnes (ou

départements) comme ceux du marketing ou ceux du service des ventes pour des

résultats optimaux.

Utiliser une seule stratégie ne peut avoir qu'un petit impact sur vos résultats. Appliquer

une palette des ces stratégies dans la bonne combinaison par contre peut se révéler

comme un moyen puissant dans vos efforts d'optimisation. Ceci est la raison pour

laquelle l'optimisation n'est pas seulement perçue comme une science, mais

considérée un art.

What matters is how these things are done, and understanding how far each will get you on its own, and in tandem with other strategies and tactics. – Scott Smith

Search Engine Optmization Nicolas MESSER 26/102

Chapitre 1 : Considérations avant le projet

Analyse des mots-clés

Un travail important qui précède tout travail de développement est l'analyse des mots-

clés. L'analyse des mots-clés et les sites de vos concurrents vous permettront non

seulement d'identifier les requêtes optimales, mais également d'apprendre l'une ou

l'autre chose sur vos clients virtuels.

Comme cela a été confirmé par les trois spécialistes que j'ai questionnés, l'analyse des

mots-clés peut être un travail long et suivant le contexte plutôt difficile. Par contre, les

fruits de ce travail vous apporteront un avantage dans la suite de l'optimisation de votre

site web.

Et rappelez-vous que vous ne pouvez pas optimiser un site, si vous ne savez pas pour

quel type de recherche vous aimeriez apparaître dans les premières positions et quel

est le langage utilisé par vos clients.

Une partie de ces données pourront très probablement être obtenues par les autres

départements de votre entreprise et il ne faudra pas hésiter à les utiliser en votre

faveur.

Il s'avère également de considérer des possibles fautes d'orthographe et des fautes de

frappe connues pour vos mots-clés essentiels car cela peut générer du trafic important.

Pensez seulement quand vous avez fait la dernière fois une faute de frappe ou utilisé

une orthographe incorrecte pour retrouver quelques choses avec Google dont vous ne

vous êtes plus rappelé à cent pour cent.

Un autre très bon moyen d'analyser et obtenir des mots-clés est l'outil Keyword Tool du

service AdWords proposé par Google. Cet outil peut vous générer automatiquement

des propositions de mots-clés pour votre site ainsi qu'afficher le nombre de recherches

mensuelles effectuées sur un mot-clé.

Search Engine Optmization Nicolas MESSER 27/102

D'après les trois spécialistes que j'ai pu questionner sur ce sujet, l'efficacité de cet outil

semble plutôt être contesté, par contre plutôt facile à utiliser pour celui qui aimerait

faire son analyse de mots-clés.

Et même si ces données sont dites ne pas être tout à fait exactes, Google est

certainement l'entreprise qui devra avoir une expertise avant tout le monde dans ce

domaine et il faudra donc ne pas manquer d'utiliser cet outil gratuit.

Figure 2-1. Outil de recherche mots-clés AdWords de Google

Il est hors questions que les mots-clés avec des centaines ou même des milliers de

recherches par mois semblent être plus intéressantes, mais il est important de savoir

que ces mots-clés populaires représentent effectivement seulement autour de 30% du

total des recherches effectuées sur le web.

Malheureusement, les meilleures positions de ces mots-clés sont souvent déjà

occupées par des sites avec une grande influence et il serait de ce fait beaucoup plus

difficile de placer son propre site dans la partie intéressant des SERPs.

Bien choisir ses mots-clés consiste donc à trouver un mélange entre le potentiel des

termes choisis et la faisabilité d'un bon positionnement sur ceux-ci. Il faut intégrer des

mots-clés populaires, mais ne pas oublier la masse.

Search Engine Optmization Nicolas MESSER 28/102

Ceci confirme l'importance d'une analyse de mots-clés approfondie pour obtenir un

spectre large de requêtes qui chacune tout seule ne produira pas beaucoup de visite,

mais toutes ensemble pourront représenter jusqu'à 70% des recherches effectuées

pour votre site web.

La longue traîne

Ce concept est connu sous le terme de "Long Tail*" et de multiples études ont été

consacrées à ce sujet. Mais je vous propose d'étudier la source mentionnée dans le

pied de page pour plonger plus profondément dans ce sujet de la longue traîne.

Figure 2-2. Le principe du "Long Tail"14

J'ai réalisé une analyse de mots-clés pour notre cas d'étude de la HEG où j'ai

également analysé "les concurrents" et essayé de trouver des mots-clés faisant partie

du concept du "Long Tail".

14 Wired, Chris Anderson. The Long Tail. http://bit.ly/the-long-tail (consulté le 29.05.2010)

Search Engine Optmization Nicolas MESSER 29/102

Analyse mots-clés de la HEG

Dans un premier temps il faudra mentionner que les mots-clés représentatifs pour la

HEG sont presque tous de haute concurrence et que les mots-clés actuellement

choisis représentent assez bien les mots retrouvés sur les différentes pages du site de

la HEG. Voici donc la liste des mots-clés actuels du site de la HEG.

Mot-clé Concurrence Recherches mensuelles HEG élevée 74 000 Haute école de gestion de Genève - 73 HES élevée 1 000 000 HESGE - 6 600 Genève élevée 1 830 000 Suisse élevée 9 140 000 informatique de gestion élevée 60 500 économiste d'entreprise - 320 spécialiste en information documentaire - 28 Business Administration with a Major in International Management - <10

master élevée 68 000 000 bachelor élevée 7 480 000 MAS élevée 55 600 000 CAS élevée 5 000 000 EMBA élevée 450 000 DAS élevée 68 000 000 école supérieure élevée 49 500 formation élevée 13 600 000

Pour trouver des mots-clés qui pourront faire partie de la longue traîne, j'ai soit

composé des mots-clés existants, soit interrogé le site de la HEG pour retrouver des

possibles mots-clés pertinents non utilisés.

Le but de ce travail d'analyse est d'identifier des mots-clés qui on une concurrence

moyenne ou faible, mais quand même un nombre de recherches mensuelles assez

élevés. Un meilleur positionnement dans les SERPs de ces mots-clés pourrait

éventuellement être atteint plus rapidement et plus facilement.

Search Engine Optmization Nicolas MESSER 30/102

Voici donc la liste des mots-clés correspondants que j'ai pu identifier.

Mot-clé Concurrence Recherches mensuelles Haute école de gestion - 1 000 formation hes faible 480 économie d'entreprise moyenne 5 400 recherche appliquée moyenne 2 900 mba suisse moyenne 880 bachelor informatique moyenne 880 bachelor gestion moyenne 1 900 information documentaire moyenne 2 400 formation documentaire moyenne 2 900 formation bilingue moyenne 1 300 enseignement bilingue moyenne 1 300 interdisciplinaire moyenne 12 100 crédits ects moyenne 8 100 système bologne - 110 échange erasmus moyenne 390 cap manager faible 2 900

Quelle est l'utilité de ces informations qu'on a obtenues à partir de cette analyse des

"concurrents" et des mots-clés?

Premièrement, j'ai pu constater que la majorité des sites web des autres Hautes écoles

du réseau HES-SO n'utilisent pas les métas informations description ou/et keywords.

Nous allons parler de la balise description dans le 2ème chapitre de cette partie en plus

de détails. Voici l'extrait du code HTML du site de la Haute de gestion de Fribourg qui

nous dévoile que les mots-clés sont ignorés.

<title>Haute école de gestion - Fribourg :: </title>

<meta name="description" content=""/>

<meta name="keywords" content=""/>

L'inefficacité de cette balise dans le code pour l'optimisation d'une page web pourrait

être la source de ce phénomène. Ceci a également été confirmé par les trois

spécialistes que j'ai questionnés dans le cadre de mon mémoire.

Search Engine Optmization Nicolas MESSER 31/102

Dans le cas de la HEG Fribourg, cela semble tout simplement être oublié comme m'a

confirmé le responsable de l'équipe web pendant notre entretien téléphonique.

Par contre, ce travail d'analyse n'est pas du temps perdu. Il est même très important de

connaître ces mots-clés car dans l'optimisation dans les balises de titre, les balises

d'en-tête (h1, h2, etc.) et le contenu ce travail vous permettra de placer ces mots-clés à

des endroits stratégique importants.

"Doing keyword researches, and on-page SEO, are categories of work, not tactics. There are hundreds of keyword research tactics, and thousands of on-page tactics, and my personal experience is that very few people either know them all or do most or them well." – Scott Smith

Choix du nom de domaine

Un autre point à prendre en considération est le nom de domaine et son extension.

Utiliser le nom de votre entreprise ou une combinaison de mots-clés proche à votre

activé est indispensable.

Avoir un nom de domaine propre est certainement quelque chose que la HEG pourrait

améliorer. Notre autre exemple, la Haute de gestion de Fribourg, utilise par exemple le

nom de domaine http://www.heg-fr.ch.

J'ai fait une demande chez Switch pour enregistrer le nom de domaine http://www.heg-

ge.ch, mais ce nom de domaine est déjà enregistré. Par une recherche Whois15, j'ai pu

identifier que le détenteur est les Hautes écoles spécialisées Genève. J'imagine donc

que ce changement est peut-être déjà prévu dans le futur.

Dans le cas d'une organisation internationale, il peut être une bonne idée d'acheter le

même nom de domaine avec plusieurs extensions (.com, .fr, .ch) et de mettre en place

une redirection 301 pour avoir les meilleurs résultats possibles dans les recherches

locales.

15 who.is. Informations du nom de domaine heg-ge.ch http://bit.ly/whois-heg

Search Engine Optmization Nicolas MESSER 32/102

Bien sûr le site d'une telle organisation peut être différent suivant le pays et dans ce

cas le processus d'optimisation devient plus complexe. Il existe une différence entre

l'optimisation et le déploiement d'un site pour plusieurs pays différents ou pour un pays

comme la Suisse où nous avons plusieurs langues nationales.

Le premier cas est connu sous le terme "Geo Trageting16" et pour le deuxième cas il

n'existe pas de terme officiel, mais le terme "Multi-Language Countries Targeting17" est

souvent retrouvé sur le web. Nous n'aurons pas plus de temps d'entrer en matière sur

ce sujet dans le cadre de ce mémoire, mais je vous suggère de consulter les deux

articles du Search Engine Journal pour commencer votre lecture.

D'après les dernières connaissances, l'âge du nom de domaine (la durée depuis

laquelle le nom de domaine est enregistré) semble également avoir une influence sur

le positionnement dans les SERPs. Donc si vous avez une idée pour un projet pour

lequel vous pensez mettre en place un site internet, il peut être utile de réserver le nom

de domaine même si vous n'allez pas vous en servir de suite.

Récemment, Google a annoncé18 que le temps de réponse de votre site web est

également évalué. Ceci étant quelque chose qui ne sera probablement pas sous votre

contrôle direct, il est donc important de bien étudier les différentes offres

d'hébergement pour être du bon côté au niveau technique ou d'en parler à vos

spécialistes informatique.

16 Search Engine Journal, Ann Smarty. What's Most Effective for Geo Targeting?

http://bit.ly/geo-targeting (consulté le 21.06.2010) 17 Search Engine Journal, Ann Smarty. SEO Case Study : Dealing With Multi-Language

Countries Targeting http://bit.ly/multi-language (consulté le 21.06.2010) 18 Official Google Webmaster Blog. Using site speed in web search ranking http://bit.ly/google-

speed (consulté le 22.06.2010)

Search Engine Optmization Nicolas MESSER 33/102

Chapitre 2 : Applications des Best Practices Ce n'est pas par hasard que j'ai choisit de faire le tour des best practices. Il est

important de connaître les directives et recommandations des moteurs de recherche

pour réaliser des bons résultats peu importe si vous êtes un apprenti ou spécialiste du

domaine. Finalement pour une grande partie, ce sont les moteurs de recherche qui

déterminent les règles et vont vous fournir des visiteurs. Il est donc incontournable de

suivre ces meilleures pratiques le plus près possible.

On distingue généralement deux types19 de facteurs d'influence dans l'optimisation

d'un site web. "Off page", les optimisations que vous pouvez adopter sans même

travailler sur les pages de votre site comme nous l'avons en partie vu dans le 1er

chapitre de cette partie du mémoire. Et "On-page", les optimisations que vous faites

pour les pages de votre site pour les positionner par rapport aux mots-clés du contenu.

Dans la suite de notre cas d'étude de la HEG, nous allons nous concentrer sur les

optimisations "On-site" de bases car nous n'aurons pas le temps d'entrer en détails sur

tous les aspects du processus d'optimisation.

Le site www.archive.org, connu sous le nom "Wayback Machine", m'a permis d'aller

consulter l'état du site de la HEG avant les derniers changements apportés.

Figure 2-3. Site HEG avant 2010

19 Direct Media Traffic. Off Page Optimization VS On-Page Optimization http://bit.ly/off-on-page

(consulté le 22.06.2010)

Search Engine Optmization Nicolas MESSER 34/102

Par la suite nous allons nous référencer au site de la HEG actuel et également faire

des remarques par rapport aux changements apportés depuis la dernière version.

Figure 2-4. Site HEG actuel

La balise <title>

Le placement de mots-clés dans le titre de la page est un des éléments le plus

important dans le classement des pages web. En effet cette information qui se trouve

dans la partie <head> du code HTML est le seul méta tag qui est pris en considération

pour identifier la pertinence par rapport aux recherches effectuées.

<title>Haute école de gestion de Genève - Bienvenue à la

HEG</title>

Il est recommandé que les titres aient une longueur maximale de 64 caractères

(espaces comprises), même si Google affiche effectivement 66 caractères. Un plus

long titre ne pénalisera pas votre positionnement, mais les internautes ne pourront

peut-être lire que les premiers 66 caractères de votre titre suivi de trois points dans ce

cas.

Search Engine Optmization Nicolas MESSER 35/102

En plus, le titre devra être le plus pertinent possible par rapport au contenu de la page.

Donc assurez vous qu'au moins une partie des mots-clés, si pas tous, peuvent aussi

être retrouvés dans le contenu de la page.

La balise Meta <description>

Même si le méta tag qui fournit la description pour une page de votre site ne fait plus

foi dans l'évaluation de la pertinence, il peut quand même être bénéfique pour vous de

lui consacrer un peu de temps.

La description est le petit extrait qui s'affiche en plus du titre dans les SERPs et peut

convaincre un internaute à cliquer sur votre lien ou de choisir un autre résultat de la

liste.

La longueur maximale pour la description est de 155 caractères (espaces comprises)

et il semble que Google affiche effectivement 160 caractères avant de couper le texte.

Il est donc important que le texte pour les deux métadonnées soit clair et précis tout en

donnant le plus d'informations pertinentes à l'internaute qui a effectué la recherche.

Voici les métadonnées description du site de la HEG.

<meta content="Haute école de gestion de Genève - Bienvenue

à la HEG" name="Description">

Si on analyse ces métadonnées, on peut identifier un potentiel d'amélioration. Le titre

est clair et contient tout les mots-clés importants pour la HEG avec le nom complet. La

seule chose qu'on pourrait changer est de mettre en avant le nom en anglais au lieu du

"Bienvenue à la HEG", comme il est fait dans le logo du site.

Search Engine Optmization Nicolas MESSER 36/102

Personnellement, je pense que les métadonnées de la description ne sont pas

efficaces du tout. Le titre est tout simplement répété et on peut voir que Google a

ajouté une information supplémentaire depuis la page d'accueil qui ne contient pas

beaucoup de mots-clés signifiants.

Figure 2-5. Extrait du site de la HEG sur la page de résultat de Google

Ce schéma peut être observé sur toutes les pages du site de la HEG et j'en tire la

conclusion que les métadonnées sont probablement générées automatiquement ou

ignorées. Il serait donc recommandable d'améliorer ce processus pour ajouter plus de

précision pour les internautes.

Pendant mon entretien avec Madame Murbach, conceptrice Web de la HEG, mes

observations ont été confirmées. Ceci est effectivement encore un travail en cours

depuis la mise en ligne de la nouvelle version du site de la HEG.

Propositions d'amélioration des balises <title> et <description>

Sur l'ancienne version du site de la HEG cette balise était mieux renseignée. Voici

l'extrait du titre qui était clair et précis et contenait le mot-clé HES en plus.

<title>HEG - Haute Ecole de Gestion de Genève (HES)</title>

Voici une proposition d'un titre optimisé qui prend en compte le nom de l'école en

français et en anglais comme on le trouve dans le logo sur le site actuel de la HEG.

<title>Haute école de gestion de Genève - Geneva School of

Business Administration</title>

Pourtant cette proposition permettra d'ajouter quelques mots-clés anglais, le titre

compte 75 caractères et une partie sera donc coupée dans la page des résultats.

Search Engine Optmization Nicolas MESSER 37/102

La balise de description n'a pas changé dans les deux versions du site de la HEG.

Voici une proposition pour la description avec 142 caractères à partir de laquelle

l'internaute pourrait avoir une meilleure idée sur l'activité de la HEG dans les SERPs.

<meta content="La Haute Ecole de Gestion de Genève (HEG)

s’adresse aux étudiants qui veulent une formation

universitaire de haut niveau axée sur la pratique."

name="Description">

Voici une autre proposition d'optimisation de la description avec 158 caractères qui

pourrait être intéressante dans le cas de la HEG car elle intègre directement les

informations de contact.

<meta content="La Haute Ecole de Gestion de Genève, Campus

de Batelle, Batîment F, 7 route de Drize, 1227 Carouge -

Tél. +41 22 388 17 00 (Lun au Ven de 8h-12h et 13h30-17h)"

name="Description">

Les balises d'en-tête

Les balises d'en-tête ne sont pas seulement un outil visuel, mais permettent de créer

une structure hiérarchique pour votre site et contenu. Il existe six tailles d'en-tête, de la

balise <h1>, la plus importante jusqu'à la balise <h6>.

Il est important de respecter quelques "règles" pour pouvoir tirer le plus grand

avantage des ces balises d'en-tête. La balise <h1> est le titre principal d'une page et

ne devra pas être utilisé plus d'une fois sur la même page. Les autres balises <h2> à

<h6> peuvent être utilisées plusieurs fois, mais il faut faire attention de respecter

l'ordre hiérarchique imbriqué avec les répétitions.

En analysant le site actuel de la HEG pour notre cas d'étude, j'ai observé que la balise

<h1> est seulement résignée par une image (le logo de la HEG).

Search Engine Optmization Nicolas MESSER 38/102

Figure 2-6. Balise d'en-tête <h1> du site actuel de la HEG

Ceci n'était pas le cas avec l'ancienne version du site, et la HEG laisse passer un

moyen extrêmement simple et efficace de placer des mots-clés pour un bon

positionnement dans les SERPs.

Figure 2-7. Balise d'en-tête <h1> de l'ancien site de la HEG

Search Engine Optmization Nicolas MESSER 39/102

Propositions d'amélioration de la balise <h1>

La solution actuelle sera acceptable seulement une fois que Google est les autres

moteurs de recherche sont capables de reconnaître les caractères dans des images

(traité plus en détails dans le 2ème chapitre de la 5ème partie du mémoire qui est

consacré aux futur de l'optimisation).

Je recommande donc très fortement d'ajouter du vrai texte dans la balise <h1> et de le

faire disparaître avec des instructions CSS. Cette petite astuce permettra aux spiders

des moteurs de recherche d'indexer le texte de la balise et en même temps de le

cacher pour les internautes.

De plus, je propose d'optimiser le texte alternatif de l'image de "HEG" à "Haute école

de gestion de Genève" (plus de détails concernant le sujet dans la section

"Optimisation des images").

L'optimisation des liens

Le texte d'ancrage des liens internes est une bonne opportunité pour utiliser des mots-

clés significatifs plutôt que des textes comme "cliquer ici" qu'on retrouve souvent sur

des différents sites web.

Voici l'exemple d'un lien du site de la HEG lesquels me semble être généralement bien

optimisés.

<a href="/heg/formation-base">Formation de base</a>

Une chose qui pourrait être améliorée est l’ensemble des liens de la partie "Actualité

HEG". Tous les liens ont le même texte d'ancrage, ce qui n'est pas très utile. Voici

l'extrait de code pour la nouvelle "Une recherche HEG récompensée par le Prix

ARDITI" du 15 juin 2010.

<a class="link-web" title="lien internet"

href="/heg/actualites/2010/20100615.asp">Plus d'info</a>

Search Engine Optmization Nicolas MESSER 40/102

Voici l'extrait de code pour le lien de l'annonce de la formation continue de CISCO de

l'ancienne version du site de la HEG où le texte d'ancrage a été mieux renseigné.

<span class="textept"><br> > plus d'info [<a

href="http://www.hesge.ch/heg/cisco">site CISCO

HEG</a>]</span>

Ceci est à prendre en considération pour la structure des URLs (expliqué en détails

dans la partie "La structure des URL") qui est construit principalement par les noms de

ces fichiers..

Ce principe s'applique également aux fichiers PDF (et toute autre type de fichiers) qui

sont également indexés et référencés par les moteurs de recherche.

La grande majorité des fichiers PDF qu'on peut retrouver dans cette partie du site de la

HEG ont des noms plus pertinents contenant des mots-clés plutôt que la date de

publication comme nous l'avons vu avec l'exemple précédent.

Construction des liens

Comme nous l'avons appris dans l'introduction beaucoup d'autres facteurs font foi

dans l'évaluation d'un lien comme l'autorité et sa pertinence. L'optimisation des liens

interne est importante, mais avoir des liens depuis un autre site est toujours une bonne

affaire.

Cette stratégie est appelée "Link Building*" et souvent confondue avec le PPC (pay per

click). L'efficacité des liens sponsorisés ou achetés est un sujet controversé dans le

monde de l'optimisation et ne sera pas traité plus en détails dans ce mémoire.

Search Engine Optmization Nicolas MESSER 41/102

Figure 2-8. Abstraction du concept Link Building

Mais réfléchir comment vous pourriez obtenir un lien pertinent ou avec qui vous

pourriez faire un échange de liens fait partie de l'optimisation de votre site web. Dans

le cas de la HEG qui fait partie du réseau HESSO des liens entre les différents sites

des Hautes écoles genevoises dans la partie "footer" pourrait être une option.

Figure 2-9. Application possible du link building pour le site de la HEG

Cette stratégie est par exemple employée par les sites du réseau des Hautes écoles

de Fribourg.

La seule chose qu'il faut se rappeler est que 100 liens du même nom de domaine sont

moins efficaces qu'un lien de 100 noms de domaines différents. Ce n'est donc pas la

quantité, mais la qualité des liens vers votre site qui est importante.

Search Engine Optmization Nicolas MESSER 42/102

L'optimisation des images

Nous avons déjà parlé de l'importance du nom de fichiers dans la partie de

l'optimisation des liens qui s'applique également pour les images. Ceci est donc le

premier élément qui nous permet de placer des mots-clés et d'en tirer un bénéfice pour

le positionnement.

L'autre élément des images qui permet de faire la même chose est l'attribut "alt". C'est

le texte alternatif qui sera affiché au cas où l'image rencontrait des problèmes pendant

le chargement.

Lors de ma proposition d'optimisation pour la balise d'en-tête <h1>, nous avons

également vu l'exemple du logo de la HEG. Voici l'extrait de code pour cette image.

<img alt="HEG" src="/heg/img/heg-logo.gif">

Au premier coup d'œil cette image semble être en ordre, mais on peut toute fois

l'optimiser dans le contexte de la HEG. Voici le même extrait de code optimisé.

<img src="/heg/img/heg-geneve.gif" alt="HEG - Haute école

de gestion de Genève">

On peut constater que j'ai apporté deux optimisations à part de l'ordre des instructions

qui ne devra pas avoir d'importance. J'ai ajouté le mot-clé "geneve" au nom du fichier

et plusieurs mots-clés par l'ajout du nom complet de la HEG.

Le plan du site

La création d'un plan du site, appelé sitemap, surtout en format XML peut aider à

augmenter le nombre de pages indexées par les spiders des moteurs de recherche,

mais n'aidera pas directement à votre positionnement.

Il existe deux types de plan du site différents. Celui pour les humains, que l'on retrouve

également sur le site de la HEG, et celui pour les spiders de moteurs de recherche.

Search Engine Optmization Nicolas MESSER 43/102

Figure 2-10. Extrait du code d'un sitemap exemple en format XML20

Je viens d'expliquer l'importance du plan site pour les spiders, lequel n'est pas existent

pour le site de la HEG, mais le deuxième type n'est pas moins important car il permet à

vos utilisateurs de rapidement et directement accéder aux informations dont ils ont

besoin.

En fait, il faut penser en proximité pour bien comprendre le concept du plan de site. Un

click depuis la page d'accueil vers le plan du site et un deuxième pour atteindre

n'importe quelle autre page – du caviar pour les spiders des moteurs de recherche!

Figure 2-11. Plan du site HEG

20 Sitemaps.org. What are Sitemaps? http://bit.ly/sitemap-xml (consulté le 29.05.2010)

Search Engine Optmization Nicolas MESSER 44/102

Arborescence d'un site

L'implémentation du plan du site, fait également du sens si on considère toujours que

le nombre de clicks associés à un lien toujours est un facteur important dans le

processus d'optimisation.

Même si les avis de mes trois experts ne pourront pas se différencier plus sur ce sujet,

l'idée du concept en général semble plutôt claire et Google semble quand même y

mettre un peu d'importance21.

Utilisation du fichier robots.txt

Le fichier robots.txt doit être placé à la racine de votre site et le nom du fichier doit

absolument être en minuscule et en format texte. Si ce fichier se trouve dans n'importe

quel autre endroit sur votre serveur ou dans un autre format, il ne sera pas pris en

compte par les moteurs de recherche.

L'impact du fichier robots.txt22 est contesté parce qu'une mauvaise instruction dans ce

fichier pourrait priver une partie ou la totalité de votre site de l'indexation par les

spiders des moteurs. Sachez donc, où mettre les pieds avant d'appliquer n'importe

quoi dans ce fichier pour votre site.

21 Google Webmaster Blog. Importance of link architecture. http://bit.ly/link-depth (consulté le

23.06.2010) 22 Robotstxt.org http://bit.ly/fichier-robots (consulté le 29.05.2010)

Search Engine Optmization Nicolas MESSER 45/102

Figure 2-12. Principe du fichier robots.txt

Mais d'après mes recherches et mes expériences personnelles, il n'y a pas encore de

technologie équivalente qui pourrait remplacer ce fichier à l'heure actuelle. Et l'avis de

mes trois spécialistes montre quand même un effet plutôt positif avec une bonne

application.

De plus, cette méthode est incontestée dans la protection contre du contenu dupliqué23

(sujet que nous n'aurons pas le temps de traiter en plus de détails) et un moyen

efficace et facile de fournir votre plan du site, donc les liens vers votre contenu, aux

Spiders des moteurs de recherche.

Figure 2-13. Fichier robots simple du site Abondance

23 Google Webmaster Tools Help. Duplicate content. http://bit.ly/contenu-duplique (consulté le

29.05.2010)

Search Engine Optmization Nicolas MESSER 46/102

Je n'ai pas pu trouver un fichier XML appliqué dans le cas de la HEG. Il serait donc

recommandable de vérifier le rythme d'indexation dans les Google Webmaster Tools

(si la HEG dispose d'un compte pour les services Google) et dans le cas échéant créer

un tel fichier pour le site de la HEG.

La structure des URL

Si vous utilisez un CMS ou faites appels à une base de données pour afficher une

partie du contenu de votre site web, il se peut que vous vous retrouvez avec des liens

dynamiques. Ceci est le cas de l'annuaire des collaborateurs qui peut être consulté sur

le site de la HEG.

Les paramètres dans l'url pourraient désorienter les moteurs de recherche et il est

préférable d'utiliser des liens statiques. La situation aujourd'hui semble être que les

moteurs de recherche n'ont pas de problème, si votre URL ne contient pas plus de

trois de ces paramètres, ce qui est le cas pour le site de la HEG.

Pourtant si vous hébergez votre site sur un serveur Apache24, le module mod_rewrite

supporte cette technique par l'ajout des instructions nécessaires dans le fichier

.htaccess. Le URL rewriting est également possible avec le ASP25, la technologie

utilisée pour le site de la HEG, mais est un peu plus avancée que sous Apache.

Cette optimisation pourrait également vous permettre de placer quelques mots-clés

dans vos URLs ce qui peut améliorer le positionnement de vos pages.

24 Apache Software Foundation. Apache Module mod_rewrite. http://bit.ly/mod-rewrite (consulté

le 29.05.2010) 25 Microsoft. URL Rewriting in ASP.NET. http://bit.ly/asp-rewrite (consulté le 29.05.2010)

Search Engine Optmization Nicolas MESSER 47/102

Proposition d'amélioration de la structure URL

Dans l'exemple de l'URL choisi précédemment, c'est l'entrée de mon directeur de

mémoire, Alexandre Boder, qui est référencé par l'identifiant 35. Une URL optimisée

pourrait avoir l'apparence suivante.

Faciliter la navigation

Depuis la nouvelle version du site de la HEG ce point semble avoir été amélioré. Sur

l'ancien site le premier niveau depuis la page d'accueil était bien accessible, mais de

trouver plus de détails était de loin une tâche facile. Le site actuel permet d'accéder à

tous les détails en quelques cliques.

En plus l'implémentation d'un fil d'Ariane (en anglais "breadcrumbs*") permet de

retourner facilement dans les différents niveaux du site.

Respect des standards W3C

Avoir du code qui valide avec les standards du consortium W3C* et avoir un site

accessible qui répond à l'initiative WAI n'est pas un critère dans l'établissement des

classements par les moteurs de recherche, mais ce dernier est inclu dans les lois de

plusieurs pays et ne peut donc pas être complètement ignoré.

Pour les institutions Suisses c'est l'article 10 de l'Ordonnance sur l’élimination des

inégalités frappant les personnes handicapées qui fait foi.26

26 Art. 10 Ohand, RS 151.31 http://bit.ly/rs-art-10

Search Engine Optmization Nicolas MESSER 48/102

Joost de Valk, spécialiste d'optimisation, a publié un article27 sur ce sujet le 13 juin

2010, lequel résume bien la problématique qui se pose avec les standards du

consortium W3C. De manière générale et d'après le message vidéo de l'employé

Google, Matt Cutts, dans le même article cela n'apporte aucun avantage pour le

positionnement de votre site.

Par contre, si vous faites appel au service d'optimisation d'un spécialiste pour votre

site, vous pouvez attendre que le nombre d'erreurs soit réduit au minimum.

Le consortium W3C met à disposition un service28 pour valider son code HTML. Si on

fait valider le site actuel de la HEG on obtient en retour 32 erreurs lesquelles sont

principalement liées au service AddThis et au widget de Facebook qui sont utilisés sur

les pages du site.

Figure 2-14. Résultat de la validation W3C

Proposition d'autres améliorations

En analysant le site de la HEG, j'ai identifié deux autres points qui ne sont pas

directement en rapport avec le sujet de ce mémoire, mais qui pourront améliorer la

perception et l'expérience des visiteurs du site.

27 Joost de Valk. W3C Validation & SEO. http://bit.ly/w3c-validation-seo (consulté le

23.06.2010) 28 W3C. Markup Validation Service http://bit.ly/w3c-validation

Search Engine Optmization Nicolas MESSER 49/102

Premièrement, sur la page "Contact" l'ajout d'un formulaire qui permettra aux

internautes de remplir une demande de contact directement sur le site pourrait

éventuellement augmenter le nombre de prise de contact. Le fait de devoir ouvrir un

logiciel de messagerie ou copier l'adresse souhaitée dans le champ destinataire d'une

interface web d'un service de messagerie peut représenter un obstacle pour les

internautes.

Le deuxième point concerne la section avec les témoignages d'étudiant-es. Je pense

que cette partie du site est spécialement importante pour attirer des nouveaux

étudiants. Avoir des portraits est une bonne idée, mais peut-être une sorte de blog par

les étudiants de la HEG avec leurs expériences tout au long de l'année académique

pourrait intéresser beaucoup de monde et aider à convaincre des futurs étudiants.

Chapitre 3 : "Black hat" – les stratégies à éviter Les stratégies artificielles d'optimisation, plus couramment connues sous le nom "black

hat*" et jugées non éthiques ont pour but de tromper les moteurs de recherche et de

propulser le positionnement d'un site web dans les SERPs.

Des multiples stratégies de spamming avec des approches différentes ont été utilisées

dans le passé pour améliorer la visibilité d'un site web. Certaines ont connu plus de

succès que d'autres, en appliquant plus ou moins le même concept de fournir du

contenu non relevant par rapport aux mots-clés recherchés.

Commençons ce chapitre par une technique qui est souvent employée par les

développeurs web. Ce sont des éléments HTML cachés29. L'utilisation de cette

technique peut avoir plusieurs raisons qui ne sont pas forcements considérés comme

mauvais. Les menus déroulants emploient même presque tous cette technique. Dans

ce cas il semble évident que votre intention n'est pas de faire indexer des mots-clés ou

du texte caché qui pourront aider à votre positionnement. Mais malheureusement,

cette technique est de plus en plus abusée pour ce genre de chose et il circule des

rumeurs que Google n'index plus ces éléments HTML cachés.

29 Google Webmaster Central. Hidden text and links. http://bit.ly/hidden-text (consulté le

26.06.2010)

Search Engine Optmization Nicolas MESSER 50/102

Une autre technique qui n'appartient pas à cette catégorie mais a les mêmes effets

sont les fonctionnalités proposées par le JavaScript et Ajax. L'utilisation de ces

techniques permettra par exemple de rafraîchir une partie de votre site web sans

devoir rafraîchir la page entière. Le problème avec ces fonctionnalités est que les

spiders des moteurs de recherche ne vont pas exécuter le JavaScript nécessaire pour

accéder à ce contenu. Il faut donc être sûr de maitriser cette technologie à fin d'éviter

que votre site soit incorrectement indexé.

Passons donc aux techniques qui auront avec une très grande possibilité pour

conséquence une punition chez les moteurs de recherche et donc une influence pour

votre positionnement actuel ou même l'exclusion des SERPs dans des cas extrêmes.

Une stratégie d'optimisation qui s'est prouvé extrêmement efficace dans le passé est le

"Cloaking*".

Figure 2-15. Représentation visuelle du Cloaking

Search Engine Optmization Nicolas MESSER 51/102

L'idée derrière cette stratégie est de présenter des contenus différents pour les vrais

visiteurs de vos sites et les spiders des moteurs de recherche. Malheureusement, ceci

a aussi été largement repris par les spammers et abusé excessivement dans le passé

et est donc devenu un tabou dans le monde de l'optimisation.

Pourtant, il y a des experts dans le domaine qui disent qu'il est toujours possible

d'utiliser cette stratégie avec prudence30, mais la position31 des moteurs de recherche

à ce sujet est très claire et les possibles punitions ne valent pas la peine de prendre le

risque.

L'autre stratégie qui a souvent été utilisée surtout en relation avec des produits

pharmaceutiques est connue en anglais sous "Doorway pages*". Le terme français est

l'utilisation des pages satellites qui a pour but d'utiliser une page extrêmement

optimisée pour un certain mot-clé tout en appliquant une redirection vers la page

officielle qui souvent n'a rien en commun avec le sujet de cette dernière.

Une stratégie qui a été utilisée dans le passé, mais qui est dite de ne plus avoir

d'impact du tout, est l'accumulation des mots-clés. Ceci semble être le cas déjà pour

un certain moment et se confirme au moment où la balise méta des mots-clés a été

ignorée par les moteurs de recherche. Pourtant, je pense qu'il faudra toujours mettre

un œil sur ce point parce que Google a toujours une entrée32 dans l'aide pour les

webmasters, qui dit que ce comportement peut influencer votre positionnement.

Conclusion (partie 2)

Maîtriser le travail d'optimisation d'une part est seulement possible avec une

compréhension profonde des directives et bonnes pratiques du domaine et nécessite

de la patience.

Avoir du succès avec l'optimisation d'autre part, nécessite une compréhension

approfondie de l'entreprise en question. Quels sont les biens et services ou encore

informations que vous avez à offrir?

30 SEOmoz, Rand Fishkin. White Hat Cloaking: It Exist. It's Permitted. It's Useful.

http://bit.ly/white-cloaking (consulté le 26.06.2010) 31 Google Webmaster Central. Cloaking, sneaky JavaScript redirects, and doorway pages.

http://bit.ly/google-cloaking (consulté le 26.06.2010) 32 Google Webmaster Central. Keyword stuffing. http://bit.ly/stuffing-keywords (consulté le

26.06.2010)

Search Engine Optmization Nicolas MESSER 52/102

L'analyse des mots-clés qui devrait précéder chaque projet de création d'un site web

est un travail complexe, long et souvent pénible, mais la récompense potentielle est

très grande. Une fois ce travail de réflexions accomplit, vous pouvez commencer à

réfléchir sur l'architecture et le développement de votre site.

Avoir du contenu avec le plus de mots-clés possibles était la façon d'optimiser les sites

web dans le passé. Des indicateurs comme la densité des mots-clés sont apparus pour

évaluer le niveau d'optimisation du contenu d'un site. Aujourd'hui toujours efficace, ces

indicateurs ont beaucoup moins d'influence sur le positionnement dans les SERPs et

ne sont dans aucun cas une assurance pour avoir des visiteurs satisfaits.

Ceci ne veut pas dire qu'il ne faut pas utiliser quelques-uns de vos mots-clés dans vos

pages, mais rédiger votre contenu surtout pour les visiteurs de votre site et non pas

pour les moteurs de recherche.

Si vos efforts ne vous permettront pas de vous placer dans les meilleures positions des

SERPs, vous succomberez peut-être à la tentation d'utiliser des stratégies artificielles

d'optimisation.

Le référencement "black hat" vise pour des résultats immédiats en trompant les

moteurs de recherche. Avant de passer à ces stratégies, prenez en considération

qu'une punition pour votre site par les moteurs de recherche est très probable dans ce

cas de figure.

Il se peut que vous violiez les recommandations par les moteurs de recherche sans le

savoir car il existe une zone grise dont les frontières sont passablement brumeuses.

Les moteurs de recherche sont conscients des stratégies existantes, mais ne peuvent

pas connaître vos intentions.

De plus, si votre unique but est simplement d'augmenter le nombre de visiteurs de

votre site, il existe des moyens comme le PPC dont vous n'aurez pas à craindre

d'inconvénient en les appliquant.

Search Engine Optmization Nicolas MESSER 53/102

Même si les moteurs de recherche n'ont pas pu découvrir votre intention, vos

concurrents ou des webmasters malveillants ont la possibilité de vous dénoncer à tout

moment.

Figure 2-16. Formulaire pour annoncer du spam à Google33

Et une fois attrapé, il est dit difficile de regagner la confiance des moteurs de

recherche. Garder donc la distance des stratégies artificielles pour avoir le moins de

risques et le plus de résultats possibles sur le long terme.

33 Google Webmaster Tools. Spam report http://bit.ly/spam-report

Search Engine Optmization Nicolas MESSER 54/102

Partie 3 : Le suivi et l'évaluation des résultats Un des plus grands défis dans le suivi et l'évaluation des efforts d'optimisation est le

délai important entre l'implémentation et le recueil des résultats. En général, les

premiers résultats peuvent être visibles environs 24h plus tard, mais pour avoir une

collection pertinente de données utilisables, des semaines ou même des mois sont

nécessaires.

Mais certains des outils peuvent être utilisés dès le début pour contrôler le travail de

base pour l'optimisation d'un site web.

En fait, les moteurs de recherche sont les outils les plus basiques à disposition des

spécialistes du référencement. La majorité des moteurs disposent d'une boîte à outil

riche qui permet de réaliser des recherches avancées, faire des interprétations et

procéder à des analyses des concurrents. Nous allons découvrir les commandes mises

à disposition par Google et d'autres outils plus avancés en plus de détails dans le

chapitre inutile "Comment suivre les stratégies mise en place".

Google favorise l'affichage de contenus divers dans les SERPs grâce à une méthode

appelée "Query Derserves Diversity (QDD)"34. On peut anticiper de cela que pour avoir

des bons résultats, spécialement chez Google, il faudra un travail plus conséquent. Le

terme anglais souvent utilisé en rapport pour ce genre de travail est "Reputation

Management ou Branding".

Le suivi de la réputation de sa marque, peut donc représenter une autre partie

importante du suivi de l'optimisation. Si tout a bien fonctionné, vos efforts d'optimisation

auront attribué une plus grande attention à votre marque sur le web. En même temps

que cela peut être positif et exactement ce que vous avez voulu, cela a certainement

aussi attiré l'attention de ceux qui vous aiment un peu moins. Il se peut donc qu'en

même temps que l'intérêt pour votre entreprise est devenu plus importante, les voix

négatives se soient multipliées de leur côté.

Pour l'identité de votre entreprise, il est critique de trouver ces résultats, et une fois

identifiés de les traiter avec prudence et certitude. Des exemples dans le passé ont

montré deux scénarios. Celui où l'absence d'une réaction adaptée a eu un impact

énorme sur la réputation de l'entreprise en question.

34 SEOmoz, Rand Fishkin. Does "Query Deservse Diversity" Algorithm Exist at Google?

http://bit.ly/query-diversity (consulté le 26.06.2010)

Search Engine Optmization Nicolas MESSER 55/102

Ou alors l'inverse ou la perception et l'image de l'organisation se sont améliorées chez

le grand public grâce à une réaction à temps et appropriée.

L'exemple par excellence vient de l'entreprise américaine Blendtec avec leur

campagne "Will it blend"35 qui est même apparu dans le Bloomberg Business Week.36

Chapitre 1 : Comment suivre les stratégies mises en place Google et les moteurs de recherche en général disposent d'une boîte à outils riche qui

est accessible à tout le monde et permet de réaliser plusieurs tâches de base dans le

suivi des stratégies d'optimisation. Je ne présenterai ici qu'une poignée de ces

commandes en détails, mais vous retrouvez une liste complète avec les commandes

les plus importantes dans la partie annexe de ce mémoire.

Dans la plupart des projets, vous disposerez d'une idée du nombre de pages que

comporte le site web. Il est donc très utile de savoir si vos efforts pour faciliter

l'indexation de ces pages par les spiders des moteurs de recherche ont rencontré du

succès.

La commande (site:) peut vous donner une valeur approximative du nombre de

pages qui ont été indexées par les spiders de Google.

Dans l'exemple du site de la HEG, cette requête retourne 1'450 pages. Il faut prendre

en considération que cette commande retourne également les fichiers comme des

PDFs qui peuvent également être indexés par les spiders des moteurs de recherche

s'ils sont références dans une page par un lien textuel.

Cela représente également une opportunité de vérifier si vos instructions du fichier

robots.txt sont bien appliquées. Si par exemple vous avez décidé de bloquer une

certaine partie de votre site web et vous retrouvez une page appartenant à cette partie

dans ces résultats, il y a certainement un problème avec les instructions ou le fichier

robots.txt de votre site.

35 Portail "Will it blend" (http://bit.ly/will-blend) 36 Bloomberg Businessweek, Rachael King. Business Goes Straight to Video (http://bit.ly/bbw-

blend)

Search Engine Optmization Nicolas MESSER 56/102

Si vous aimeriez savoir qui utilise un certain mot-clé, à priori les vôtres, dans son URL

ou comme titre pour ses pages, les commandes (inurl:) et (allinrul:) ou alors (intitle:) et

(allintitle:) vous fourniront les réponses désirées.

Cette requête nous retourne environs 66'000 résultats. Mais dans le cas de la HEG

cela n'est pas très représentatif car l'acronyme semble être utilisé dans une variété de

domaines qui n'ont rien en commun avec la formation universitaire. Il serait donc plus

adapté d'utiliser la combinaison de plusieurs mots-clés.

Nous notons l'utilisation du mot-clé "geneve" sans accent car pourtant aujourd'hui il est

possible d'enregistrer des noms de domaines avec des combinaisons de chiffres et

lettres accentuées, cela n'est pas encore très répandu sur le net aussi à cause de la

langue dominante qui est l'anglais. De même est vrai pour les majuscules. Ceci est

pourtant plus utilisé, mais les moteurs de recherche ne sont généralement pas

sensibles à la case pour le cas des URLs. Dans les deux cas évoqués, des différences

plus ou moins importantes sont possible, dans les résultats obtenus qui dépendent de

la région de l'internaute ou de la langue appliquée au terme recherché.

Cette deuxième requête retourne environs 1'690 résultats et on constate qu'en général

les résultats retournés semblent être plus pertinents pour retrouver des liens

référençant le site de la HEG.

Dans le cas des deux dernières commandes qui font la recherche à partir du titre de la

page, on peut observer le même phénomène. La première version de la requête

retourne un nombre beaucoup moins important. Cela est certainement dû à l'effet que,

dans ce deuxième cas l'orthographe joue un rôle et donc le terme "heg geneve" ne

retournera pas le même résultat que le terme "heg genève" que j'ai employé dans cet

exemple.

Search Engine Optmization Nicolas MESSER 57/102

Même si la précédente méthode vous permet de découvrir des liens vers votre site, il

existe une méthode plus efficace pour avoir une idée sur le nombre de lien par la

commande (inanchor:) et (allinanchor:).

De nouveau la première requête nous retourne le nombre énorme d'environ 1'020'000

résultats ce qui ne semble pas être réaliste dans le cas de la HEG. La deuxième

version de la requête semble plus pertinente en analysant les résultats retournés et le

nombre d'environ 11'200 résultats.

Comme dans le cas de la recherche dans les titres des pages, l'orthographe a une

influence sur le nombre de résultats retournés et les résultats peuvent dépendre

fortement de la langue appliquée au(x) mot(s)-clé(s) recherché(s).

Enfin, même avec toutes ces informations accessibles directement par l'interface des

moteurs de recherche, il est indispensable d'avoir un compte avec les outils pour les

webmasters chez les moteurs majeurs comme Google, Yahoo! et Bing.

Cela vous permettra d'accéder à une bonne partie de ces informations et d'autres qui

ne sont pas accessibles par l'interface du moteur de recherche sans devoir interroger

la requête à la main.

Search Engine Optmization Nicolas MESSER 58/102

Figure 3-1. Aperçu du Dashboard de GWT

L'outil Google Webmaster Tool (GWT) permet d'accéder à une représentation visuelle

plus agréable de toutes des informations qu'on vient de voir précédemment ainsi que

des informations supplémentaires importantes.

Vous pouvez par exemple soumettre votre fichier sitemap en format XML et GWT vous

affichera le nombre de pages indexés.

Figure 3-2. Informations sitemap de GWT

Des informations importantes pour les webmasters qu'on n'a pas pu exploiter par les

commandes précédentes, sont les erreurs d'indexation. GWT vous informe si une de

vos pages n'a pas pu être indexée et le type d'erreur rencontré.

Figure 3-3. Erreurs d'indexation de GWT

Search Engine Optmization Nicolas MESSER 59/102

Des autres outils encore plus spécialisés comme Google Analytics peuvent également

vous fournir toute sorte de données. Dans la suite, je vais vous présenter les plus

importantes qui méritent d'être suivies et analysées dès le début dans Analytics.

Figure 3-4. Aperçu du Dashboard de Google Analytics

Circulation par moteurs de recherche.

Ceci pourra vous permettre de découvrir d'éventuels problèmes avec un moteur

spécifique et/ou indiquer pour lequel des moteurs il faudra consacrer un peu plus de

temps dans le futur.

Figure 3-5. Aperçu de la circulation par moteurs de recherche

Search Engine Optmization Nicolas MESSER 60/102

La circulation par mot-clé

Cela fournit les données essentielles pour améliorer votre visibilité auprès des moteurs

de recherche. Vous ne pouvez pas seulement vérifier si vos mots-clés choisis vous

fournissent le nombre de visiteurs souhaités, mais également découvrir des mots-clés

de la longue traîne omis dans votre sélection.

Figure 3-6. Aperçu de la circulation par mot-clé

L'utilisation des outils d'analyse en général semble plutôt être difficile par le fait qu'ils

fournissent plus d'informations qu'on a effectivement besoin. Par contre l'importance

d'avoir accès à un tel outil est grande, car c'est avec ces informations qu'on sera

capable de faire des adaptations aux stratégies et continuer à améliorer son

positionnement.

Search Engine Optmization Nicolas MESSER 61/102

Chapitre 2 : ROI dans l'optimisation pour les moteurs de recherche Si vous vous êtes déjà un peu occupé des logiciels d'analyse, souvent installés par

défaut avec les offres d'hébergement, ou si vous avez déjà eu l'occasion de voir

l'interface d'un outils proposé par les moteurs de recherche comme Google Analytics,

vous avez certainement observé qu'il y a un nombre de données presque infini.

Je dirais même qu'il y a probablement trop de données pour le suivi d'un site de taille

moyenne. Il est donc important de savoir lesquelles de ces données méritent d'être

analysées et lesquelles vous pouvez ignorer avec bonne conscience (en tout cas au

début de vos efforts d'optimisation).

Indicateur : nombre de visiteurs

Le nombre de visiteurs et visiteurs uniques de votre site vous permettra de voir si vos

efforts attire des nouveaux visiteurs ou si ce sont toujours les mêmes qui viennent sur

votre site. Cela ne veut pas dire que d'avoir des visiteurs fidèles est une mauvaise,

mais l'objectif ultime de l'optimisation est de conduire le plus de clients potentiels vers

votre site. La fidélisation de ces derniers est certainement à envisager, mais si votre

site se présente pertinent à leurs recherches et offre du contenu intéressant cela est

souvent une conséquence explicite.

Indicateur : nombre de vues par pages

Le nombre de vues par pages est une autre métrique importante. Avec ces données

vous pourrez analyser quelles pages intéressent vos visiteurs et adapter votre contenu

à leur goût.

De même si vous vendez vos biens ou services en ligne vous pourriez calculer un vrai

ROI en fonction du nombre de vue d'une page, ce qui devrait inciter le visiteur à

acheter un bien ou service par le nombre de commandes effectuées.

Exemple calcul rendement pour la HEG

Dans le cas de la HEG, on pourrait par exemple suivre le nombre de vue de la page

contenant le bulletin d'inscription (ou même le nombre de téléchargement de ce

dernier) par rapport au nombre de dossiers effectivement reçus.

Search Engine Optmization Nicolas MESSER 62/102

Google Analytics permet de faire ceci et le lien du fichier d'inscription qui actuellement

a le mark-up suivant:

<a class="link-pdf" target="_blank" title="document pdf"

href="doc/ckd12_06_bulletin_inscription.pdf">Bulletin

d’inscription</a>

aura plutôt un mark-up qui correspond au suivant:

<a class="link-pdf" target="_blank" title="Bulletin

d'inscription à la HEG" href="

doc/ckd12_06_bulletin_inscription.pdf "

onClick="javascript:

pageTracker._trackPageview('/fichiers/bulletin-

inscription'); "> Bulletin d’inscription</a>

Ceci enregistrerait une vue pour la page /fichiers/bulletin-inscriptions dans l'interface

de Google Analytics à chaque click (égal à un téléchargement) du fichier d'inscription.

Chapitre 3 : Evaluer à quelle fin ? La difficulté de définir et calculer un ROI dans le monde du référencement est que très

souvent les seules informations que vous avez à disposition sont des chiffres comme

le nombre de visiteurs par jour ou la durée moyenne d'une visite sur votre site. Il est

très difficile de quantifier ce type de données et de leurs attribuer une valeur.

Si vous tenez à jour un blog sur votre site où vos visiteurs peuvent laisser des

commentaires ou si vous disposez d'un formulaire de contact, vous disposeriez au

moins d'un nombre total d'interactions par jour ou mois. Ce type de données vous

permettra déjà de faire des conclusions plus précises sur la valeur de votre site.

Et si en plus, vous proposez vos biens ou services directement dans une boutique en

ligne, vous pourrez réaliser des évaluations du ROI beaucoup plus précises.

De ceci on peut déduire cinq indicateurs principaux qui pourront vous aider à calculer

un ROI. Ce sont la portée, la fréquence des visites, la sphère d'influence, les

conversions (transactions effectuées) et la persistance.

Search Engine Optmization Nicolas MESSER 63/102

Si en prend on considération une approche d'évaluation d'objective souvent utilisé

dans le marketing traditionnel ou en gestion de projet, l'acronyme mnémotechnique

SMART (spécifique, mesurable, atteignable, réaliste, temporellement défini) vient en

tête.

Je pense que cela montre très clairement que pour calculer le ROI dans le monde du

référencement on ne peut généralement pas suivre des moyens de calcul connus.

Chacun doit trouver et définir ses propres indicateurs qui vont permettre d'avoir une

idée sur le ROI et de suivre les progrès.

Conclusion (partie 3)

Vous ne verrez pas de résultats le lendemain de votre travail, mais la patience et un

engagement sur long terme est garant pour une amélioration de votre situation.

Les outils d'analyse peuvent vous fournir un nombre de données précieuses dans le

processus d'optimisation. De connaître et savoir utiliser ces outils peut vous aider à

améliorer vos pages pour atteindre un meilleur positionnement dans les SERPs.

Mais il ne faudra pas oublier que les moteurs de recherche et spécialement Google

sont connus pour changer et améliorer leurs algorithmes en permanence ce qui peut

contribuer à de petits changements réguliers des résultats. Il est donc important

qu'avec le temps vous soyez capable d'identifier et cibler ces changements car ils n'ont

aucune importance du point vu d'optimisation.

Search Engine Optmization Nicolas MESSER 64/102

Partie 4 : L'influence des médias sociaux Aujourd'hui, la quantité des méthodes par lesquelles il est possible de favoriser son

référencement est quasi infinie, et les médias sociaux sont pour une bonne partie la

source de ce phénomène.

Le terme médias/réseaux sociaux décrit les sites web qui réunissent des internautes

de la même culture ou d'intérêts communs. Le concept général des médias sociaux est

d'utiliser ces différents canaux de communication pour faire du marketing direct aux

endroits où se trouve votre public cible.

Tout ceci pointe dans la direction du management de la réputation et peut apporter du

bénéfice à n'importe quelle entreprise.

Avez-vous déjà recherché le nom de votre bien ou service sur Google? Savez-vous ce

que les clients disent sur vos biens ou services ou votre marque? Si oui, est-ce que

vous n'avez pas senti le désir de répondre à quelques remarques?

Il est bien connu que les mauvaises nouvelles sont souvent plus rapidement partagées

et font plus de bruits que des éloges. Avec les médias sociaux vous disposez d'un

moyen de communication rapide et directe pour atteindre la communauté autour de

votre marque et la possibilité de l'influencer en votre faveur.

Les gens partageront leurs opinions peu importe si vous décidez de participer à ce

dialogue ou pas. Et en même temps, cela vous permettra d'atteindre des groupes que

vous n'auriez pas pu atteindre par les canaux de communication traditionnelle.

Search Engine Optmization Nicolas MESSER 65/102

L'utilisation efficace des médias sociaux représente presque un travail spécialisé en

plus de l'optimisation. L'idée n'est pas seulement d'augmenter sa visibilité, mais de

construire des stratégies de marketing viral* qui ont subi un changement profond avec

l'évolution de l'Internet.

Figure 4-1. Le principe du marketing viral

Search Engine Optmization Nicolas MESSER 66/102

Chapitre 1 : Aperçu des médias sociaux populaires

Facebook

Sans doute le réseau social le plus connu pour toutes sortes d'activités aujourd'hui est

Facebook. Et clairement dans le contexte de la HEG ce réseau représente une

plateforme indispensable pour entrer en contact avec les jeunes d'aujourd'hui qui

fréquentent très fortement ce média.

Figure 4-2. Site de la HEG sur Facebook

Twitter

Twitter est le leader dans l'émission des messages de textes, également appelé micro-

blogging. Aujourd'hui beaucoup d'entreprises utilisent ce média pour une sorte de

service client, non seulement avec le but d'être plus proche de la clientèle, mais de

pouvoir réagir plus rapidement sur des voix critiques.

Un exemple de ce type de service client d'une entreprise Suisse est les CFF37. En fait,

j'ai fait l'expérience moi-même une fois après avoir envoyé un message que mon train

avait du retard dans lequel j'avais annoncé de ne pas savoir si j'allais pouvoir prendre

mon train de correspondance à Zurich.

37 CFF. @railservice sur Twitter. http://twitter.com/railservice

Search Engine Optmization Nicolas MESSER 67/102

Figure 4-3. Réaction de la CFF sur Twitter

LinkedIn

LinkedIn est le leader pour connecter les professionnels. L'orientation business de ce

média est probablement la source d'une particularité pour ce réseau social en

proposant des niveaux de comptes d'utilisateurs différents sur cotisation mensuelle.

Figure 4-4. Profile de la HEG chez LinkedIn

Ce ne sont pas les fonctionnalités qui changent quand on est d'accord de payer une

cotisation, mais le compte utilisateur aura moins de restriction pour entrer en contact

avec d'autres utilisateurs. C'est comparable avec le principe d'une loge VIP lors d'un

congrès où il serait probablement plus facile de contacter certaines personnalités.

Search Engine Optmization Nicolas MESSER 68/102

Wikipedia

La HEG dispose également d'une entrée chez Wikipedia qui est une source souvent

utilisée par les internautes pour retrouver des informations. Le problème qui se pose

avec Wikipedia est que n'importe qui peut y faire des changements et donc fausser

l'information disponible.

Figure 4-5. Page Wikipedia de la HEG

Autres services sociaux

Digg ou encore Delicious sont des endroits où vous pouvez partager vos favoris avec

le monde. Et bien sûr YouTube qui a déjà produit des stars d'Internet par la diffusion et

le partage de vidéos.

Chapitre 2 : Quel gain apporté par les médias sociaux? Les médias sociaux sont avant tout un moyen de mettre en avant son contenu et

augmenter sa popularité. Et même si pour la plupart des ces services les liens ne sont

actuellement pas comptabilisés par les moteurs de recherche, ils apparaissent dans

les SERPs et sont sûr de vous amener des visiteurs.

C'est le point souvent révélé par les experts du domaine des médias sociaux, que ce

sont finalement souvent ces services populaires qui recevront la référence (le vote) par

un lien et non le site original. Donc l'amélioration de la visibilité chez les moteurs de

recherche n'est pas transmise directement à votre site.

Search Engine Optmization Nicolas MESSER 69/102

Par contre, vos profiles chez les médias sociaux ont une forte chance d'être très bien

placé dans les SERPs. Ceci est en partie dû à l'introduction de la recherche universelle

dont nous allons parler dans la partie suivante de ce mémoire. Et donc un lien sur votre

profil pourra quand même rapporter indirectement plus de visibilité à votre site.

Figure 4-6. Résultats Facebook et LinkedIn chez Google pour la HEG

De plus, un outil comme Twitter ou un blog vous permettra de réagir et publier plus

rapidement vos réactions à des événements comme nous l'avons vu dans l'exemple du

chapitre précédent. Pour une fois le silence n'est pas d'or. Dans l'ère de l'Internet on

attend de vous un communiqué officiel plutôt aujourd'hui que demain.

Le laboratoire des Technologies et l'Information (LTI) dispose d'un blog38 qui reprend

le design du site de la HEG, mais qui n'est malheureusement pas mentionné sur la

page d'accueil de la HEG.

Conclusion (partie 4)

Dans le monde d'aujourd'hui les gens que vous aimeriez atteindre utilisent presque un

nombre illimité des médias sociaux. C'est un environnement beaucoup plus complexe

que les concepts utilisés dans les campagnes marketing traditionnelles.

Développer et mettre en place des stratégies pour ces services nécessite parfois un

investissement financier et peut prendre beaucoup de temps avant qu'on devienne un

membre de confiance dans une communauté. Mais si ces stratégies sont bien

implémentées et accueillies par les membres de la communauté, le bénéfice peut être

plus grand que prévu au départ.

Il faut voir l'utilisation et le marketing par les médias sociaux comme une forme de

relations publique moderne. Vous pouvez atteindre plusieurs objectifs par les médias

38 Centre des Technologies et de l'Information. Le blog du LTI http://bit.ly/blog-lti

Search Engine Optmization Nicolas MESSER 70/102

sociaux de la simple croissance des visiteurs sur votre site à l'augmentation des ventes

de vos biens et services.

Même si ces outils sont certainement plus faciles à gérer que le référencement, le

temps est également un facteur important. Créer et soigner une relation avec les

milliers de personnes présentes sur les médias sociaux, ainsi que participer activement

à l'interaction peut occuper une personne à plein temps.

Ce phénomène a donc donné naissance à un nouveau métier dans les grandes

entreprises qui est souvent connu sous le nom "Community Manager"39. Cette

personne est une voix officielle40 de l'entreprise qui est en contact direct avec vos

clients, actionnaires ou tout simplement les membres des communautés dans

lesquelles vous êtes actif.

Les médias sociaux ont pris même un rôle tellement important qu'il y a des spécialistes

des deux domaines, référencement et médias sociaux, qui disent que l'ère où les

classements des moteurs de recherche se font uniquement par un calcul purement

algorithmique est finie. L'intégration des résultats en temps réel41 fournit par les médias

sociaux montrait la prise en compte du comportement des internautes.

39 WebWorkerDaily, Dawn Foster. Online Community Manager: Yes, It's Really A Job.

http://bit.ly/com-man (consulté le 26.06.2010) 40 Chris Brogan. Essentials Skills of a Community Manager http://bit.ly/community-skills

(consulté le 26.06.2010) 41 Official Google Blog. Relevance meets the real-time web. http://bit.ly/real-search (consulté le

26.06.2010)

Search Engine Optmization Nicolas MESSER 71/102

Partie 5 : Le future de l'optimisation Le rôle des moteurs de recherche ne changera certainement pas avec l'évolution de

technologies dans les années à venir. Mais les différentes méthodes d'optimisation à

disposition vont grandir avec ces évolutions. A quel moment ces différentes évolutions

techniques seront introduites est difficile à dire, mais de commencer à connaître la

direction et comprendre les concepts pour ne pas être perdu quand le feu vert sera

donné est indispensable.

Chapitre 1 : La recherche universelle En mai 2007, Google a introduit42 la notion "Universal Search" qui a été repris par les

autres moteurs de recherche peu après, ce qui a donné naissance au concept de

"Blended Search". Aujourd'hui ce phénomène est connu comme recherche vertical

chez la majorité des moteurs de recherche.

Le changement principal apporté était l'affichage d'autres types de résultats comme

des photos et vidéos et pas simplement les liens les plus pertinents sur le web, qui

sont maintenant appelés les "10 blue links". Ceci montre clairement l'effort des moteurs

de recherche d'afficher des résultats de plus en plus ciblés et pertinents.

Cette évolution a eu une influence sur les résultats des études avec les outils "eye-

tracking" mentionné dans le 3ème chapitre de la 1ère partie du mémoire. Les zones du

"heat-map" obtenu ont souffert d'un effet de désassemblage autour des différents

médias supplémentaires proposés dans les SERPs.

42 Search Engine Land, Danny Sullivan. Google 2.0: Google Universal Search

http://selnd.com/google-universal (consulté le 26.06.2010)

Search Engine Optmization Nicolas MESSER 72/102

Figure 5-1. Représentation visuelle du principe "Universal Search"

L'influence de ce changement sur les résultats montre l'importance des SERPs en vue

de l'amélioration de cette façon d'afficher des résultats. Dans le futur les internautes

retrouveront plus de choix sur les SERPs pour accéder au contenu d'un site web.

Search Engine Optmization Nicolas MESSER 73/102

L'affichage de ces résultats verticaux se fait soit en début de la page, soit entre les

premiers liens affichés. Par conséquence les détenteurs de sites web doivent se

rendre compte que pour un même mot-clé leur positionnement pourrait se dégrader.

On pourrait très bien occuper la meilleure place dans l’énumération des résultats et ne

plus se retrouver au début de la page de recherche. Mais ceci représente en même

temps une opportunité, si on fait usage des ces types de médias.

Sachant que des liens référençant des vidéos sont également intégrés dans les

SERPs par ce changement, il est important de savoir que d'après ComScore,43

YouTube est devenu le deuxième plus grand moteur de recherche en août 2008. Ces

chiffres ont été relevés pour les Etats-Unis, mais sont certainement généralement

applicables si on considère l'énorme popularité de YouTube.

Et il paraît logique que cette tendance de fournier plus de résultats divers continuera

dans le futur et des nouvelles technologies seront probablement intégrées dans les

SERPs par la recherche universelle.

Chapitre 2 : Nouvelles technologies à venir et connaître

SearchWiki – la recherche personnalisée

Encore une nouveauté chez Google appelée SearchWiki44 qui fait controverse dans le

monde de l'optimisation. SearchWiki permet aux utilisateurs qui détiennent un compte

utilisateur chez Google de personnaliser leurs résultats de recherches, donner un vote

d'appréciation à un résultat individuel ou encore de faires des commentaires.

43 TG Daily, Joshua Hill. YouTube surpasses Yahoo as world's #2 search engine http://bit.ly/tg-

daily (consulté le 29.05.2010) 44 Official Google Blog. SearchWiki: make search your own http://bit.ly/search-wiki (consulté le

29.05.2010)

Search Engine Optmization Nicolas MESSER 74/102

Ceci est une problématique qui est sujette à caution pour les spécialistes du domaine

car cette influence pourrait faire que plusieurs personnes obtiennent des résultats

totalement différents pour un même mot-clé indépendant de la région ou de la langue

employé par l'internaute.

L'interprétation du Flash

Une technologie très répandue sur le net est le Flash. De manière générale les

moteurs de recherche ne sont pas capables d'interpréter les fichiers flash. Mais ceci

est en train de changer car en juin 2008 Google a annoncé qu'ils sont capables

d'extraire au moins une partie de l'information contenu dans les fichiers flash45.

OCR – La reconnaissance optique de caractères

Un autre souci dans le passé a été les images. Même si les moteurs sont capables

d'interpréter le thème de l'image par le texte autour et son texte alternatif

correspondant, souvent il se trouvait que l'image contenait une partie texte qui n'a pas

pu être exploré par les spiders des moteurs. Ceci changera certainement dans le futur

car les moteurs de recherche ont commencé des premières expérimentations avec des

technologies de reconnaissance de caractère connu sous le nom de OCR (Optical

Character Recognition)46.

Les microformats

Les microformats47, également connu sous le nom "rich snippets", sont une autre

technologie à maîtriser dans le futur. Ce n'est pas une nouvelle technologie car elle

existe déjà depuis un certain temps, sans avoir été vraiment exploitée à nos jours.

45 Google Webmaster Central. Flash and other rich media files http://bit.ly/google-flash

(consulté le 29.05.2010) 46 Wikipedia. Reconnaissance optique de caractères http://bit.ly/wiki-ocr 47 Microformats http://bit.ly/rich-snippets

Search Engine Optmization Nicolas MESSER 75/102

Le site de la HEG utilise le microformat hCard pour l'adresse de l'école dans la partie

footer.

Figure 5-2. Application du microformat hCard

Pourtant un élément important de ce microformat, le champ "fn" semble manquer dans

cette déclaration. Ceci et d'autres erreurs peuvent être évité en utilisant un créateur

automatique proposé par le site des microformats.48

L'importance et l'impact de ce format semble toujours être contesté dans le monde de

l'optimisation, mais avec l'intégration de ceux-ci dans les résultats des moteurs de

recherche certainement une technologie à connaître. De plus les trois spécialistes que

j'ai questionnés pour ce mémoire, accordent une grande efficacité à l'utilisation des

microformats pour l'optimisation.

48 Créateur du microformat hCard (http://bit.ly/hcard-creator)

Search Engine Optmization Nicolas MESSER 76/102

Il y a certainement des autres technologies qui sont sur la voie montante, mais celles

qu'on vient de voir sont les plus utilisées actuellement.

La performance des sites web, temps de chargement, taux de rebond, deviendrons de nouveaux critères de positionnement dans les SERP's. – David Degrelle

Chapitre 3 : Le monde mobile Avec l'explosion des "Smartphones" et surtout par le boom de l'iPhone l'utilisation de

l'Internet à partir de ces gadgets a connu une croissance rapide. Et c'est vrai aussi

pour les recherches effectuées par les internautes sur ces gadgets. Google propose

déjà une page et application mobile et beaucoup d'organisations ont compris

l'importance d'avoir un site optimisé pour ces outils mobile.

Dans le cas de la HEG, il n'existe pas de site optimisé pour les browsers mobiles.

Même si ce n’est pas impossible, il est plutôt difficile de naviguer sur le site par un

browser mobile.

Un bon exemple à mon avis pour un site optimisé pour les browsers mobiles est le site

des Transport publics genevois (TPG) qui permet d'accéder à toutes les informations

nécessaires quand on est sur la route.

Search Engine Optmization Nicolas MESSER 77/102

Figure 5-3. Comparaison accès mobile entre les sites de la HEG et TPG

Pourtant la HEG n'a peut-être pas un besoin urgent d'avoir un site mobile les

statistiques et les tendances attendues pour l'utilisation du web mobile font croire que

cela est un point indispensable dans un futur proche, pour tous ceux qui disposent d'un

site web.49

49 GIGAOM, Mathew Ingram. Mary Meeker: Mobile Internet Will Soon Overtake Fixed Internet

http://bit.ly/mobile-web (consulté le 26.06.2010)

Search Engine Optmization Nicolas MESSER 78/102

Conclusion (partie 5)

L'importance des moteurs de recherche ne devrait pas changer dans le futur. Le

contraire sera certainement le cas. Chaque jour le nombre d'informations accessible

sur l'Internet augmente et par ce fait, il devient toujours plus difficile de trouver

l'information qu'on cherche.

On fait donc tous confiance à Google (ou à un autre moteur de recherche) de nous

retourner les résultats les plus pertinents et de nous guider dans l'infinitude de la toile.

Même l'évolution des technologies ne pourrait pas changer ce comportement. Mais elle

va influencer la façon dont nous allons effectuer nos recherches.

Le monde devient de plus en plus mobile et l'Internet a pris place dans la poche des

internautes. Aujourd'hui il est possible de faire une recherche peu importe si on se

trouve à la maison devant son ordinateur ou sur la terrasse d'un café en ville.

Search Engine Optmization Nicolas MESSER 79/102

Conclusion

Le monde de l'optimisation pour les moteurs de recherche n'a pas connu de révolution,

mais il est en constante évolution! On ne parle pas non plus d'une science exacte,

mais d'un domaine que certains diraient empirique avec la suprématie de Google, où

seuls le test de concepts et l'expérience permettent d'avancer.

La réalité est que l'optimisation pour les moteurs de recherche est un sujet vaste et

complexe et l'opportunité d'apprendre de nouveaux concepts et stratégies ne s'arrêtera

jamais. Mais avec l'information en abondance disponible sur ce sujet, il est également

important qu'on apprenne à filtrer et analyser ce flux d'informations.

De multiples théories et recherches existent et on peut en conclure des avis différents

dans ce monde en changement permanent. Pourtant quelques points sur lesquels tout

le monde semble être d'accord existent après tout et ceux-là ne sont pas négligeables.

Google est l'acteur principal du marché de recherche. Tous vos efforts d'optimisation

n'auraient probablement peu de valeur sans l'existence de Google. La dominance de

Google est souligné par le fait que le verbe anglais "to google" (et également souvent

utilisé dans les autres langues) fait partie du dictionnaire officiel aujourd'hui et il est

donc considéré comme un vrai mot.

Les moteurs de recherche sont très populaires. Des millions d'internautes utilisent les

moteurs tous les jours partout dans le monde. Peu importe si c'est pour faire de

simples recherches ou pour chercher le meilleur tarif pour les prochaines vacances.

L'ère où les internautes ont fait des recherches grossières avec un simple mot-clé est

terminée. Les recherches deviennent de plus en plus spécifiques et par ce fait la

chaîne des mots-clés employés de plus en plus longue.

L'optimisation pour les moteurs de recherche est devenue un travail interdisciplinaire.

L'importance de l'optimisation pour les moteurs, en particulier pour les entreprises,

touche à plus que l'équipe du développement du site web. Ce n'est plus uniquement le

programmeur web qui code le site web dans son coin et l'entreprise qui espère pour le

mieux. Surtout pour les entreprises avec un but principalement lucratif, l'optimisation

du site web est un effort commun et ne s'arrêtera pas en ligne.

Search Engine Optmization Nicolas MESSER 80/102

Et avec l'importance croissante d'apparaître en bonne position pour atteindre le

maximum de nouveaux clients potentiels, les spécialistes du domaine n'ont pas à

craindre de se retrouver sans travail dans le futur.

La maîtrise des médias sociaux est une exigence indispensable et en plus un facteur

de différenciation pour les référenceurs dans le futur.

La seule chose qu'on peut prédire pour le futur de l'optimisation est le changement

permanent des moteurs de recherche. La façon de rechercher est grandement

influencée par les tendances du net et seul un savoir-faire vif et à jour permettra de

rester de front avec les technologies et survivre à ces évolutions.

La véritable voie de réflexion pour l'avenir des stratégies d'optimisation est la création

de pages et du contenu optimisé et non pas l'utilisation des stratégies frauduleuses.

Les moteurs de recherche ont des méthodes de détection de plus en plus affinées et

ne vont pas hésiter à vous punir ou exclure de leurs indexes. Et comme on dit sur

Internet, "content is king!" – le contenu est le capital!

Peu importe si vous allez vous consacrer au référencement propre, aux médias

sociaux ou à une combinaison des deux, il faut toujours procéder aux manipulations

avec précaution pour ne pas nuire à vous même.

Search Engine Optmization Nicolas MESSER 81/102

Bilan personnel

Arrivé à la fin de ce mémoire, je suis parfaitement conscient que certaines parties n’ont

pu être développées comme elles le méritaient.

Je m’aperçois qu’il me faudrait bien plus de pages ou presque un livre, pour pouvoir

développer d’autres points à côté de l'optimisation pour les résultats naturels et étudier

les outils proposés par les deux autres grands moteurs Yahoo! et Bing, pour que ce

thème du référencement soit complètement couvert.

Parmi les abandons que je regretterais le plus, figure l’aspect de l'interdisciplinarité de

ce sujet lequel je pense sera vraiment un garant de succès dans le futur de ce

domaine. C'est pour cette raison que j'aurai aimé m'attarder plus sur cette relation et

par exemple travailler avec un étudiant de la filière économie du côté marketing

traditionnel en faisant des comparaisons et des analyses des méthodes du

référencement qui s'imbriquent les uns dans les autres. Ainsi que la notion de retour

sur investissement qui n'est pas encore très évoluée dans le monde du référencement

qui pourrait être intéressant d'étudier plus et analyser les impacts d'une présence

optimisée sur Internet.

L'enjeu du mémoire est le fait qu'un des trois grands moteurs de recherche (Google,

Yahoo et Bing) pourrait apporter un changement majeur à son algorithme à n'importe

quel moment et une grande partie des informations dans ce mémoire pourront de ce

fait être obsolètes dans peu de temps.

L'enjeu personnel de ce mémoire se trouve dans le fait que l’optimisation pour les

moteurs de recherche à l’heure actuelle n’est pas une science exacte et il existe

beaucoup d’opinions différentes sur le "comment faire" et le "comment obtenir" les

meilleurs résultats. Par conséquence, on retrouve un grand nombre d’informations

diverses qui sont à étudier, trier et évaluer, dans le but d’avoir une documentation la

plus complète sur ce sujet. Et j'espère que mes recherches et réflexions m'ont permis

de faire les bons choix pour déposer un mémoire "complet" et de qualité.

En conclusion, j'espère que ce mémoire représentera une source fiable et "complète"

pour qui aimerait s'investir dans l’optimisation pour les moteurs de recherche et

renforcer sa présence de leur site sur Internet.

Search Engine Optmization Nicolas MESSER 82/102

Bibliographie

Livres (monographie)

ANDRIEU, Olivier. Réussir son référencement web. 2e édition. Eyrolles, 2010. 442 p.

ENGE, Eric et al. The Art of SEO : Mastering Search Engine Optimization. O'Reilly, 2009. 574 p.

JERKOVIC, John I. SEO Warrior : Essential Techniques for Increasing Web Visibility, O'Reilly, 2009. 470 p.

WEINBERG, Tamar. Social Media Marketing : Strategien für Twitter, Facebook & Co. O'Reilly, 2010. 388 p.

Livres électroniques, e-books

Beginner's Guide to SEO. FISHKIN Rand, SEOmoz.org, 2005. 30 p. http://bit.ly/guide-SEOmoz (consulté le 23.03.2010)

Guide de démarrage Google : Optmisation pour les moteurs de recherche. Version 1.1. Google, 2008. 23 p. http://bit.ly/guide-google (consulté le 23.03.2010)

Le référencement naturel : évolution, intérêts et perspectives. Version 1.1. 1ère Position, 2005. 36 p. http://bit.ly/guide-position (consulté le 23.03.2010)

Livre blanc de la création de site web optimisé. LSFinteractive, Version 1.0 – 12 février 2008. 8 p. http://bit.ly/LSFinteractive (consulté le 23.03.2010)

New Features Relevant to Webmasters. Bing Webmaster Center Team, 2009. 24 p. http://bit.ly/guide-bing (consulté le 23.03.2010)

Noms de domaines et référencement. AFNIC & Olivier Andrieu, Octobre 2007. 6 p. http://bit.ly/AFNIC-Andrieu (consulté le 23.03.2010)

Référencement : la revanche du contenu. Dixit, 2007. 32 p. http://bit.ly/dixxit (consulté le 23.03.2010)

Référencer son site internet : Comprendre les enjeux du référencement. Yann KERVAREC, 2007. 45 p. http://bit.ly/yann-kervarec (consulté le 23.03.2010)

Sites web ou blogs

Apache Software Foundation. Apache Module mod_rewrite. http://bit.ly/mod-rewrite (consulté le 29.05.2010)

BBC News. 'Miserable failure' links to Bush http://bit.ly/miserable-failure (consulté le 23.03.2010)

Bloomberg Businessweek, Rachael King. Business Goes Straight to Video (http://bit.ly/bbw-blend)

Chris Brogan. Essentials Skills of a Community Manager http://bit.ly/community-skills (consulté le 26.06.2010)

CERN. Le berceau du Web. http://bit.ly/berceau-Web (consulté le 15.05.2010)

Direct Media Traffic. Off Page Optimization VS On-Page Optimization http://bit.ly/off-on-page (consulté le 22.06.2010)

Enquiro. Enquiro Develops Google's Golden Triangle. http://bit.ly/golden-triangle (consulté le 29.05.2010)

Search Engine Optmization Nicolas MESSER 83/102

GIGAOM, Mathew Ingram. Mary Meeker: Mobile Internet Will Soon Overtake Fixed Internet http://bit.ly/mobile-web (consulté le 26.06.2010)

Google. Informations sur la socitété : Technologie Google http://bit.ly/technologie-google (consulté le 29.05.2010)

Google Blog. SearchWiki: make search your own http://bit.ly/search-wiki (consulté le 29.05.2010)

Google Blog. A spring metamorphosis : Google's new look http://bit.ly/google-2010 (consulté le 19.06.2010)

Google Blog. Relevance meets the real-time web. http://bit.ly/real-search (consulté le 26.06.2010)

Google Webmaster Blog. Using site speed in web search ranking http://bit.ly/google-speed (consulté le 22.06.2010)

Google Webmaster Blog. Importance of link architecture. http://bit.ly/link-depth (consulté le 23.06.2010)

Google Webmaster Central. Flash and other rich media files http://bit.ly/google-flash (consulté le 29.05.2010)

Google Webmaster Central. Keyword stuffing. http://bit.ly/stuffing-keywords (consulté le 26.06.2010)

Google Webmaster Central. Hidden text and links. http://bit.ly/hidden-text (consulté le 26.06.2010)

Google Webmaster Central. Cloaking, sneaky JavaScript redirects, and doorway pages. http://bit.ly/google-cloaking (consulté le 26.06.2010)

Google Webmaster Tools Help. Duplicate content. http://bit.ly/contenu-duplique (consulté le 29.05.2010)

Google Webmaster Help YouTube Channel. How many search algorithm changes were made in 2009? http://bit.ly/google-changes (consulté le 15.05.2010)

Joost de Valk. W3C Validation & SEO. http://bit.ly/w3c-validation-seo (consulté le 23.06.2010)

Mashable. Yahoo-Microsoft Search Deal : The Key Facts http://bit.ly/yahoo-microsoft (consulté le 19.06.2010)

Matt Cutts. Straight from Google: What you need to know http://bit.ly/page-rank (consulté le 29.05.2010)

Microsoft. URL Rewriting in ASP.NET. http://bit.ly/asp-rewrite (consulté le 29.05.2010)

Net Applications. Search Engine Market Share. http://bit.ly/market-share (consulté le 22.06.2010)

Robotstxt.org http://bit.ly/fichier-robots (consulté le 29.05.2010)

Search Engine Land. Google Kills Bush's Miserable Failure http://selnd.com/google-bomb (consulté le 29.05.2010)

Search Engine Land, Danny Sullivan. Google 2.0: Google Universal Search http://selnd.com/google-universal (consulté le 26.06.2010)

Search Engine Journal, Ann Smarty. What's Most Effective for Geo Targeting? http://bit.ly/geo-targeting (consulté le 21.06.2010)

Search Engine Journal, Ann Smarty. SEO Case Study : Dealing With Multi-Language Countries Targeting http://bit.ly/multi-language (consulté le 21.06.2010)

Search Engine Optmization Nicolas MESSER 84/102

SEOmoz, Rand Fishkin. White Hat Cloaking: It Exist. It's Permitted. It's Useful. http://bit.ly/white-cloaking (consulté le 26.06.2010)

SEOmoz, Rand Fishkin. Does "Query Deservse Diversity" Algorithm Exist at Google? http://bit.ly/query-diversity (consulté le 26.06.2010)

SEOmoz, Rand Fishkin et al. Search Engine Ranking Factors 2009 http://bit.ly/SEOmoz-survey (consulté le 22.05.2010)

Sitemaps.org. What are Sitemaps? http://bit.ly/sitemap-xml (consulté le 29.05.2010)

TG Daily, Joshua Hill. YouTube surpasses Yahoo as world's #2 search engine http://bit.ly/tg-daily (consulté le 29.05.2010)

Trellian. Keyword and Search Engine Statistics. http://bit.ly/keyword-stats (consulté le 29.05.2010)

WebWorkerDaily, Dawn Foster. Online Community Manager: Yes, It's Really A Job. http://bit.ly/com-man (consulté le 26.06.2010)

Wired, Chris Anderson. The Long Tail. http://bit.ly/the-long-tail (consulté le 29.05.2010)

Texte législatif

Art. 10 Ohand, RS 151.31 http://bit.ly/rs-art-10

Article d'une encyclopédie en ligne

Pay per click. In : Wikipedia http://bit.ly/liens-sponsorises (consulté le 20.06.2010)

Périodique / Article de périodique

Dye, K. SEO Attack : Website abuse for search engine optimisation. Network Security, March 2008, p 4-6.

Malaga, R. A. 2008. Worst practices in search engine optimization. Commun. ACM 51, 12 (Dec. 2008), 147-150. DOI= http://doi.acm.org/10.1145/1409360.1409388

Noruzi, A. A Study of HTML Title Tag Ceation Behavio of Academic Web Sites, The Journal of Academic Librarianships, Volume 33, Number 4, pages 501 – 506.

Actes de congrès (Proceedings)

Abhishek, V. and Hosanagar, K. 2007. Keyword generation for search engine advertising using semantic similarity between terms. In Proceedings of the Ninth international Conference on Electronic Commerce (Minneapolis, MN, USA, August 19 - 22, 2007). ICEC '07, vol. 258. ACM, New York, NY, 89-94. DOI= http://doi.acm.org/10.1145/1282100.1282119

Cheng, Z., Gao, B., and Liu, T. 2010. Actively predicting diverse search intent from user browsing behaviors. In Proceedings of the 19th international Conference on World Wide Web (Raleigh, North Carolina, USA, April 26 - 30, 2010). WWW '10. ACM, New York, NY, 221-230. DOI= http://doi.acm.org/10.1145/1772690.1772714

Dahiwale, P., Mokhade, A., and Raghuwanshi, M. M. 2010. Intelligent web crawler. In Proceedings of the international Conference and Workshop on Emerging Trends in Technology (Mumbai, Maharashtra, India, February 26 - 27, 2010). ICWET '10. ACM, New York, NY, 613-617. DOI= http://doi.acm.org/10.1145/1741906.1742046

Freeman, R. T. 2007. Topological tree clustering of social network search results. In Proceedings of the 8th international Conference on intelligent Data Engineering and Automated Learning (Birmingham, UK, December 16 - 19, 2007). H. Yin, P. Tino, W.

Search Engine Optmization Nicolas MESSER 85/102

Byrne, X. Yao, and E. Corchado, Eds. Lecture Notes In Computer Science. Springer-Verlag, Berlin, Heidelberg, 760-769.

Ghose, A. and Yang, S. 2008. Comparing performance metrics in organic search with sponsored search advertising. In Proceedings of the 2nd international Workshop on Data Mining and Audience intelligence For Advertising (Las Vegas, Nevada, August 24 - 24, 2008). ADKDD '08. ACM, New York, NY, 18-26. DOI= http://doi.acm.org/10.1145/1517472.1517475

You, G. and Hwang, S. 2007. Personalized ranking: a contextual ranking approach. In Proceedings of the 2007 ACM Symposium on Applied Computing (Seoul, Korea, March 11 - 15, 2007). SAC '07. ACM, New York, NY, 506-510. DOI= http://doi.acm.org/10.1145/1244002.1244119

Wang, Y., Ma, M., Niu, Y., and Chen, H. 2007. Spam double-funnel: connecting web spammers with advertisers. In Proceedings of the 16th international Conference on World Wide Web (Banff, Alberta, Canada, May 08 - 12, 2007). WWW '07. ACM, New York, NY, 291-300. DOI= http://doi.acm.org/10.1145/1242572.1242612

Cahier de recherche (technical report)

Höchstötter, N. and Lewandowski, D. What users see – Structures in search engine results pages. In Information Sciences 179, 1796 – 1812. Elsevier. DOI:10.1016/j.ins.2009.01.028

Skiera, B. et al. An analysis of the importance of the long tail in search engine marketing. Electron. Comm. Res. Appl. (2010), DOI:10.1016/j.elerap.2010.05.001

Zhang, J. and Dimitroff, A. 2005. The impact of webpage content characteristics on webpage visibility in search engine results (Part 1). In Information Processing and Management 41, 665 – 690. Elsevier. DOI:10.1016/j.ipm.2003.12.001

Zhang, J. and Dimitroff, A. 2005. The impact of metadata implémentation on webpage visibility in search engine results (Part II). In Information Processing and Management 41, 691 – 715. Elsevier. DOI:10.1016/j.ipm.2003.13.002

Documents audiovisuels (Podcasts)

WebmasterRadio.FM, Ross Dunn et John Carcutt. SEO 101. http://bit.ly/wmr-101

WebmasterRadioFM, Daron Babin. SEO Rockstars. http://bit.ly/wmr-rockstars

Search Engine Optmization Nicolas MESSER 86/102

Glossaire

Accessibilité : L'accessibilité d'un site web désigne le respect d'un certain nombre de

critères techniques (définis par le W3C) destinés à faciliter l'accès du site aux

personnes porteuses de handicap.

Analyse d'audience / Web Analytics : Les outils d'analyse d'audience mesurent le

trafic sur un site web et fournissent de nombreux indicateurs: origine du trafic, pages

vues, requêtes saisies …

Balises méta : Le HTML est constitué de balises, permettant, par exemple de définir

un titre pour une page. Les balises méta sont des balises qui sont généralement

utilisées pur le référencement, en vue de définir le contenu d'une page, comme la

balise méta description oul les mots-clés associés à la page, comme la balise méta

keywords.

Black Hat : Ensemble des pratiques douteuses du référencement, parmi lesquelles le

spamdexing, le cloaking, etc.

Breadcrumb / File d'Ariane : Donne une indication à l’internaute de sa situation sur le

site.

Cloaking : Technique désormais bannie par les moteurs de recherche, le cloaking

("masquage") permet de fournir aux robots une page web "optimisé", différente de celle

proposé aux lecteurs humains.

Contenu viral / Marketing viral : Un moyen efficace d'obtenir spontanément des liens

entrants et consiste à mettre en œuvre des contenus de référence, inédits ou

polémique, susceptibles d'être relayés par des médias, des institutions ou la

blogospère.

Densité : Dans le texte d'une page web, l'indice de densité d'un terme désigne le

rapport entre l'occurrence de ce terme et le nombre total des mots.

Google Bombing : C’est une technique qui utilise le processus d’indexation de Google

pour influencer ses résultats de recherche. Google entre autres paramètres de mesure

base la pertinence de ses réponses sur le nombre et la présence des expressions

recherchées dans des sites et sur des hyperliens. Pour faire un bon Google bombing il

vous faut donc rallier à votre cause un maximum de webmasters qui positionneront sur

leur site des liens contenant une même expression vers la même page.

Search Engine Optmization Nicolas MESSER 87/102

.htaccess : Fichier de configuration des serveurs web sous Apache utilisés pour

contrôler les droits d’accès des répertoires où ils sont positionnés ou pour créer des

redirections.

Importance : fait référence au poids relatif apporté par une citation comme on le

connaît du monde académique qui est dans ce cas un lien d'un autre site web. Ceci

permet de décider sur l'ordre dans les pages de résultats quand un mot-clé produit

plusieurs résultats pertinents.

Indexation : Inscription, par les robots d'un moteur, des pages d'un site dans sa base

de données (index). L'indexation est le préalable indispensable au positionnement des

pages. Une page non indexée ne peut pas apparaître dans les résultats des moteurs.

Lien entrant : Sur une page web donnée, est considéré comme "entrant" tout lien

provenant d'une autre page, qu'elle appartienne au même site (lien entrant interne) ou

à un autre (lien externe). Le nombre de liens entrants d'une page, et plus encore la

qualité des pages dont ils proviennent, sont utilisées par les moteurs pour en

déterminer la popularité et la pertinence.

Lien sponsorisé : Lien provenant d'un achat de mot-clé auprès d'un moteur de

recherche, et qui apparaît dans une zone spécifique de la page des résultats.

Long Tail / Longue traîne : Est une notion statistique qui apparait dans les

distributions. La traîne symbolise l’amortissement de la courbe de Gauss des

répartitions statistiques. Appliquée au référencement elle met par exemple en évidence

qu’il ne faut pas négliger de nombreux mots-clés générant chacun une seule visite au

détriment d’un seul générant beaucoup de visites. La somme des mots faibles étant

supérieure à un mot fort.

Link Building / Linkbaiting : Ensemble des actions visant à obtenir des liens entrants

(échange, achat …).

Page satellite / Doorway pages : Optimisées "mécaniquement" pour le

référencement, les pages satellites sont des pages web réservées aux robots (les

visiteurs humains sont automatiquement redirigés vers une autre page du site).

Destinées à améliorer de manière totalement artificielle le positionnement du site qui

les héberge, elles sont désormais bannies par les moteurs.

Search Engine Optmization Nicolas MESSER 88/102

Popularité / PageRank : La popularité d'une page web est fonction du nombre de

liens pointant vers cette page, et de la propre popularité des pages dont ces liens

proviennent. C'est un critère déterminant, utilisé par les moteurs de recherche lors de

al détermination du positionnement d'une page dans leurs résultats. L'indice de

popularité le plus célèbre est celui de Google, baptisé PageRank.

Positionnement : Le positionnement d'une page web désigne son rang dans les

résultats des moteurs de recherche, lors de la saisie d'une requête spécifique.

Référencement naturel : Le référencement naturel est un ensemble de savoirs-faire

et de techniques visant à positionner efficacement et durablement une page internet

sur les bons mots-clés (c'est-à-dire sur les mots-clés correspondant à l'activité mais

aussi à la demande des internautes) et ce, dans les pages de résultats naturels

(organiques, c-à-d non sponsorisés) de l'ensemble des moteurs de recherche.

Relevance : Est le degré de pertinence des résultats retournés dans une recherche

par rapport à l'intention du mot-clé saisie par l'internaute.

Requête : Ensemble de termes saisis par l'internaute dans un moteur de recherche.

Longtemps cantonnées à un ou deux termes, les requêtes sont désormais de plus en

plus complexes, ce qui limite l'efficacité d'un référencement basé sur une simple liste

de mots-clés.

ROI : Abréviation pour Return On Investment. Dans les plus simples termes, le ROI est

un ratio permettant de mesurer l’argent perdu ou gagné dans une action de

communication ou encore la fabrication d’un produit, par rapport à la somme investie à

la base.

SEO : On regroupe sous le terme de Search Engine Optimization, ou référencement

naturel, les actions destinées à améliorer le positionnement d'un site dans les résultats

des moteurs de recherche.

SERP : Acronyme de l’anglais “Search Engine Result Page”. Ce sont les pages des

résultats sur un moteur de recherche.

Spider / Crawler / Robot : Un Bot est un robot au sens informatique du terme, c’est à

dire un programme développé pour analyser le contenu des pages Web, les classer,

les répertorier et les noter. Ce sont les bots qui renseignent les bases de données des

moteurs de recherche.

Search Engine Optmization Nicolas MESSER 89/102

Tri par pertinence (système de ranking) : Est le processus qui consiste à classer

automatiquement les données de l'index de façon à ce que, suite à une interrogation,

les pages les plus pertinentes apparaissent en premier dans la liste des résultats. Le

but du classement est d'afficher dans les premières réponses les documents

répondant au mieux à la requête.

TrustRank : Ce terme déposé par Google désigne le résultat d'un algorithme destiné à

mesurer la crédibilité des pages web. Contrairement au PageRank, essentiellement

quantitatif, le TrustRank est qualitatif et privilégie les liens en provenance de sites

considérés comme faisant référence.

URL rewriting / Réécriture des URLs : Une technique consistant à réécrire les URLs

d'un site, pour qu'elles soient plus compréhensibles par les robots des moteurs de

recherche.

W3C : Abréviation pour World Wide Web Consortium. Organisation qui définie la

normalisation et donne des recommandations pour les standards de création de sites

web.

Web 2.0 : Concept aux contours flous, le Web 2.0 désigne une nouvelle génération

d'outils (flux RSS, blogs, …) et de pratiques (création d'espaces communautaires, …)

visant à centrer les fonctionnalités d'Internet sur ses utilisateurs. Parce qu'il offre une

conception radicalement nouvelle de la création et de la diffusion des contenus, les

Web 2.0 influence fortement les méthodes de référencement naturel.

White Hat : Ensemble des bonnes pratiques du référencement. Ce sont par exemple

les pratiques qui visent à augmenter la visibilité des informations de la page auprès

des spiders.

Search Engine Optmization Nicolas MESSER 90/102

Annexes

Advanced Search Operators .......................................................................... 91  Charte de Qualité et de déontologie du métier de référenceur................... 94  Interview avec Véronique Murbach ............................................................... 97  

Search Engine Optmization Nicolas MESSER 91/102

Advanced Search Operators Google advanced search operators

Operator Short description SEO application Examples Shows approximately how many URLs are indexed by Google

site:www.google.com

From a directory site:mit.edu/research/

Includes all subdomains site:google.com

(site:) Domain-restricted search

Narrows a search to (a) specific domain(s)/directories

Shows sites of a specific top-level domain (TLD)

site:org

(inurl:)/(allinurl:) URL keyword restricted search

Narrows the results to documents containing (a) search term(s) in the URLs

Find web pages having your keyword in a file path

inurl:seo inurl:company = allinurl:seo company

(intitle:)/(allintitle:) Title keyword restricted search

Restricts the results to documents containing (a) search term(s) in a page title

Find web pages using your keyword in a page title

intitle:seo intitle:company = allintitle:seo company

(inanchor:)/(allinanchor:) Anchor text keyword restricted search

Restricts the results to documents containing (a) search term(s) in the anchor text of backlinks pointing to a page

Find pages having the most backlinks/the most powerful backlinks with the keyword in the anchor text

inanchor:seo inanchor:company = allinanchor:seo company

(intext:) Body text keyword restricted search

Restricts the results to documents containing (a) search term(s) in the body text of a page

Find pages containing the most relevant/most optimized body text

intext:seo

(ext:)/(filetype:) File type restricted search

Narrows search results to the pages that end in a particular file extension

A few possible extensions/file types: PDF (Adobe Portable Document Format) HTML or .htm (Hypertext Markup Language) .xls (Microsoft Excel) .ppt (Microsoft PowerPoint) .doc (Microsoft Word)

filetype:pdf ext:pdf

(*) Wildcard search

Means “insert any word here”

Search for a phrase “partial match”

seo * directory returns “seo free directory”, “seo friendly directory”, etc.

(Related:) Similar URLs search

Shows related pages by finding pages linking to the site and looking at what else they tend to link to (i.e., “co-citation”); usually 25 to 31 results are shown.

Evaluate how relevant the site’s “neighbors” are

Compare: related:www.linkdiy.com and related:www.alchemistmedia.com

Search Engine Optmization Nicolas MESSER 92/102

(Info:) Information about a URL search

Gives information about the given page

Learn whether the page has been indexed by Google; provides links for further URL information; this search can also alert you to possible site issues (duplicate content or possible DNS problems)

info:netconcepts.com will show you the page title and description, and invite you to view its related pages, incoming links, and page cached version

(Cache:) See what the page looked like when Google crawled it

Shows Google’s saved copy of the page

Google’s text version of the page works the same way as SEO Browser

cache:www.stonetemple.com

(~keyword) Shows keywords Google thinks are related to keyword

Can be very useful in uncovering related words that you should include on your page about keyword

~zoo ~trip will show you keywords related to zoo and trip

Yahoo! advanced search operators

Operator Short description SEO application Examples (Link:) URL backlinks restricted search

Finds any page backlinks (if used in isolation, redirects to Yahoo! Site Explorer)

Find most the relevant backlinks of any page

link:http://www.seomoz.org/blog seo

(LinkDomain:) Domain backlinks restricted search

Finds any domain backlinks (if used in isolation, redirects to Yahoo! Site Explorer)

Find the most relevant backlinks of any domain

linkdomain:www.alchemistmedia.com seo

A few possible extensions/file types: PDF (Adobe Portable Document Format) .xls (Microsoft Excel) .ppt (Microsoft PowerPoint) .doc (Microsoft Word)

originurlextension:pdf

(OriginUrlExtension:) File type restricted search (Region:) Area restricted search

Narrows search results to the pages that end in a particular file extension Narrows search results to the sites belonging to a particular territory

Example regions: region:europe region:africa region:asia

region:europe

(Url:) URL restricted search

Finds a specific document in Yahoo!’s index

Learn whether the page was indexed by Yahoo!

url:http://www.netconcept.com

Search Engine Optmization Nicolas MESSER 93/102

Bing advanced operators

Operator Short description SEO application Examples (LinkFromDomain:) Domain outbound links restricted search

Finds all pages the given domain links out to

Find most relevant sites your competitor links out to

linkfromdomain:seomoz.org seo

(Contains:) File type restricted search

Narrows search results to pages linking to a document of the specified file type

Find pages linking to a specific document type containing relevant information

contains:wma seo

(InBody:) Body text keyword restricted search

Restricts the results to documents containing query word(s) in the body text of a page

Find pages containing the most relevant/best optimized body text

inbody:seo (equivalent to Google’s intext:)

(Location:)/(loc:) Location specific search

Narrows search results to a specified location (multiple location options can be found under Bing’s advanced search)

Find geospecific documents using your keyword

seo loc:AU

(Feed:) Feed keyword restricted search

Narrows search results to terms contained in RSS feeds

Find relevant feeds feed:seo

(Hasfeed:) Feed keyword restricted search

Narrows search results to pages linking to feeds that contain the specified keywords

Find pages linking to relevant feeds

hasfeed:seo site:cnn.com

Consolidé depuis le livre SEO Warrior et le site web d'accompagnement

http://www.seowarrior.net de John Jerkovic.

Search Engine Optmization Nicolas MESSER 94/102

Charte de Qualité et de déontologie du métier de référenceur © Abondance.com

Les signataires de la "Charte de Qualité Abondance sur le référencement de sites web" devront accepter les conditions suivantes (O-R = Outils de Recherche) : Titre Contenu

Réalisme / Garanties

Les signataires s'engagent à une obligation de moyens à mettre en oeuvre et à ne pas promettre (garantir) de résultats de positionnement limités à une requête et un moteur, et plus généralement ne pas promettre de résultats qui ne pourront être tenus ou vérifiés par le client. Des garanties statistiques (X% de positionnements sur Y mots clés et Z moteurs) pourront cependant être proposés.

Transparence

Les signataires s'engagent à tenir à disposition de leurs clients - et à leur faire connaître sa disponibilité - un document clair et précis présentant leur méthodologie de travail : technologies mises en œuvre, méthodes d'optimisation, procédures de référencement, etc.

Conseil

Les signataires s'engagent à aider leurs clients dans la réflexion sur les informations qui seront fournies aux O-R (descriptif, mots clés, optimisation des titres et textes des pages, etc.) lors du référencement.

Méthodologie

Les signataires restent libres de la méthodologie mise en place pour référencer les sites de leurs clients, à partir du moment où elle respecte la présente charte, notamment en ce qui concerne la lutte contre le spam de la part des O-R (voir plus loin).

Loyauté

Les signataires s'engagent à suivre strictement les indications des O-R, publiées de façon spécifique sur leurs sites (et reprises ci-après dans la présente charte), dans le but d'effectuer une soumission efficace d'un site web dans leur index ou bases de données.

Suivi

Les signataires s'engagent à remettre à leurs clients de façon périodique des rapports clairs sur l'avancée des travaux de référencement de leur site web (suivi du positionnement, du trafic généré, du retour sur investissement, etc.), sous la forme qui leur semble la plus appropriée (tableaux Excel, extranet, outils en ligne, etc.).

Autonomie

Les signataires s'engagent à remettre tous les éléments relatifs aux travaux réalisés dans le cadre de la prestation de référencement de façon à permettre à leurs clients de changer de prestataire s'ils n'étaient pas satisfaits de la prestation effectuée. Comme pour toute prestation informatique ou de service, les travaux effectués appartiennent au client qui en a payé le montant.

Veille

Les signataires s'engagent à mettre en place des mécanismes de veille afin de se tenir au courant de l'évolution des outils de recherche et à en faire profiter leurs clients.

Qualité

Les signataires s'engagent auprès des O-R à ne soumettre à leur indexation que des sites dont le contenu et la pertinence sont suffisamment riches pour alimenter leur base de données en vue

Search Engine Optmization Nicolas MESSER 95/102

d'apporter une information utile au visiteur.

Mode de fonctionnement

Les signataires s'engagent à n'effectuer pour leurs clients que des prestations de référencement manuel, sans l'aide d'aucun logiciel de soumission automatique, sauf dans le cas où cette prestation est explicitement indiquée dans la proposition commerciale, et uniquement si l'utilisation de logiciels n'intervient qu'en complément d'une prestation manuelle majeure et ce aussi bien en phase de référencement qu'en phase de suivi et de veille.

Respect de la concurrence

Les signataires s'engagent à ne pas nuire au référencement d'un concurrent pour le compte d'un client et à ne pas utiliser la marque de concurrents pour le référencement de leurs clients. En règle générale, les signataires s'engagent à ne pas nuire au référencement d'un site pour lequel ils n'auraient pas été mandatés.

Combat contre le spam

Les signataires acceptent de ne pas réaliser d'action de spamdexing (fraude sur les O-R). Une annexe (voir ci-après) décrit de façon précise ce qui est considéré comme du spamdexing et ce qui n'en est pas dans le domaine du référencement de site web. Les signataires s'engagent notamment à ne cacher aux O-R aucun contenu destiné au référencement à l'intérieur du code HTML (balise Noscript, utilisation de zones invisibles - visibility-hidden, display:none, etc.) du site de leur client.

Information

Les signataires s'engagent à remettre à leurs clients et prospects, dans leurs propositions commerciales, un exemplaire de la Charte ici présente, accompagnée d'un document expliquant le fonctionnement des O-R, détaillant en quoi consiste un référencement de site Web, ainsi que ses contraintes.

Clarté

Les signataires s'engagent à expliciter de façon claire les actions effectuées sur les moteurs de recherche et notamment à ne pas entretenir de flou entre des prestations de référencement manuel et d'éventuelles actions d'achat de mots clés dans le cadre de campagnes de liens sponsorisés. Les deux types d'actions, si elles cohabitent dans la prestation proposée au client, devront être clairement mentionnées et démarquées.

Blacklistage

Les signataires s'engagent à rembourser intégralement la prestation réalisée s'il est avéré que le site est exclu d'un moteur suite à une faute de leurs services.

Echange de liens

Les signataires s'engagent à ne pas mettre en place de lien vers leur site depuis le site du client, de façon visible ou invisible, sauf si cela est stipulé clairement dans le contrat signé entre les deux parties.

Définition du spamdexing Les actions suivantes sont considérées comme étant du spam (ou spamdexing : fraude au référencement sur les O-R (= Outils de Recherche)), cette liste n'étant pas considérée comme limitative :

Search Engine Optmization Nicolas MESSER 96/102

• Référencement d'un site faisant la promotion d'activités illicites ou dégradantes (piratage, racisme, sectes, pédophilie, etc.). • Mise en place d'une stratégie de référencement basée sur plusieurs noms de domaine différents (chaque nom de domaine pointant sur la même page) ou sous plusieurs adresses ou sous-domaines différents (www.site.com et actu.site.com par exemple, chaque adresse pointant sur la même page). • Répétition de façon abusive des mots clés à l'intérieur d'une page, que ce soit dans des zones cachées ou non du code HTML. • Répétition abusive de balises TITLE, META ou autres (commentaires). • Utilisation de mots clés inadéquats avec le contenu du site, utilisation de marques ou de noms sans liaison avec le site ou faisant mention de marques déposées sans autorisation. • Utilisation de texte invisible (blanc sur fond blanc par exemple) ou caché à l'intérieur du code HTML (balise Noscript, utilisation de zones invisibles - visibility-hidden, display:none, etc.). • Cloaking (technique instllée sur les serveurs web et permettant de délivrer aux spiders des pages spécifiquement réalisées pour les moteurs de recherche) à des fins de positionnement. • Copie sur son propre site de code HTML existant et n'appartenant pas au signataire. • Création de pages HTML ou de liens ayant pour unique but d'augmenter l'indice de popularité d'un site ou d'une page. • Achat de lien au prorata d'un indice de popularité (PageRank ou autre). • Pages de redirection (balise Meta Refresh, Javascript ou autre) notamment dans la cadre de création de pages satellites. • Popularité : toute manœuvre visant à tenter d'augmenter l'indice de popularité (ou PageRank) d'une page de façon artificielle. • Pages satellites, alias, fantômes, doorway pages, etc., et toutes techniques d'optimisation permettant de positionner une page dans les pages de résultats des moteurs, cette page redirigeant de façon automatique l'internaute sur une autre page "réelle". • Toute méthode de création massive et automatisée de pages web spécifiquement optimisées pour les moteurs de recherche, même sans redirection automatique, dans le cadre d'une stratégie de référencement. • D'une manière générale, non-respect des limites indiquées par les O-R et rappelées ici : Google : http://www.google.fr/support/webmasters/bin/answer.py?answer=35769&hl=fr http://www.google.fr/support/webmasters/bin/answer.py?answer=35291&hl=fr Yahoo! : http://eur.help.yahoo.com/help/fr/ysearch/deletions/index.html http://eur.help.yahoo.com/help/fr/ysearch/deletions/deletions-04.html http://eur.help.yahoo.com/help/fr/ysearch/deletions/deletions-05.html Microsoft Live Search: http://search.msn.fr/docs/siteowner.aspx?FORM=WMDD2 http://search.msn.fr/docs/siteowner.aspx?t=SEARCH_WEBMASTER_REF_GuidelinesforOptimizingSite.htm&FORM=WGDD

Search Engine Optmization Nicolas MESSER 97/102

Interview avec Véronique Murbach Interview du 29.06.2010 à la HEG

Avec Véronique MURBACH, Ajointe au chef du laboratoire, Conceptrice en

communication WEB

Je réalise mon travail de diplôme sur le référencement/l'optimisation pour les moteurs

de recherche avec le cas d'étude du site de la HEG. C'est M. Jean-Philippe Trabichet,

responsable de la filière informatique de gestion et responsable du laboratoire, qui m'a

proposé de vous contacter concernant mes questions par rapport à mon travail

d'analyse du site de la HEG.

Quelle est votre rôle?

Je suis la webmaster de la HEG. Mon travail, et celui de mon équipe, est la

maintenance et la mise à jour du site de la HEG.

Actuellement la HEG n'utilise pas de CMS pour son site web et tous les changements

et mise à jour passent obligatoirement par mes collaborateurs ou moi-même. Mais

nous ne sommes évidemment pas responsables pour le contenu lui-même.

Quel est l'objectif principal du site de la HEG?

Attirer les futurs étudiants de la HEG et promouvoir les travaux de recherche réalisés

par la HEG. Mais le site est également un moyen de communication sur les différentes

nouvelles et événements au sein de la HEG.

Est-ce que la HEG à une stratégie d'optimisation?

Oui, nous essayons au mieux d'optimiser le site de la HEG. Mais depuis le passage à

la nouvelle version du site de la HEG, les changements apportés à la structure ne nous

ont pas encore permit d'achever tout le travail nécessaire pour avoir un site

particulièrement optimisé. Et il faudra évidemment un peu de temps pour que la totalité

du nouveau site soit correctement indexé chez les moteurs de recherche.

Le site de la HEG est développé entièrement en interne et nous sommes "limités" au

niveau des technologies par les serveurs mises à disposition par la Haute école. En ce

moment, c'est soit du .ASP (choix technologie du site actuel), soit du PHP.

Search Engine Optmization Nicolas MESSER 98/102

Tout le travail de référencement est réalisé par nos collaborateurs. La direction

s'intéresse au listing dans les résultats des moteurs de recherche par rapport à des

mots-clés défnis, mais ne nous a pas donné des directives plus détaillés pour

l'optimisation des pages du site de la HEG. Au delà, ils ne donnent pas une grande

priorité à cela, mais nous essayons de mettre en place les bonnes pratiques que nous

jugeons importantes.

Est-ce que la HEG, fait un effort pour utiliser les médias sociaux?

Oui, c'est un travail qui a été réalisé pour un travail de maturité professionnelle et mise

en place avec la version actuelle du site de la HEG. Le résultat de ce travail est que

nous avons maintenant une page officielle sur Facebook où nous proposons

égalments toutes les nouvelles de la HEG et nous espérons atteindre des futurs

candidats qui sont amis avec les étudiants actuels de la HEG. Et depuis quelques

temps, nous proposons aux visiteurs du site de partager notre contenu directement sur

les différents réseaux sociaux par le widget du service AddThis.

Est-ce que la HEG utilise des outils comme Google Analytics pour analyser la

circulation du site web?

Je sais qu'on exploite les méthodes d'analyse avec Analytics, mais c'est un collègue

qui s'occupe de cela.

Mais, est-ce que vous savez si la HEG à mis en place des métriques (valeur de

référencement) pour calculer une sorte de rendement sur le site web?

Je sais qu'on a analysé la durée des visites et toutes ces données standards qu'on

peut retrouver par l'outil Analytics. Est-ce que vous auriez un exemple plus concret

pour votre question?

Oui, je me suis demandé si par exemple la HEG avait mis en place un système

pour compter le nombre de fois le fichier PDF pour les inscriptions est

téléchargé pour le comparer avec le nombre de dossiers effectivement reçus?

Non, alors je ne pense pas que cela est actuellement réalisé, mais c'est une bonne

idée. Par contre, je pense que ce ne sera pas si facile à réaliser parce qu'il y a toujours

des dossiers en retour qui ne sont pas téléchargés depuis le site.

Search Engine Optmization Nicolas MESSER 99/102

Est-ce que la HEG fait une analyse des "concurrents" pour savoir où elle se

place par rapport aux autres hautes écoles?

Oui, bien sûr nous essayons de regarder ce que font les autres hautes écoles et où on

se positionne par rapport à eux. Mais depuis le changement sur la nouvelle version du

site, nous ne l'avons pas encore fait parce que nous avons perdu beaucoup de liens et

pefereons attendre encore un moment pour que le site soit de nouveau bien indexé.

Quelques questions par rapport aux analyses que j'ai réalisées au cours de mon mémoire.

Pour réprendre l'élément de l'analyse des concurrents pour un moment. Une

chose que j'ai remarquée est que la HEG n'a pas de nom de domaine

independant. Par contre, j'ai pu constater que le nom de domaine www.heg-ge.ch

est reservé par les Hautes écoles spécialisée de Genève. Est-ce que c'est prévu

d'utiliser ce nom de domaine dans le futur pour améliorer cet élément qui est

quand même assez important du côté référencement?

Vous avez raison que le nom de domaine est réservé et pas utilisé à ce jour. C'est la

direction des Hautes écoles génévoises qui a décider de reserver ces noms de

domaines pour proteger que ce n'est pas quelqu'un d'autres qui le fait. Mais a mes

connaissances, les Hautes écoles génévoises sont obligées de suivre le modèle du

nom de domaine qu'utilise la HEG actuellement. Je pense que nous ne pourrons donc

pas changer cela dans le futur.

J'ai pu constater que le nouveau site de la HEG n'a plus les mots-clés (nom de l'école)

en clair dans la balise d'en-tête <h1>, mais au lieu utilise le logo officiel avec le nom en

français et anglais dans un format image. Est-ce que cela à été un choix volontaire ou

cela a été décidé par quelqu'un d'autre (la direction par exemple) parce que vous

perdez quand même l'opportunité de placer des mots-clés dans la partie la plus

importante du site?

Non, c'était décidé parce que ce logo est utilisé par tout et parce que c'était comme

cela sur la maquette de la nouvelle version. Et il y a toujours le texte alternatif de

l'image pour placer quelques mots-clés.

Si j'ai bien vu, le site de la HEG n'exploite pas un plan du site en format XML

pour essayer de faciliter l'indexation par les moteurs de recherche?

Non, nous avons le plan du site traditionnel en format HTML qui est accessible sur le

site.

Search Engine Optmization Nicolas MESSER 100/102

Est-ce que le site de la HEG utilise un fichier robots.txt?

Non, nous n'utilisons pas cela. Le site de la HEG ne dispose actuellement pas d'une

partie privée à la quelle il faudra bloquer l'accès aux spiders des moteurs de

recherche. De plus, je dirais que nous n'avons pas le problème de contenu dupliquée.

Nous en avons déjà parlé un peu, mais j'ai pu constater que les métadonnées en

général ne sont pas très optimisées pour le site de la HEG. Est-ce que des

informations comme les titres et/ou descriptions des pages sont générées

automatiquement en ce moment? Et quelle importance donner vous à ces

données parce que j'ai vu que des autres hautes écoles ont carrément ignoré

complètement les descriptions par exemple?

Ces données sont toujours importantes pour les informations qui s'affichent dans les

pages de résultats des moteurs de recherche. Pour le site de la HEG, les données

pour la description sont créées automatiquement. Mais comme vous l'avez remarqué, il

y en a d'autres qui ne sont pas encore optimisées par tout car il faut les mettre à jour

manuellement. Mais nous avons un schéma en place pour cela.

Est-ce que vous avez considéré de faire de la reécriture des URLs dans le cas de

l'annuaire et/ou optimiser les noms des fichiers pour avoir des URLs

optimisées?

Non, cela n'est pas prévu pour cette version du site de la HEG. Peut-être avec une

prochaine version qui sera basé sur un CMS on pourrait améliorer ce point (et d'autres

que vous avez mentionnés avant).

Quelques questions sur des améliorations/propositions qui sont apparues lors des analyses pour mon travail de diplôme, mais qui ne sont pas directement en relation avec le référencement.

Est-ce que vous avez considéré de mettre un formulaire pour la prise de contact

sur le site de la HEG plutôt que d'y mettre les différents adresses e-mails

(comme cela se fait pour contacter les collaborateurs)?

Non, nous n'y avons pas pensé, mais c'est à réfléchir si on veut le faire. Parce que je

comprends tout à fait votre point de vue pour les gens qui ne sont pas sur leur poste de

travail à eux ou n'ont pas de programme de messagerie installé.

Une autre chose qu'on a prévu d'améliorer dans cette même ligne est le bulletin

d'inscription. On veut bien qu'on puisse le remplir directement sur ordinateur.

Search Engine Optmization Nicolas MESSER 101/102

La "fraicheur" du contenu d'un site est également importante dans le

référencement pour les moteurs de recherche. J'ai constaté que les témoignages

des étudiants ont récemment été actualisés. Est-ce que vous pensez que d'avoir

une sorte de blog rédigé par les étudiants au lieu de la page plutôt statique qui

ne change pas souvent pourrait être un autre moyen pour attirer des futur

candidats?

Oui, peut-être. Mais mon équipe et moi, nous ne nous occupons pas du tout du

contenu (ni la rédaction de celui). Donc, ce n'est de toute façon pas à nous de prendre

une telle décision.

Et ma dernière question. Quel est le futur du site de la HEG?

Nous envisageons de passer à un CMS pour la prochaine version. Mais pour ce qui

concerne le site actuel, nous aimerions remettre à disposition la possibilité de faire des

recherches sur le site et également mettre à disposition des flux RSS.

Je vous remercie de m'avoir acceuili pour répondre à mes questions. Vos réponses

vont beaucoup m'aider à clarifier quelques points dans mon mémoire. Encore une fois,

merci pour votre temps.