16
Page 1 Page 1 Best practices SEO pour les sites multilingues et internationaux 04/12/2013 K_lice Camille Thomas Mathieu Chapon Mathieujava &

Bonnes pratiques SEO pour les sites multilingues et internationaux

Embed Size (px)

Citation preview

Page 1: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 1Page 1

Best practices SEO pour les sites multilingues et internationaux

04/12/2013

K_lice

Camille Thomas Mathieu Chapon

Mathieujava

&

Page 2: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 2Page 2

Au programme

1. Géolocalisation de votre site

2. Langue de votre site

3. Balise href lang

4. Ip locale

5. Splash screen

6. Erreurs à éviter

7. Charset

Page 3: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 3Page 3

Il faut calquer sa structure de sites sur celle des moteurs

Index pays : Google.be

Option linguistique

Page 4: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 4Page 4

Conclusion : géolocalisation d’abord, langue ensuite

Aidez Google en utilisant un ccTLD adapté

– ccTLD : Country Code TLD > be, fr, co.uk, de

Si pas possible :

– Géolocalisation à l’aide du compte GWT

Sous domaine : be.domaine.com

Sous répertoire : www.domaine.com/be

Page 5: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 5Page 5

Ensuite, répertoire langue

Google reconnait les codes de la nomenclature ISO 3166 et 639 identifiant

respectivement les pays et les langues, notamment lorsqu’ils sont utilisés

comme nom d’un répertoire situé à la racine.

– Le premier code à deux lettres correspond au pays, le second à la langue

– Voici deux liens donnant la nomenclature officielle :

http://fr.wikipedia.org/wiki/ISO_3166-1 (codes pays)

http://fr.wikipedia.org/wiki/Liste_des_codes_ISO_639-1 (langues)

Exemples :

– www.domaine.com/uk-en/ est reconnu comme un répertoire destiné aux

habitants du royaume uni avec des pages en anglais.

– www.domaine.com/es-ca/ est reconnu comme un répertoire destiné aux

habitants de l’Espagne parlant catalan (et non des pages en espagnol pour

des canadiens).

– La notation /es/ca/ est également reconnue.

Attention : utiliser cette notation facilite l’identification, mais ne l’assure

pas à elle seule… Il est recommandé de l’utiliser, mais un moteur de

recherche ne se fie pas à cette seule donnée, en particulier pour déterminer

la langue d’une page.

Page 6: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 6Page 6

Cette balise récemment introduite par Google permet de gérer un cas

fréquent : la création de pages multilingues très similaires entre elles

– Vos pages proposent un contenu globalement fixe dans une langue donnée, à

l'exception de quelques variations liées à la zone géographique (par exemple, un

contenu en français ciblant les internautes de Belgique, de France et de Suisse).

– Le contenu du site est traduit dans son intégralité. Par exemple, chaque page est

disponible en allemand et en français.

La balise pointe vers les urls à indexer dans les versions linguistiques

différentes

Elle peut être placée :

– Dans la section HTML <head>

<link rel="alternate" hreflang="es" href="http://es.example.com/" />

– Dans l’entête HTTP

Link: <http://es.example.com/>; rel="alternate"; hreflang="es“

– Dans le sitemap

<xhtml:link rel="alternate" hreflang="es" href="http:// es.example.com /" />

Utiliser la balise rel="alternate" hreflang="x"

Page 7: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 7Page 7

Un exemple pour que ce soit plus clair

http://www.example.com/page.html : page d'accueil en anglais. Fournit des

informations sur les frais de port à l'international depuis les États-Unis.

http://en-gb.example.com/page.html : en anglais, indique les prix en livres

sterling.

http://en-us.example.com/page.html : en anglais, indique les prix en dollars

américains.

http://de.example.com/seite.html : version du contenu en allemand.

Supposons que vous souhaitiez demander à Google de diffuser les pages comme

suit : la version allemande auprès des internautes qui utilisent Google en allemand,

la page en-us auprès des internautes qui utilisent google.com en anglais et la version

en-gb auprès des internautes qui utilisent google.co.uk en anglais.

<link rel="alternate" hreflang="en" href="http://www.example.com/page.html" />

<link rel="alternate" hreflang="en-gb" href="http://en-gb.example.com/page.html" />

<link rel="alternate" hreflang="en-us" href="http://en-us.example.com/page.html" />

<link rel="alternate" hreflang="de" href="http://de.example.com/seite.html" />

Page 8: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 8Page 8

Ip locale ?

"The server location (through the IP address of the server) is frequently near your

users. However, some websites use distributed content delivery networks (CDNs)

or are hosted in a country with better webserver infrastructure, so we try not to

rely on the server location alone.“

Dans le cas des CDNs il faut s’assurer :

– Que les seveurs soient situés dans le pays visé ou au moins proche

géographiquement Vitesse de téléchargement affecte votre SEO

Conclusion : ne pas s’obstiner à obtenir une IP locale

http://googlewebmastercentral.blogspot.com.es/2010/03/working-with-multi-regional-websites.html

Page 9: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 9Page 9

Traduction, version multipays et duplicate

Deux pages identiques destinées à deux index pays différents ne sont pas

du duplicate content (à condition que la géolocalisation soit correcte)

Deux pages quasi identiques dans deux langues différentes ne sont pas du

duplicate content (à condition que la langue soit correctement reconnue)

Duplicate content ?

Page 10: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 10Page 10

Le problème du splash screen

Il convient d’éviter absolument de créer un écran d’accueil pour choisir la

langue. Cette pratique est fortement déconseillée pour des raisons

d’ergonomie et cela nuit au référencement.

– Nous préconisons plutôt de détecter le pays d’origine de l’internaute, et la

langue par défaut du navigateur et de :

Définir une version pays et une langue par défaut, qui sera présentée en

cas d’échec de la détection

D’orienter automatiquement l’internaute vers les pages qui lui sont

destinées (détection de la langue du navigateur)

De lui permettre de choisir un autre réglage par défaut, si la redirection

automatique ne lui convient pas

DÉTECTER LE PAYS D’ORIGINE DU VISITEUR

– La détection du pays d’origine du visiteur peut s’effectuer par détection de la

géolocalisation de l’IP du visiteur.

– Il existe différents services payants ou gratuits offrant sous forme de service

SaaS la résolution de la géolocalisation IP.

– La détection est correcte dans 90% des cas

Page 11: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 11Page 11

Ce n’est pas du cloaking

Modifier les pages présentées en fonction de la langue ne pose pas de

problèmes de référencement.

De même la géolocalisation par l’IP n’est pas du cloaking, mais de l’IP

delivery

Page 12: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 12Page 12

Quelques erreurs à éviter

Urls inversées :

– Langue d’abord, pays ensuite : www.domaine.com/fr/be

– Pb : La géolocalisation devient impossible

Une langue par ccTLD

– Domaine.fr =>français, et domaine.com =>anglais

– Vous allez le regretter bientôt !

La langue en paramètre

– domaine.com/page.html?lang=es

– Souvent pas bien compris par les moteurs…

Page 13: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 13Page 13

Choisissez bien votre charset

Page 14: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 14Page 14

Les familles de charset

Les charset ISO

– Ex : ISO-8951-1 (occidental latin 1), français complet ISO-8951-15

– Inconvénient : pas compatible avec un site réellement multilingue

UTF-8

– Permet d’encoder la plupart des langues

– Mais attention : n’est pas adapté à toutes les langues, notamment les

langues à idéogrammes

– Pour les langues avec un grand nombre d’idéogrammes, il faut passer à

l’UTF-16 pour des raisons de performances

Attention aux problèmes de transcodage

– Pages encodées en UTF8, contenu chargé en ISO (copier coller) par les

utilisateurs, ou importés

Page 15: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 15Page 15

Comment déclarer un charset

Comment déclarer le charset ?

Avec l'en-tête HTTP Content-type :

– Via un fichier .htaccess : AddDefaultCharset UTF-8

– En PHP : header('Content-Type: text/html;charset=UTF-8');

En XML et XHTML, avec le prologue : <?xml version="1.0" encoding="UTF-8"?>

Grâce à la balise meta dans le code

– En HTML5 : <meta charset="UTF-8">

– En HTML4 : <meta http-equiv="Content-Type" content="text/html;

charset=utf-8">

– En XHTML 1.1 : <meta http-equiv="Content-Type" content="text/html;

charset=utf-8" />

Page 16: Bonnes pratiques SEO pour les sites multilingues et internationaux

Page 16Page 16

Deux mots sur les caractères asiatiques

Japonais

– Katakana : syllabaire pour les mots

étrangers

– Hiragana : autre syllabaire pour les

mots orthographiés phoniquement

– Kanji : idéogrammes d’origine

chinoise

Chinois

– Pinyin : écriture romanisée

Pékin > Beijing

– Chinois simplifié

– Sinogrammes traditionnels

=> Dans les urls : tout convertir en

pinyin!