Analyse de logs - Études de cas et best practices - SEO Campus 2017

Preview:

Citation preview

1#seocamp

Julien Deneuville - Madeline Pinthon

Analyse de logsÉtudes de cas et best practices

2#seocamp

Qui sommes-nous ?

La partie autopromo

3#seocamp

Madeline Pinthon

Formation

2005 - 2010 / Audencia Nantes / Diplôme Grande Ecole

2009 / Udem (Universidad de Monterrey, Mexique)

6 ans d’expérience

2015 à ce jour : consultante SEO chez iProspect

2012-2015 : responsable seo technique chez MB Line

2011-2012 : chef de projet SEO chez MB Line

(Agriaffaires)

Site personnel

www.canyouseome.com

Consultante SEO chez iProspect

4#seocamp

Julien Deneuville

28 ans

Crée des sites web depuis 2004

SEO pro depuis 2011

@diije

clustaar.com/blog

Musique, Vélo

Consultant SEO chez Clustaar

SEO

DATA

TOOLS

5#seocamp

Pourquoi analyser les logs ?

6#seocamp

A quelles occasions ?

Pour les sites à forte

volumétrie

Pour suivre une

migration

Pour analyser des

anomalies

Pour préparer une

migration

7#seocamp

Crawl des robots

Quelles pages sont visitées ?

A quelle fréquence ?

Visites

Les données d’Analytics sont-elles fiables ?

Mes visiteurs rencontrent-ils des erreurs ?

Erreurs

Y a-t-il des erreurs sur mon site ?

Mon serveur tient-il la charge ?

Que s’attendre à trouver ?

8#seocamp

1

Audit ponctuel

2

Monitoring en

continu

Deux méthodes complémentaires

9#seocamp

Comment analyser les logs ?

10#seocamp

Les vérifications préalablesEvitez de perdre du temps

Si les chiffres ne sont pas cohérents, il y a un loup...

Vérifier le volume des données

Google Search Console donne une idée du volume des

logs GoogleBot.

Pages explorées par jour

11#seocamp

Les vérifications préalablesEvitez de perdre du temps

Il faut :

● L’URL réécrite (RIP IIS)

● Le code réponse HTTP

● Le User-agent

● L’IP du client (attention aux faux)

● Le referrer

● La date/heure

● ...

Vérifier l’intégrité des données

Ask your DSI

N’oubliez pas : les développeurs ne sont pas des sysadmin !

12#seocamp

Quels outils ?Google Search Console est ton ami mais il faut aller plus loin

Botify, onCrawl, Kelogs ...

SAAS

Splunk, Stack ELK, ...

Les DSI

Screaming Frog Log Analyzer

Logiciels

Grep, Awk, Sed,...

Linux

13#seocamp

Que regarder dans les logs ?

14#seocamp

Les codes réponsesOu status code, ou response code, ou rescode,..

15#seocamp

L’impact des 500Houston, on a un problème

16#seocamp

Quid des erreurs ?Mais t’es où ? pas là

17#seocamp

Les redirectionsPschiiit

18#seocamp

Catégoriser les pages

19#seocamp

Une approche techniquePar pattern

Raisonner en template de pages

● Pages produits

● Pages de listes

● Pages de contenus

● …

Idéalement avec un identifiant dans les URLs

● On utilisera généralement des Expressions Régulières

● http://www.example.com/nom-du-produit-1234.html

● http[s]?:\/\/www\.example\.com\/[a-z-]+-[0-9]+\.html

20#seocamp

Une approche marketingPar univers

● Raisonner en thématique

● Faciliter le croisement visite/logs

● Améliorer les conversions

Calquer sur le plan de taggage

Idéalement, elle reflète la structure du menu

● On utilisera plus les répertoires

○ musiques, CD, vinyles,...

○ jeux vidéos, consoles,....

○ films, dvd, blu-ray,....

Attention à ne pas rentrer trop dans le détail.

21#seocamp

Une approche SEOPar objectif

● Top tail

● Middle tail

● Long tail

Une possibilité de cibler selon les types de requêtes :

22#seocamp

Croiser logs et crawl

23#seocamp

Ce qu’on imagineJumeaux !

Google connaît votre site.

Votre site est entièrement crawlé.

Nous avons des images identiques (ou presque)

24#seocamp

Google connait une infime partie du siteOops

25#seocamp

Google en connaît bien plusIt’s bigger on the inside

26#seocamp

Google ne regarde pas au bon endroitwrong target

27#seocamp

Crawl, catégorisation et Logs

Ce que Google voit VS ce qui fait des visites

28#seocamp

Monitoring

29#seocamp

Fréquence de crawlEst-ce que tu viens pour les vacances ?

30#seocamp

ErreursTirer la sonnette d’alarme

31#seocamp

Etudes de cas

32#seocamp

De l’importance du temps de chargementharder, better, faster, stronger

33#seocamp

De l’importance de la structure

34#seocamp

Les joies des paramètres d’urlJusqu’ici tout va bien

Jusqu’ici, tout va bien...puis un jour, Google décide d’explorer certaines parties du site.

Attention, il ne faut pas (forcément) accuser les dev, c’est parfois Google qui change, pas

votre site

Parfois, Google est curieux

35#seocamp

Un exemple de crise 1/

On observe une baisse du crawl.

Dans l’’analyse de la recherche, on observe une forte baisse

des impressions, pour une position moyenne stable.

Il semble qu’il y ait une baisse du nombre de contenus

indexés.

1ere alerte : Search Console

36#seocamp

Un exemple de crise 2/

En fouillant un peu plus, on osberve effectivement de

l’instabilité sur certaines pages...ou même une disparition

complète.

1ere alerte : Search Console

37#seocamp

Un exemple de crise : 3/De l’importance des pages actives

visites SEO

pages actives

Crawl, par

univers

Les visites SEO : pas d’impact flagrant.

Autre indicateur : pages actives, légères baisse du nombre de

pages.

3e indicateur : le crawl, par univers… on oserve des variations

mais rien de flagrant; à part quelques éléments.

2e étape : analyse de logs

38#seocamp

1 2 3 4 5

visites

SEO

pages

actives

Crawl,

par

template

Par catégorie de pages, on voit un gros impact négatif…sur les

visites, les pages actives et le crawl.

1. une hausse du nb de pages crawlées par google

2. Une baisse progressive du nb de pages actives

3. une chute drastique des visites sur un type de page

4. Des actions correctives mises en place, hausse du

nombre de pages crawlées

5. retour des pages actives et des visites

Une recatégorisation technique

Un exemple de crise : 4/Une recatégorisation, technique

39#seocamp

Un exemple de crise : 5/Les conclusions

Google Search Console donne des premières indications

Attention aux anomalies de crawl

Le nombre de pages actives est un bon indicateur

Un site peut disparaître du jour au lendemain, rétablir un site prend du

temps.

40#seocamp

Going furtherSEO Hero

Ajoutez des informations dans vos logs

● Temps de génération des pages

● Dernière visite

● Serveur utilisé

● ...

Croisez d’autres données

● Analytics, Search Console

● Visibilité, tendances de recherche

● Stocks et données business

41#seocamp

Des questions ?Qui veut gagner un mug ?

Merci !

42#seocamp

Quel est le user-agent du robot de Qwant ?

Madeline Pinthon

Consultante SEO chez iProspect

@razbithume

www.iprospect.com/fr/fr/le-blog/

www.canyouseome.com

Julien Deneuville

Consultant SEO chez Clustaar

@diije

clustaar.com/blog