1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

Preview:

Citation preview

1

Google, un moteur de recherche comme les autres ?

Laurent CHERKIBrice DUTHEILGuillaume GERME

2

Introduction

Sergey Brin Larry Page

Fondateurs

3

Introduction

Google43%

Google Image

8%

MSN Search

21%

Yahoo!10%

AOL5%

Autres13%

Statistiques Google en Europe en 2004

4

Introduction

Google, un moteur comme les autres ?

5

I) Principes et idées fondatrices.I) Google, « googol »II) Google, « large-scale search engine »III) Google, efficace

II) Google, une recette originale.I) Google, architecture

I) Aspiration.II) Indexation

II) PageRankI) FonctionnementII) Limites

III) Infrastructure

III)Avenir et concurrence.I) Un marché disputéII) Les pistes de recherches

Plan

6

La mission :

Garantir à ses utilisateurs les solutions de recherche les plus confortables, les plus complètes et les plus précises

Google, « googol »

Google ?

Néologisme sur le mot googol googol = 10100

Principes et idées fondatrices

7

Google, « large-scale search engine »

• Pas d’intervention humaine• Recherche sur une base de donnée • Utilisation des algorithmes

Principes et idées fondatrices

8

Google, efficace

• Résultats de qualité.• Recherche rapide• on ne peut pas payer sa place

Principes et idées fondatrices

9

Aspiration

Web

Indexation

Barrel

Google

L’ architecture de Google

Google, une recette originale

10

L’aspiration

But : télécharger le web

Composée de :• Crawler• « Repository »

Tache difficile et sensible

Limite : • Multiplication des pages• Le silence • Sites fantômes

Google, une recette originale

11

L’indexation

But : analyse et trie des documentsComposée de :• « Indexer »• « Sorter »• « Barrel »

Construction d’un double index« forward index »« inverted index »

Google, une recette originale

12

Le PageRank

• Qu’est ce que le PageRank ?

• le Concept, le principe de fonctionnement

• La formule.

Google, une recette originale

13

Le PageRank

Expression mathématiques

Avec comme variables :P : page P d : facteur d’absorptionPageRank(Ti) : PageRank de la page Ti C(Ti) : nombre de liens sortants de la page Ti

Google, une recette originale

14

Le PageRank

Limite : • Méthode qui devient trop connue • Ne tient pas compte de la vraie structure du web• Ne prend pas en compte d’information sémantique

Google, une recette originale

15

L’infrastructure

Cluster :

Composé de :plusieurs dizaines de milliers d’ordinateur bas de gamme

Principe : Répartition de la charge

Intérêt : Réduction des coûtsHaute tolérance de panne

Google, une recette originale

16

Un marché disputé

« Clustered Search »

ex: ,

Search

Avenir et concurrence

17

Moteurs spécialisés

Diversification des moyens d’accès

Recherche surl’ordinateur

Les pistes de recherche

12

31

Avenir et concurrence

18

Moteurs spécialisés

Diversification des moyens d’accès

Recherche surl’ordinateur

12

312

Avenir et concurrenceLes pistes de recherche

19

Moteurs spécialisés

Diversification des moyens d’accès

Recherche surl’ordinateur

12

3123

SMS

Avenir et concurrenceLes pistes de recherche

20

En conclusion nous pouvons maintenant répondre à la problématique posée :

Est il un moteur de recherche comme les autres ?

21

Conclusion

Laurent CHERKI - Brice DUTHEIL- Guillaume GERME

Recommended