35
Olivier Guibé Historique et motivation La démarche Matrices PageRank . . . . . . Les matrices et l'algorithme PageRank de Google Olivier Guibé LMRS -- Université de Rouen Université en Scène -- 25 janvier 2013

OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Embed Size (px)

Citation preview

Page 1: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Les matrices et l'algorithme PageRank deGoogle

Olivier Guibé

LMRS -- Université de Rouen

Université en Scène -- 25 janvier 2013

Page 2: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Google : une entreprise

à l'initiative de deux étudiants Sergey Brin et Larry Page• fondée en 1998• depuis 2000 vente de publicités• cotation en bourse depuis 2004

Aujourd'hui• nombre d'employés : plus 50 000 en 2011• nombre de serveurs/PC : plus de 900 000 (2011)• activité de recherche importante

Page 3: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Une des clefs de cette réussite

PageRank

ou un algorithme de tri des pages webqui est, la plupart du temps, pertinent.

Page 4: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Que fait un moteur derecherche ?

L'utilisateur lance une requête : mots clés cherchés.Le moteur de recherche exécute

..1 liste des pages contenant les mots clés

..2 tri par ordre de pertinence

..3 affichage des résultats

Il y a donc plusieurs aspects dont• modélisation mathématique : comment définir/calculer lapertinence ? (personne n'est chargée de lire toutes les pagesweb !)

• ressource informatique : stockage, traitement d'une quantitéénorme d'informations

Nous allons donner deux mauvais choix de calcul de pertinence et lePageRank.

Page 5: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Le WEB

Contenu hétérogène :des pages sur tous les sujets existants, aucune centralisation, très peude structure.

Des contributions multiples et variées qui changent tous les jours.

Point commun :Pages HTML, HyperText Markup Language, avec des liens les reliantles unes aux autres.

Page 6: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Le point commun

L'idée est de travailler sur le fait qu'il y a des liens reliant les pages lesunes aux autres. La première chose à faire :

• numéroter toutes les pages : P1, P2, etc

Comme le but est de définir un critère « pertinence de la page » ilfaudra distinguer «P1 contient un lien qui pointe sur P2 » et «P2contient un lien qui pointe sur P1 ».

• si la page Pj contient un lien vers la page Pi onmatérialise celapar une flèche Pj −→ Pi.

Page 7: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Voici le résulat

200 pages web !

1

2

3

4

56

7

8

910

11

12

13

1415

16

17

18

19

20 21

22

23

2425

26

27

28

29 30

3132

33

3435

36

37

3839

40

41

42

43

44

4546

474849

50

51

5253

54

55 5657

58

59

60

61

62

63

6465

66 67

686970

71

72

73

74

75

76

7778

79

8081

82 83848586

87

88

89

90

9192

93

94

9596

9798

99100101

102

103

104

105

106107108

109

110111

112

113

114

115

116

117

118

119

120

121

122

123

124

125126

127

128

129

130

131

132

133

134

135

136

137

138139140

141

142143

144

145146147

148

149

150

151 152

153

154

155

156

157

158

159

160

161

162163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181 182183

184

185

186

187

188

189

190

191

192

193

194

195

196

197198

199

200

Page 8: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Le point commun

Traduisons en terme de graphe un Web à 12 pages !

1

2

3

4

56

7

8

9

10

1112

Page 9: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Une autre disposition

1

2

3

4

56

7

8

9

10

1112

devient

1

2 3 4

5

6 7 8 9

101112

Page 10: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Quelques explications

La structure de notre graphe est la suivante 1 → 2, 3, 4, 5 ; 2 → 1, 3 ;3 → 1, 4 ; 4 → 1, 2 ; 5 → 6, 8 ; 6 → 1, 7 ; 7 → 5 ; 8 → 7, 9 ;9 → 5, 10, 11, 12 ; 10 → 9, 11 ; 11 → 9, 12 ; 12 → 9, 10.Parmi P1, P2, P3 et P4, la page P1 semble être une référence.Parmi P9, P10, P11 et P12, la page P9 semble être une référence.De la structure P5, P6, P7 et P8, P7 est la plus citée mais avec un lien deP7 sur P5.Finalement comme P1 et P9, reconnues comme importantes, pointentsur P5, on propose P5 comme page la plus pertinente.

1

2 3 4

5

6 7 8 9

101112

Page 11: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Définir un score

Le but est de trouver une méthode, un algorithme qui calcule lapertinence de chaque page.

On peut représenter la pertinence par un nombre ou un score positifavec la convention que plus le score est grand plus la page est« importante ».

Évidemment on peut discuter très longtemps sur « qu'est qu'une pageimportante, pertinente ? ».

Le fait est que Google a semblé/semble encore répondre de façonsatisfaisante aux requêtes des utilisateurs.

Page 12: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Idée naïve : compter les liens

IdéeUne page importante est une page qui reçoit beaucoup de liensLe score de la page Pi est la somme du nombre de liens qui pointentsur Pi, ou encore le nombre de « votes ». Rappelons notre web :1 → 2, 3, 4, 5 ; 2 → 1, 3 ; 3 → 1, 4 ; 4 → 1, 2 ; 5 → 6, 8 ;6 → 1, 7 ; 7 → 5 ; 8 → 7, 9 ; 9 → 5, 10, 11, 12 ; 10 → 9, 11 ;11 → 9, 12 ; 12 → 9, 10.Calcul des scores :P1 : 4 ; P2 : 2 ; P3 : 2 ; P4 : 2 ; P5 : 3 ; P6 : 1 ; P7 : 2 ; P8 : 1 ;P9 : 4 ; P10 : 2 ; P11 : 2 ; P12 : 2.

Les pages 1 et 9 arrivent en premier.

Page 13: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Idée naïve : bilan

Calcul de la pertinence par le nombre de « votes ».

AvantageTrès simple à calculer

InconvénientSi tout le monde est d'accord pour placer la page 5 en premier, cetteméthode ne correspond pas à notre classement « ressenti ».

Inconvénient ++Très facile de manipuler ; il suffit de créer des pages web qui pointentvers son site pour augmenter artificiellement son score !

Page 14: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Idée naïve : bilan

Calcul de la pertinence par le nombre de « votes ».

AvantageTrès simple à calculer

InconvénientSi tout le monde est d'accord pour placer la page 5 en premier, cetteméthode ne correspond pas à notre classement « ressenti ».

Inconvénient ++Très facile de manipuler ; il suffit de créer des pages web qui pointentvers son site pour augmenter artificiellement son score !

Page 15: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Idée naïve : bilan

Calcul de la pertinence par le nombre de « votes ».

AvantageTrès simple à calculer

InconvénientSi tout le monde est d'accord pour placer la page 5 en premier, cetteméthode ne correspond pas à notre classement « ressenti ».

Inconvénient ++Très facile de manipuler ; il suffit de créer des pages web qui pointentvers son site pour augmenter artificiellement son score !

Page 16: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Idée naïve : bilan

Calcul de la pertinence par le nombre de « votes ».

AvantageTrès simple à calculer

InconvénientSi tout le monde est d'accord pour placer la page 5 en premier, cetteméthode ne correspond pas à notre classement « ressenti ».

Inconvénient ++Très facile de manipuler ; il suffit de créer des pages web qui pointentvers son site pour augmenter artificiellement son score !

Page 17: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

avec par exemple

1

2 3 4

5

6 7 8 9

101112

13

14

1516

17 1819

20 21

Le gagnant est : page 13 !

Page 18: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

nouvelle idée : pondération

1

2 3 4

5

6 7 8 9

101112

Pour minimiser l'impact des pages qui contiennent beaucoup deliens, on ajoute une pondération au « vote » : la page 2 contient 2 liensqui pointent vers les pages 1 et 3.La page 2 « vote donc » pour la page page 1 pour 1/2.Total

• Page 1 : 1/2+ 1/2+ 1/2+ 1/2 = 2• Page 9 : 1/2+ 1/2+ 1/2+ 1/2 = 2• Page 5 : 1/4+ 1+ 1/4 = 3/2

Page 19: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Pondération : bilan

En fait c'est une méthode qui a les mêmes avantages et surtout lesmêmes inconvénients (facile de manipuler un classement) :

1

2 3 4

5

6 7 8 9

101112

13

14

1516

17 1819

20 21

Page 20: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

L'idée qui a fait ses preuves

«Une page est importante si beaucoup depages importantes la citent »

TraductionLe vote d'une page pour une autre dépend en plus de son score !Désignons par s1 le score de P1, s2 celui de P3, etc.

1

2 3 4

5

6 7 8 9

101112

s1 =s22+s32+s42+s62

=??

Page 21: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Continuons

1

2 3 4

5

6 7 8 9

101112

On obtient donc beaucoup d'équations !

s1 =s22+s32+s42+s62

s9 =s122

+s112

+s102

+s82

s5 =s14+ s7 +

s94

. . .

Page 22: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Math et matrices

On obtient (seulement) 12 équations

s1 =s22+s32+s42+s62

s2 =s14+s42

s3 =s14+s22

s4 =s14+s32

s5 =s14+s71+s94

...

s12 =s94+s112

Page 23: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

qui se mettent sous la forme As = s avec A la matrice

0 1/2 1/2 1/2 0 1/2 0 0 0 0 0 01/4 0 0 1/2 0 0 0 0 0 0 0 01/4 1/2 0 0 0 0 0 0 0 0 0 01/4 0 1/2 0 0 0 0 0 0 0 0 01/4 0 0 0 0 0 1 0 1/4 0 0 00 0 0 0 1/2 0 0 0 0 0 0 00 0 0 0 0 1/2 0 1/2 0 0 0 00 0 0 0 1/2 0 0 0 0 0 0 00 0 0 0 0 0 0 1/2 0 1/2 1/2 1/20 0 0 0 0 0 0 0 1/4 0 0 1/20 0 0 0 0 0 0 0 1/4 1/2 0 00 0 0 0 0 0 0 0 1/4 0 1/2 0

Page 24: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

et l'inconnue est s, le vecteur des scores, possédant douzecoordonnées

s =

s1s2s3...s12

Page 25: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Matrice, vecteur

DéfinitionsUnematrice carrée est un « tableau » de n lignes et n colonnescontenant donc n2 éléments.Un vecteur est un « tableau » de n lignes et 1 colonne.On peut (sous réserve de compatibilité des tailles)

• additionner les matrices (on additionne terme à terme)• multiplier une matrice par un réel (on multiplie tous les termesde la matrice par ce réel)

• multiplier une matrice par un vecteur (et on obtient un vecteur)• multiplier deux matrices

Les deux dernières opérations sont plus compliquées (ce n'est pasune multiplication terme à terme). Le produit matriciel est un bonexemple de «multiplication » non commutative : en généralA× B ̸= B× A.

Page 26: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

..

..a11 ..a12 ... . . ..a1n

..a21 ..a22 ... . . ..a2n

..... ..

... ... . . ..

...

..an1 ..an2 ... . . ..ann

.

.

.

En image

.

A : n lignes n colonnes

.

..x1

..x2

.....

..xn

.

.

.

x : vecteur n lignes

.

..y1

..y2

.....

..yn

.

.

.

a 21× x

1

.

a 22× x

2

.

a 2n× x

n

.

+

.

+…+

.

y = Ax : vecteur n lignes

Page 27: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

..

..a11 ..a12 ... . . ..a1n

..a21 ..a22 ... . . ..a2n

..... ..

... ... . . ..

...

..an1 ..an2 ... . . ..ann

.

.

.

En image

.

A : n lignes n colonnes

.

..b11 ..b12 ... . . ..b1n

..b21 ..b22 ... . . ..b2n

..... ..

... ... . . ..

...

..bn1 ..bn2 ... . . ..bnn

.

.

.

B : n lignes n colonnes

.

..c11 ..c12 ... . . ..c1n

..c21 ..c22 ... . . ..c2n

..... ..

... ... . . ..

...

..cn1 ..cn2 ... . . ..cnn

.

.

.

a 21×b 12

.

a 22×b 22

.

a 2n×b n2

.+

.

+…+

.

C = A× B : n lignes n colonnes

Page 28: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Résultats

La résolution (à l'aide d'un logiciel de calcul) donne :

• score de P1, P7 et P9 : 2• score de P5 : 3• les autres : 1.

Page 29: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Nouvelle idée : bilan

AvantageLe modèle semble donner notre classement.

InconvénientÀ la main, c'est vite difficile (voire impossible) pour calculer ceclassement.

Outils nécessairesNous aurons besoin de l'informatique et des mathématiques

Page 30: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Nouvelle idée : ne pas tomberdans un trou noir !

1

2 3 4

5

6 7 8 9

10111213

La page 13 est une page ne contenant aucun lien.On peut vérifier

• score de la page 13 égal à 1• les autres à zéro

est une solution !

Page 31: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Nouvelle idée : ne pas tomberdans un trou noir !

1

2 3 4

5

6 7 8 9

10111213

La page 13 est une page ne contenant aucun lien.

InterprétationLe surfeur qui arrive à la page 13 ne peut plus en sortir puisque la page13 n'a pas de lien externe.

Page 32: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Solution : ajouter du hasard

Le modèle traduit un comportement très prévisible du surfeur. Ilclique sur les liens d'une page pour aller sur une autre.

On peut considérer que notre comportement serait plutôt : au bout dequelques pages visitées je vais aller sur une page qui n'a rien à voir outrès peu avec les précédentes.

TraductionOn autorise un saut vers une page aléatoire (n'importe quelle page duweb) avec une faible probabilité.

Page 33: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Traduction mathématique

• une des pages référencées par i avec la probabilité α et lapondération

• une page quelconque de façon équiprobable (1− α)/N

• on travaille sur B = αA+ (1− α)1NJ où J est la matrice ne

contenant que des 1. On prendra α = .85.

Le mathématicien est content !Il existe un unique vecteur r (de norme 1) vérifiant Br = r. (théorèmede Perron-Frobenius)

Score• Pages 1 et 9 : 0.4268• Pages 5 : 0.415• Page 7 : 0.226• Les autres : 0.229

Page 34: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Ce que vous avez évité

Cette « nouvelle idée « (classement récursif) associée au côté« aléatoire » est le modèle PageRank :

• tout se passe bien• ce classement est robuste (ajouter artificiellement des pages quipointent vers une même page ne change pas beaucoup leclassement)

• on utilise les matrices, l'algèbre linéaire, les marches aléatoiressur les graphes, le théorème du point fixe, etc

• du point de vue informatique comment gérer une telle quantitéde données, les algorithme de calcul (certains sont secrets), etc

Page 35: OlivierGuibé Lesmatricesetl'algorithmePageRankde Googleolivier.guibe.free.fr/pdf/pres_google.pdf · OlivierGuibé Historiqueet motivation Ladémarche Matrices PageRank. . . .

Olivier Guibé

Historique etmotivation

La démarche

Matrices

PageRank

. . . . . .

Merci