Analyse empirique et modélisation de la dynamique de la topologie de l’Internet

  • View
    31

  • Download
    1

  • Category

    Science

Preview:

Citation preview

Analyse empirique et modélisation de ladynamique de la topologie de l’Internet

Sergey KirgizovDirectrice de thèse: Clémence Magnien

Complex Networks, LIP6, (UPMC, CNRS)

Paris, 12 décembre 2014

Plan

1 Introduction

2 Mesures égo-centrées

3 Modèle

4 Caractérisation de la dynamique

5 Taille du sous-graphe observable

6 Dynamique réelle et dynamique observée

7 Conclusion et perspectives

2

Introduction :l’Internet, étude de la topologie de l’Internet

Carte de l’Internet // Barrett Lyon, 2003

Topologie au niveau IP

Mon ordinateur

paris.fr lip6.fr

Nœuds : ordinateursLiens : connections IP

4

Petite note historique

temps

1960s — ARPANET1980s — Internet1993 — Dynamics of internet routing information

[Chinoy]1997 — Measurements and Analysis of End-to-End Internet Dynamics

[Paxon]1998 — On routes and multicast trees in the Internet

[Pansiot et Grad]2000s — de nombreux travaux sur la topologie

(et la dynamique) de l’Internet à grande échelleseulement quelques œuvres considèrent l’échelle fine

5

Étude de la topologie de l’Internet

Pas de carte officielle de l’Internet

Une carte statique ?Mesures longues et coûteuses;Biais sur la structure observée.

}=⇒Pas de carte fiable

Étude de la dynamique ?Tous les problèmes statiques;Répéter les mesures

}=⇒Pas si facile

6

Mesures égo-centrées :Routes entre un moniteur et plusieurs destinations fixes

[Latapy, Magnien, Ouédraogo, 2011]

Vues ego-centrées

m

d1 d2

Carte complète

7

Vues ego-centrées

m

d1 d2

Routes entre un moniteur et des destinations

7

Vues ego-centrées

m

d1 d2

Une mesure par l’outil tracetree[Latapy, Magnien, Ouédraogo, 2011]

7

Vues ego-centrées

m

d1 d2

Une autre mesure par l’outil tracetree

7

Vues ego-centrées

m

d1 d2

Une autre mesure par l’outil tracetree

7

Dynamique des vues ego-centrées

m

d1 d2

m

d1 d2

m

d1 d2

Temp

Mesures périodiques rapides =⇒ étude de la dynamique

8

Caractérisation de la dynamique

Mesures : M1, M2, . . . , Mi , . . .

Nombre de liens vus depuis le début : t 7→

∣∣∣∣∣∣

i∈[0,t ]

Mi

∣∣∣∣∣∣# liens

0

20000

40000

60000

80000

100000

120000

140000

160000

180000

200000

220000

Sep Oct Nov Dec J an Feb Mar Apr May J un J ul Aug Sep Oct

Nom

bre

de li

ens

IP

Date

1ère — 9 938 liens

2ème — 11 149 liens

dernière — 207 782

3000 destinationsune mesure toutes les 15 minutes pendant 1 an

découverte en permanence de nouveaux liens IPà une vitesse élevée

9

Causes de la dynamique observée

Causes

Load-balancingM DL

Évolution du routageM D

10

Load-balancing vs évolution du routage

0

20000

40000

60000

80000

100000

120000

140000

160000

180000

200000

220000

Sep Oct Nov Dec J an Feb Mar Apr May J un J ul Aug Sep Oct

Nom

bre

de lie

ns IP

Date

pas d'évolution du routage

11

Load-balancing vs évolution du routage

0

20000

40000

60000

80000

100000

120000

140000

160000

180000

200000

220000

Sep Oct Nov Dec J an Feb Mar Apr May J un J ul Aug Sep Oct

Nom

bre

de lie

ns IP

Date

12

Load-balancing vs évolution du routage

0

20000

40000

60000

80000

100000

120000

140000

160000

180000

200000

220000

Sep Oct Nov Dec J an Feb Mar Apr May J un J ul Aug Sep Oct

Nom

bre

de lie

ns IP

Date

pente

load-balancing

dynamique structurelle+ load-balancing

+ dynamique structurelle

évolution du routage

évolution du routage

13

Modèle :Load-balancing + évolution du routage

Modélisation

Topologie : Graphe aléatoire (Erdős-Rényi ou configurationmodel)

Un nœud aléatoire −→ moniteurd nœuds aléatoires −→ destinations

Mesure : plus courts chemins (aléatoires) M L

Evolution du routage : “échange de liens”

14

Load-balancing vs évolution du routage

Nombre de liens distincts vus depuis le début de la mesure

1000

2000

3000

4000

5000

6000

7000

0 500 1000 1500 2000 2500 3000

Nom

bre

de lie

ns

Nombre de passes

pente

load-balancing

évolution du routage+ load-balancing

+ évolution du routage

15

Caractérisationde la dynamique :la pente d’évolution

[Magnien, Medem, Kirgizov et Tarissan, 2013]

La pente

0

10000

20000

30000

40000

50000

60000

70000

Sep Oct Nov Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct

Nom

bre

de lie

ns

Date

y = α x + β

α est la pente de la partie linéaire

16

α = f (paramètres du modèle)nombre total de liens

0

10000

20000

30000

40000

50000

60000

70000

80000

0 500 1000 1500 2000 2500 3000

# lie

ns

# rounds

m = 200 000

m = 800 000

m = 1200 000

Impact du nombre total de liensGraphes Erdős–Rényi (n = 100 000, d = 100, sw = 100)

17

α = f (paramètres du modèle)nombre total de destinations

0

20000

40000

60000

80000

100000

120000

0 500 1000 1500 2000 2500 3000

# lie

ns

# rounds

d = 500

d = 300

d = 100

Impact du nombre de destinationsGraphes Erdős–Rényi (n = 100 000, m = 200 000, sw = 100)

18

α = f (paramètres du modèle)

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

200000 400000 600000 800000 1e+06

α

m

d500200100

Un graphe aléatoire G (n,m)avec n nœuds et m liens

d nœuds comme destinations

19

La taille du sous-graphe des plus courts cheminscette taille augmente avec le nombre de destinations

α ∝ |sous-graphe||graphe| =

Sl

m

20

Impact de la taille du sous-graphe des plus courts chemins

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

200000 400000 600000 800000 1e+06

α

m

d500200100

Un graphe aléatoire G (n,m)avec n nœuds et m liens

d nœuds aléatoires commedestinations

α ≈ KSl

m

21

Impact de la taille du sous-graphe des plus courts chemins

0

5e-05

0.0001

0.00015

0.0002

0.00025

200000 400000 600000 800000 1e+06

α Sl

m

Un graphe aléatoire G (n,m)avec n nœuds et m liens

d nœuds aléatoires commedestinations

α ≈ KSl

m

21

Caractérisation de la dynamiqueConclusion

Erdős–Rényi : α ≈ KSlm

Power-law : α ≈ K ′Slm

Prévoir la pente sans exécuter les simulations coûteuses

Quelques comportements non linéaires et non-monotones

Comparison aux mesures réelles

Probabilité d’un changement à la place de la pente

22

La taille du sous-graphedes plus courts chemins :1 moniteur, 1 destination

[Kirgizov et Magnien, soumis]

Graphes aléatoires

G (n,p) est un graphe aléatoire à n sommets. Chacune desn(n − 1)/2 arêtes est présente avec probabilité p.

1951–1952 Solomonoff et Rapoport1959 Gilbert, Erdős et Rényi

SPS : sous-graphe des plus courts cheminsS : taille du sous-graphe des plus courts chemins

23

Graphes aléatoires

G (n,p) est un graphe aléatoire à n sommets. Chacune desn(n − 1)/2 arêtes est présente avec probabilité p.

1951–1952 Solomonoff et Rapoport1959 Gilbert, Erdős et Rényi

SPS : sous-graphe des plus courts cheminsS : taille du sous-graphe des plus courts chemins

u v

23

Graphes aléatoires

G (n,p) est un graphe aléatoire à n sommets. Chacune desn(n − 1)/2 arêtes est présente avec probabilité p.

1951–1952 Solomonoff et Rapoport1959 Gilbert, Erdős et Rényi

SPS : sous-graphe des plus courts cheminsS : taille du sous-graphe des plus courts chemins

u v

23

Graphes aléatoires

G (n,p) est un graphe aléatoire à n sommets. Chacune desn(n − 1)/2 arêtes est présente avec probabilité p.

1951–1952 Solomonoff et Rapoport1959 Gilbert, Erdős et Rényi

SPS : sous-graphe des plus courts cheminsS : taille du sous-graphe des plus courts chemins

u v

23

Proportion des liens qui se trouvent sur les plus courts chemins

Graphe Erdős-Rényi (n = 1000).Proportion des liens sur les plus courts chemins.Tous les noeuds sont les destinations.

[Guillaume et Latapy, 2005][Blondel, Guillaume, Hendrickx et Jungers, 2007]

24

Taille moyenne de SPS dans des graphes aléatoires

Fixons np 7→ E[S ]

0.0 0.2 0.4 0.6 0.8 1.0

220

40

60

80

p

E [S

]

25

Moyenne et tailles réelles de SPS

Fixons np 7→ {S}

0.0 0.2 0.4 0.6 0.8 1.0

2200

400

p

S

26

Moyenne et tailles réelles de SPS

Fixons np 7→ {S}

0.0 0.2 0.4 0.6 0.8 1.0

2200

400

p

S ???Un “trou” ?

26

Graphe complet : Kn

p = 1

Kn

SPS(u, v ) =u v

S(u, v ) = 2

27

Graphe quasi-complet : Kn − ab

p = 1− ε

a bKn−2

S(u, v ) ={n si {u, v} = {a, b} ,2 sinon .

Si n > 3, alors il y a un “trou”.

0.0 0.2 0.4 0.6 0.8 1.0

2200

400

p

S ici

28

Taille du SPS dans des graphes aléatoires

0.0 0.2 0.4 0.6 0.8 1.0

22

00

40

0

p

S

29

Taille du SPS dans des graphes aléatoires

0.0 0.2 0.4 0.6 0.8 1.0

22

00

40

0

p

S

dist=1

dist=2

dist=3dist=4

Y :nombre de nœuds qui sont directement liés à la fois à u et vY ∼ B(n − 2, p2)

29

Taille du SPS dans des graphes aléatoireséchelle logarithmique

1e−04 1e−03 1e−02 1e−01 1e+00

25

10

20

50

10

05

00

p

S

dist=1

dist=2

dist=3

30

Conclusion

Prévoir la taille du sous-graphe observable sans exécuter lessimulations coûteuses

Oscillations ont été expliquées

dist(u,v) = 2 : la loi exacte

dist(u,v) > 2 : une approximation de la taille attendue

31

Dynamique réelle etdynamique observée :

[Kirgizov, Magnien, Tarissan, Liu, 2013][Kirgizov et Queyroi, preprint, 2014]

α = f (∆)

0

10000

20000

30000

40000

50000

60000

70000

Sep Oct Nov Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct

Nom

bre

de lie

ns

Date

∆1 = 1m 25s

∆2 = 2m 50s

α = f (∆), où ∆ est le délai entre les mesuresα(∆1) > α(∆2)

32

α = f (∆)

0

10000

20000

30000

40000

50000

60000

70000

Nom

bre

de lie

ns

Date

∆1 = 1m 25s

∆2 = 2m 50s

RéalitéA→ . . .→ B → . . .→ C

∆1

A→ B → C

∆2

A→ C

|A ∪ C | ≤ |A ∪ B ∪ C |∆1 ≤ ∆2 ⇒⇒ α(∆1) ≥ α(∆2)

33

Situation attendueα

∆m

αm

αm est la pente maximale possible

34

Autre approche. Estimation du taux dechangements

Changements 〈X 〉: ◦′ ◦′′ ◦′′′ · · ·

Observations 〈Y 〉: •′ •′ •′′ · · ·pas de changement

changement

Question : estimer le taux des changements réelsPoisson paramétré par λ

λ 〈X 〉

〈Y 〉?

35

Estimateur

λ̂ = −∆−1 logW

N,

∆ – taille de l’intervalle de temps entre les observations ;W – nombre d’intervalles sans changement ;N – nombre total d’intervalles .

E[λ̂− λ

]≈ 1

2N∆

(eλ∆ − 1

)

limN→∞

E[λ̂]

= λ

36

λ estimée en fonction de ∆

0 2 4 6 8

0.04

0.06

0.08

λ̂

Processus de Poisson

0 2 4 6 8

0.04

0.06

0.08

∆λ̂

Modèle avec un graphesous-jacent Erdős-Rényi, SPSest mesurée à chaque round.

37

λ estimée en fonction de ∆

0 50 100 150 200 250 300

0.00

0.02

0.04

0.06

0.08

λ̂

Erdős-Rényi

0 50 100 150 200 250 300

0.00

0.02

0.04

0.06

0.08

λ̂

Power-law

0 20 40 60 80 100

0.0

0.5

1.0

1.5

2.0

λ̂

Mesures réelles

λ̂ pour SPT (m

d1 d2

) et SPS (m

d1 d2

) séquences.

38

Estimation de λConclusion

� Processus de Poisson =⇒ estimation possible

� Les autres cas ouvrent des directions de la recherche future.

39

Conclusion

� Modèle de la dynamique de l’Internet

� Relations entre les paramètres du modèle et lescaractéristiques de la dynamique

� La taille du sous-graphe des plus courts chemins

� Estimation du taux de changements

40

Perspectives

� Améliorer le modèle

� Etude plus approfondie de la taille du sous-grapheobservable

� Appliquer les méthodes développées à d’autres réseaux

41

Merci beaucoup

http://kirgizov.complexnetworks.fr/

Recommended