52
COURS SYRRES RÉSEAUX SOCIAUX Jean-Loup Guillaume

Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

COURS SYRRES

RÉSEAUX SOCIAUX

Jean-Loup Guillaume

Page 2: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Le cours

http://jlguillaume.free.fr/www/teaching/Syrres/

Page 3: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Exemple 1 : Expérience de Milgram

Objectif

faire transiter une lettre depuis les Nebraska à un

agent de change de Boston

Une personne initie la chaine.

Transitions de la main à la main par des personnes que

l’on connait.

Page 4: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Expérience de Milgram (1967)

Résultats :

44 lettres arrivent sur 160.

Chemins avec 5 intermédiaires en moyenne.

Remarques :

Chemin interrompu ≠ Il n’existe pas de chemin.

Chemin de longueur x ≠ Il n’existe pas de chemin de longueur <x

Conclusions :

Il existe des chemins courts.

Les intermédiaires arrivent à les trouver sans connaissance globale du réseau.

Page 5: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Modélisation

Objectif : formaliser l’expérience de Milgram

Initialement une grille (amis proches).

On ajoute q voisins quelconques à chaque sommet (amis

lointains).

Page 6: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Modélisation

Un sommet connait :

Sa position, celle de ses voisins, celle de la destination.

Il envoie le message à son voisin le plus proche de la

destination.

Page 7: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Modélisation

Un seul lien supplémentaire pour chaque sommet u.

La destination choisie avec une probabilité

dépendant de sa distance à u.

Dans la majorité des cas, pas de chemins courts.

Page 8: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Exemple 2 : Kevin Bacon Game

Graphe des acteurs :

Deux acteurs sont reliés s’ils ont joué dans un même film.

Distance entre acteurs ?

http://oracleofbacon.org/

Distance entre Tom Cruise et Clint Eastwood ?

Distance entre Mickey Mouse et Omar Sy ?

Page 9: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Réponses (pas évidentes)

Clint Eastwood et Tom Cruise ?

Clint Eastwood / Morgan Freeman – Million dollar baby (2004)

Morgan Freeman / Tom Cruise – La guerre des mondes (2005)

Mickey Mouse et Omar Sy ?

Mickey avec Leonid Kinskey – Hollywood party (1934)

Leonid Kinskey avec Mickey Rooney – Manhattan Melodrama

(1934)

Mickey-Rooney/Jean-Guy Fechner – Bons baisers de Hong Kong (1975)

Jean-Guy Fechner / Omar Sy – Le carton (2004)

Page 10: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Modélisation

Graphe des acteurs simple à construire :

http://www.imdb.com/interfaces

Ensuite il ne reste qu’à faire des calculs de plus

courts chemins.

Page 11: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

09/03/2007Community detection: an overviewCircle of friends on boards.ie

© boards.ie

Page 12: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

09/03/2007Community detection: an overviewRelationship between key recovery agencies after Katrina

© thinkNola.com and orgnet.com

Page 13: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

09/03/2007Community detection: an overview

Page 14: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Beaucoup d’autres réseaux

Réseaux d'échanges pair-à-pair

Graphes d'appels téléphoniques

Internet

Graphes du Web

Graphes d’interactions entre protéines

Et bien d’autres (sociologie, linguistique, transport, finance, etc.)

Caractéristique commune :

grande taille, mais pas seulement

Page 15: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Objectifs

« Comprendre le comportement d'entités qui

interagissent par des lois gouvernant le système. »

On cherche à comprendre

la structure de ces graphes

leur évolution

les phénomènes agissant sur ces réseaux

Page 16: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Quelques applications

Informatique :

Réseaux : routage, protocoles, sécurité

P2P : conception de systèmes, déviances

Web : indexation, moteurs de recherche

Dessin de graphes, etc.

Sociologie :

Diffusion d'innovations, rumeurs

Identification de communautés

Epidémiologie :

Diffusion de virus, vaccination

Page 17: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Méthodologie

Utilisation d’outils formels

Théorie des graphes

Analyse statistique

Modélisation probabiliste

Études expérimentales

Simulation

Utilisation de données réelles

Étudier des applications

Comprendre en profondeur certains réseaux

Extraction de concepts généraux

Page 18: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Dans ce cours

Présentation du domaine et des problématiques :

Métrologie, analyse, modélisation, algorithmique

Détection de communautés (beaucoup)

Les concepts

La modularité

Survol des différents algorithmes

La dynamique

Réputation, innovations et leaders (un peu)

Page 19: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Projet

Construire des graphes à partir des données déjà

utilisées (Jester jokes) :

Utilisation de seuils pour la similarité.

Autres techniques ?

Tester un algorithme de détection de communauté :

Comparer tout ça, essayer de comprendre des choses

et essayer de l’expliquer.

Page 20: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

COURS SYRRES

GRAPHES DE TERRAIN

PRÉSENTATION GÉNÉRALE

Jean-Loup Guillaume

Page 21: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Les quatre axes

Métrologie :

Comment mesurer les réseaux réels ?

Analyse :

A quoi ressemblent-ils ?

Modélisation :

Peut-on créer des réseaux artificiels similaires ?

Algorithmique :

Comment calculer des choses sur ces grands graphes ?

Page 22: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Métrologie

Pour étudier un réseau réel il faut le mesurer, mais :

Qui a fait la mesure ?

Quelle proportion de l’objet a été mesurée ?

Combien de temps la mesure a duré ?

Y-a-t’il des contraintes spécifiques ?

Technologiques, biologiques, …

La mesure peut-elle être reproduite ?

Ces questions sont rarement abordées.

Page 23: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Métrologie

Étude du biais introduit par l’observation

Que dire de l’objet réel à partir de l’observation ?

Nouveaux protocoles de mesures, etc.

Évaluer la représentativité des « cartes »

G G’

observation

?

Page 24: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Métrologie du web

Processus de mesure :

Parcours en largeur depuis plusieurs sources.

Réseau : orienté, non connexe, dynamique.

Page 25: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Métrologie du web

Processus de mesure :

Parcours en largeur depuis plusieurs sources.

Réseau : orienté, non connexe, dynamique.

Page 26: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Métrologie du web

Processus de mesure :

Parcours en largeur depuis plusieurs sources.

Réseau : orienté, non connexe, dynamique.

Page 27: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Métrologie de l’internet

Processus de mesure :

Traceroute ~ (plus courts) chemins de plusieurs sources

vers plusieurs destinations.

Réseau : (non) orienté, pondéré (RTT, …)

Page 28: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Métrologie de l’internet

Processus de mesure :

Traceroute ~ (plus courts) chemins de plusieurs sources

vers plusieurs destinations.

Réseau : (non) orienté, pondéré (RTT, …)

Page 29: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Métrologie de l’internet

Processus de mesure :

Traceroute ~ (plus courts) chemins de plusieurs sources

vers plusieurs destinations.

Réseau : (non) orienté, pondéré (RTT, …)

Page 30: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Métrologie des réseaux sociaux

Processus de mesure :

Réseaux égocentrés.

Listes de diffusion, communautés, …

Réseau : orienté ou pas.

Page 31: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Métrologie des réseaux sociaux

Processus de mesure :

Réseaux égocentrés.

Listes de diffusion, communautés, …

Réseau : orienté ou pas.

Page 32: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Métrologie des réseaux d’échanges

Processus de mesure :

Trafic passant par un sommet.

Réseau : orienté, pondéré.

Page 33: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Métrologie des réseaux d’échanges

Processus de mesure :

Trafic passant par un sommet.

Réseau : orienté, pondéré.

Page 34: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Métrologie des réseaux d’échanges

Processus de mesure :

Trafic passant par un sommet.

Réseau : orienté, pondéré.

Page 35: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Métrologie des réseaux d’échanges

Processus de mesure :

Trafic passant par un sommet.

Réseau : orienté, pondéré.

Page 36: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Les quatre axes

Métrologie :

Comment mesurer les réseaux réels ?

Analyse :

A quoi ressemblent-ils ?

Modélisation :

Peut-on créer des réseaux artificiels similaires ?

Algorithmique :

Comment calculer des choses sur ces grands graphes ?

Page 37: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Analyse

Objectifs de l’analyse (statistique) :

Description (statistique).

Obtenir de l’information pertinente.

Interprétation des résultats obtenus.

Comment ? Propriétés connues.

Définition de propriétés (statistiques) pertinentes.

Corrélations entre ces propriétés.

Comparaison avec des graphes aléatoires.

Observation de la croissance des graphes, …

Page 38: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Propriétés étudiées

Distance moyenne :

À quelle distance les sommets sont les uns des autres ?

Page 39: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Propriétés étudiées

Distance moyenne

Clustering :

Les amis de mes amis… / densité locale

Page 40: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Propriétés étudiées

Distance moyenne

Clustering (densité locale)

Distribution des degrés (nombre de voisins) :

Taille ou salaire des individus ?

Page 41: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Propriétés étudiées

Distance moyenne

Clustering (densité locale)

Distribution des degrés

Autres propriétés :

Centralité

Nombre de plus courts chemins passant par un sommet, etc.

Corrélations entre propriétés

Degré-degré

Degré-clustering

Taille des cliques, cliques biparties, etc.

Page 42: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Propriétés communes aux GdT

Faible densité

Fort clustering (forte densité locale)

Faible distance moyenne

Distribution des degrés très hétérogène

Tous les graphes ne partagent pas ces propriétés

Page 43: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Les quatre axes

Métrologie :

Comment mesurer les réseaux réels ?

Analyse :

A quoi ressemblent-ils ?

Modélisation :

Peut-on créer des réseaux artificiels similaires ?

Algorithmique :

Comment calculer des choses sur ces grands graphes ?

Page 44: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Générer des graphes réalistes

Pour en faire quoi ?

Simuler des phénomènes (attaques, diffusion, …)

Évaluer des protocoles, des algorithmes, …

Comprendre.

Prévoir.

Page 45: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Tout aléatoire

Créer n sommets.

Ajouter m liens au hasard.

Donne une distance moyenne courte mais rien de

plus.

Page 46: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Coefficient de clustering

Mélanger un graphe très rigide.

Donne du clustering et une distance moyenne courte.

Page 47: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Distribution de degrés

Attachement préférentiel (rich get richer) :

Ajout de sommets un à un.

Ajout de lien vers des sommets déjà connectés.

Page 48: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Application : robustesse

Étude des phénomènes visant des sommets :

Internet : pannes ou attaques sur routeurs.

Réseaux sociaux : maladies, rumeurs, …

Échanges d’e-mails : virus informatiques.

Deux types d’atteintes

Pannes : aléatoires.

Attaques : ciblées.

But : Comprendre ces phénomènes pour pouvoir :

Prédire.

Construire des stratégies d’attaque/défense.

Page 49: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Impact d'une panne/attaque

Critères :

Basés sur la distance.

Tailles des composantes connexes.

Page 50: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Pannes = suppression aléatoire.

Attaque = suppression ciblée (degré).

Question : qui vacciner pour limiter une épidémie ?

Application : robustesse

Page 51: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Les quatre axes

Métrologie :

Comment mesurer les réseaux réels ?

Analyse :

A quoi ressemblent-ils ?

Modélisation :

Peut-on créer des réseaux artificiels similaires ?

Algorithmique :

Comment calculer des choses sur ces grands graphes ?

Page 52: Cours Syrres Réseaux sociaux - Freejlguillaume.free.fr/www/documents/teaching/syrres... · Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5

Besoin d’algorithmes spécifiques ?

Gros problème = taille :

Internet = Millions de sommets (routeurs).

Facebook = 350 millions d’utilisateurs actifs.

Web = Google connait plus de 1000 milliards d’URL distinctes (pas de pages distinctes).

Les algorithmes classiques ne sont pas utilisables :

Diamètre.

Compter les triangles d’un graphe (clustering).

Sans parler des problèmes NP-complet !

Utilisation d’algorithmes spécifiques ou approchés :

Détection de communautés.