Réseaux sociaux: une analyse centrée sur l'individu
Alina STOICAOrange Labs & LIAFA
– p 2LIP6 10/06/2010Alina Stoica
Laboratoire SENSE: Sociologie des usages
Etudes du comportement de l'utilisateur (du client): Approche "qualitative": entretiens, enquêtes qualitatives
Approche "quantitative": études des traces d'usages• Communications par téléphone mobile• Utilisations des plateformes sociales en ligne (MySpace, Flickr, Twitter,
développées par Orange etc.)
Connaissance des clients: développement de services, offres adaptés, ciblage de clients etc.
– p 3LIP6 10/06/2010Alina Stoica
Bases de données (1)
Téléphonie mobile:
liste des communications entre les clients d'Orange en Belgique
Numéros chiffrés => identifiants Toutes les communications (appels et SMS) impliquant un ou deux clients Un mois de communication Données sociodémographiques (âge et sexe)
– p 4LIP6 10/06/2010Alina Stoica
Bases de données (2) Plateformes en lignes:
aspirations de profils à partir de quelques profils initiaux
BFS Toutes les informations du profil Liens déclarés avant l'aspiration
– p 5LIP6 10/06/2010Alina Stoica
Caractérisation des clients: analyse des usages
Téléphonie mobile: Nombre d'appels, durée, fréquence, nombre de SMS etc. Croiser avec les données sociodémographiques
Plateformes en lignes: Nombre de commentaires, quantité de contenu publié etc. Croiser avec les autres informations du profil
– p 6LIP6 10/06/2010Alina Stoica
Caractérisation des clients: analyse du réseau social
On modélise les relations observées
entre des personnes par
un graphe (réseau social)
les nœuds: les individus les liens correspondent aux relations observées
– p 7LIP6 10/06/2010Alina Stoica
Caractérisation des clients: approche centrée sur l'individu
Décrire comment chaque nœud (individu) est connecté dans le réseau
Analyse de la structure locale du réseau, autour de chaque nœud
Gros volumes de données
mesures avec petite complexité
– p 8LIP6 10/06/2010Alina Stoica
La méthode proposée Etape1: calcul du réseau égocentré d'un nœud (ego)
lister les triangles contenant ego
Eg(ego)
– p 9LIP6 10/06/2010Alina Stoica
Etape 2: énumération des patterns dans le réseau égocentré
– p 10LIP6 10/06/2010Alina Stoica
Exemple
10 nœuds: 4 isolés 5 liens: 1 isolés 2
1
1
– p 11LIP6 10/06/2010Alina Stoica
Description des liens formés par ego (positions de ses voisins)
Après étape 2: description de la façon dont ego est connecté dans le réseau
Etape 3: calcul des positions occupées par les contacts d'ego
Plusieurs positions dans un pattern:
– p 12LIP6 10/06/2010Alina Stoica
Etape 2: énumération des patterns dans le réseau égocentré Etape 3: calcul des positions dans les patterns
– p 13LIP6 10/06/2010Alina Stoica
Un autre exemple Etape1: calcul du réseau égocentré d'un nœud (ego)
– p 14LIP6 10/06/2010Alina Stoica
– p 15LIP6 10/06/2010Alina Stoica
Avantages
Applicable à tout réseau Connaissance locale du réseau Rapide
Motifs caractéristiques Description de la structure locale
Ego Les contacts d'ego (les liens d'ego)
Application Le réseau de téléphonie mobile Mobistar (Orange en Belgique)
– p 17LIP6 10/06/2010Alina Stoica
La base de données
Les communications (appels et SMS) des clients de Mobistar pendant octobre 2006
Un enregistrement: Les identifiants (anonymisés) des deux personnes L'heure La durée Le type (appel vocal ou SMS)
Pour chaque jour, 10 millions communications avec plus de 3 millions clients
– p 18LIP6 10/06/2010Alina Stoica
Le réseau social
Les nœuds: les clients de Mobistar Un lien entre deux nœuds:
au moins une communication dans chaque sens
3 millions de nœuds 6 millions de liens
– p 19LIP6 10/06/2010Alina Stoica
Patterns caractéristiques (1) Un pattern est "caractéristique" si:
Définition 1: son nombre d'occurrences dans les réseaux égocentrés est supérieur à un seuil donné
– p 20LIP6 10/06/2010Alina Stoica
Patterns caractéristiques (2) Un pattern est "caractéristique" si:
Définition 2: le nombre de réseaux égocentrés le contenant est supérieur à un seuil donné
– p 21LIP6 10/06/2010Alina Stoica
Patterns caractéristiques (3) Un pattern est "caractéristique" si :
Définition 3: son nb d'occurrences dans les réseaux égocentrés est supérieur au nb d'occurrences dans des réseaux générés aléatoirement
Pour chaque réseau égocentré, plusieurs générations en utilisant Orbis [1]
[1] P. Mahadevan, D. Krioukov, K. Fall and A. Vahdat, “Systematic topology analysis and generation using degree correlations,” SIGCOMM, 2006
– p 22LIP6 10/06/2010Alina Stoica
Positions des contacts d'ego
– p 23LIP6 10/06/2010Alina Stoica
Positions des contacts d'ego: la fréquence des appels
En moyenne, pour chaque motif:
Le contact qui parle le plus souvent avec ego
Les contacts suivants et
Le contact qui parle peu avec ego
– p 24LIP6 10/06/2010Alina Stoica
Positions des contacts d'ego: la fréquence des appels
– p 25LIP6 10/06/2010Alina Stoica
Positions des contacts d'ego: la durée des appels
En moyenne, pour chaque motif:
Le contact qui la plus grande fréquence d'appel
Le contact qui la plus grande durée d'appel et
Le contact qui parle peu avec ego
– p 26LIP6 10/06/2010Alina Stoica
Commentaires sur les résultats Licoppe C., Smoreda Z., 2005, “Are social networks
technologically embedded? How networks are changing today with changes in communication technology,” Social Networks, vol. 27, no. 4, pp. 317–335
Deux registres de communication: Présence connectée Présence intermittente
Application Le réseau des artistes sur MySpace: Analyse de la popularité en ligne
– p 28LIP6 10/06/2010Alina Stoica
L'artiste MySpace, entrepreneur de sa notoriété
Nb de visites de la page
Nb de commentairesNb d'amis
"marketing de soi-même"
– p 29LIP6 10/06/2010Alina Stoica
Construction des données
Nb. total de profiles (artist ou fan) 21 153Nb. de profiles artist 13 936Nb. total de liens 143 831
Nb. de liens entre artistes 83 201
Réciprocité des liens 40.1%
Artists avec label “Major” 3 422
Artists avec label “Indie” 7 069
Artists sans label 3 445
Aspiration BFS à partir de 7 profils initiaux
– p 30LIP6 10/06/2010Alina Stoica
Clustering des artistes à partir de la popularité en ligne
On caractérise chaque artiste par un vecteur: Nb. de visites de sa page
audience Nb. de commentaires laissés sur sa page Nb. de gens l'avoir déclaré comme meilleur ami (autorité) Nb. d'artistes l'avoir déclaré comme meilleur ami (autorité artistique) Réciprocité de ses liens Label: "Major" (=3), "Indie" (=2) ou "Other" (=1)
On groupe les individus avec Kohonen SOM
– p 31LIP6 10/06/2010Alina Stoica
Résultat SOM
– p 32LIP6 10/06/2010Alina Stoica
Clustering des cellules
k-means clustering + expectation maximization algorithm
5 clusters
– p 33LIP6 10/06/2010Alina Stoica
Description des clusters Vert (3): superstars, avec le plus de notoriété, à la fois influents et
autoritaires; élites MySpace, avec une forte stratégie marketing online, populaires dans les medias traditionnels
Bleu foncé (2): artistes influens avec une notoriété plus faible que les superstars mais avec une stratégie marketing efficace; souvent trendy, avant-garde music.
Orange (5): artistes dynamiques d'un point de vue social, avec audience faible; groupes d'artistes non-professionnels bien intégrés dans des scènes locale
Bleu (1): artistes avec une audience moyenne, faible autorité et peu de liens réciproques; sans stratégie MySpace importante
Rouge (4): artistes anonymes avec peu d'audience et sans pratique sociale active
Nord
Sud
Ouest Est
Audience + Autorité
Réciprocité
– p 34LIP6 10/06/2010Alina Stoica
A degré égal
– p 35LIP6 10/06/2010Alina Stoica
A nombre de liens égal
– p 36LIP6 10/06/2010Alina Stoica
Caractérisation des liens
En utilisant les positions dans les patterns:
Clusters 1 et 4: liens sortants vers 3
Cluster 2: liens réciproques avec lui-même
Cluster 3: liens réciproque avec lui-même dans les positions centrales et intermédiaires liens entrants avec 4 dans les positions périphériques
Cluster 5: liens réciproques avec 2 et 5 dans les positions centrales liens sortant vers 3 dans les autres positions
– p 37LIP6 10/06/2010Alina Stoica
On peut envisager de
Faire des catégories de nœuds pour grouper les nœuds qui se connectent de la même façon au réseau
rôle identifier les nœuds "spéciaux"
nœuds influents, leaders sociaux comparer à des caractéristiques exogènes au réseau
prédiction
Mesurer l'évolution
Merci!