380 likes | 461 Views
Réseaux sociaux: une analyse centrée sur l'individu. Alina STOICA Orange Labs & LIAFA. Laboratoire SENSE: Sociologie des usages. Etudes du comportement de l'utilisateur (du client): Approche "qualitative": entretiens, enquêtes qualitatives
E N D
Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA
Laboratoire SENSE: Sociologie des usages • Etudes du comportement de l'utilisateur (du client): • Approche "qualitative": entretiens, enquêtes qualitatives • Approche "quantitative": études des traces d'usages • Communications par téléphone mobile • Utilisations des plateformes sociales en ligne (MySpace, Flickr, Twitter, développées par Orange etc.) • Connaissance des clients: développement de services, offres adaptés, ciblage de clients etc.
Bases de données (1) • Téléphonie mobile: liste des communications entre les clients d'Orange en Belgique • Numéros chiffrés => identifiants • Toutes les communications (appels et SMS) impliquant un ou deux clients • Un mois de communication • Données sociodémographiques (âge et sexe)
Bases de données (2) • Plateformes en lignes: aspirations de profils à partir de quelques profils initiaux • BFS • Toutes les informations du profil • Liens déclarés avant l'aspiration
Caractérisation des clients: analyse des usages • Téléphonie mobile: • Nombre d'appels, durée, fréquence, nombre de SMS etc. • Croiser avec les données sociodémographiques • Plateformes en lignes: • Nombre de commentaires, quantité de contenu publié etc. • Croiser avec les autres informations du profil
Caractérisation des clients: analyse du réseau social • On modélise les relations observées entre des personnes par un graphe (réseau social) • les nœuds: les individus • les liens correspondent aux relations observées
Caractérisation des clients: approche centrée sur l'individu • Décrire comment chaque nœud (individu) est connecté dans le réseau • Analyse de la structure locale du réseau, autour de chaque nœud • Gros volumes de données mesures avec petite complexité
La méthode proposée • Etape1: calcul du réseau égocentré d'un nœud (ego) lister les triangles contenant ego Eg(ego) ego
Exemple • 10 nœuds: 4 isolés • 5 liens: 1 isolés • 2 • 1 • 1
Description des liens formés par ego (positions de ses voisins) • Après étape 2: description de la façon dont ego est connecté dans le réseau • Etape 3: calcul des positions occupées par les contacts d'ego • Plusieurs positions dans un pattern:
Etape 2: énumération des patterns dans le réseau égocentré • Etape 3: calcul des positions dans les patterns
Un autre exemple • Etape1: calcul du réseau égocentré d'un nœud (ego)
Avantages • Applicable à tout réseau • Connaissance locale du réseau • Rapide • Motifs caractéristiques • Description de la structure locale • Ego • Les contacts d'ego (les liens d'ego)
Application Le réseau de téléphonie mobile Mobistar (Orange en Belgique)
La base de données • Les communications (appels et SMS) des clients de Mobistar pendant octobre 2006 • Un enregistrement: • Les identifiants (anonymisés) des deux personnes • L'heure • La durée • Le type (appel vocal ou SMS) • Pour chaque jour, 10 millions communications avec plus de 3 millions clients
Le réseau social • Les nœuds: les clients de Mobistar • Un lien entre deux nœuds: • au moins une communication dans chaque sens • 3 millions de nœuds • 6 millions de liens
Patterns caractéristiques (1) • Un pattern est "caractéristique" si: Définition 1: son nombre d'occurrences dans les réseaux égocentrés est supérieur à un seuil donné
Patterns caractéristiques (2) • Un pattern est "caractéristique" si: Définition 2: le nombre de réseaux égocentrés le contenant est supérieur à un seuil donné
Patterns caractéristiques (3) • Un pattern est "caractéristique" si : Définition 3: son nb d'occurrences dans les réseaux égocentrés est supérieur au nb d'occurrences dans des réseaux générés aléatoirement • Pour chaque réseau égocentré, plusieurs générations en utilisant Orbis [1] [1] P. Mahadevan, D. Krioukov, K. Fall and A. Vahdat, “Systematic topology analysis and generation using degree correlations,” SIGCOMM, 2006
Positions des contacts d'ego: la fréquence des appels • En moyenne, pour chaque motif: • Le contact qui parle le plus souvent avec ego • Les contacts suivants et • Le contact qui parle peu avec ego
Positions des contacts d'ego: la durée des appels • En moyenne, pour chaque motif: • Le contact qui la plus grande fréquence d'appel • Le contact qui la plus grande durée d'appel et • Le contact qui parle peu avec ego
Commentaires sur les résultats • Licoppe C., Smoreda Z., 2005, “Are social networks technologically embedded? How networks are changing today with changes in communication technology,” Social Networks, vol. 27, no. 4, pp. 317–335 • Deux registres de communication: • Présence connectée • Présence intermittente
Application Le réseau des artistes sur MySpace: Analyse de la popularité en ligne
L'artiste MySpace, entrepreneur de sa notoriété Nb de visites de la page Nb de commentaires Nb d'amis "marketing de soi-même"
Construction des données Aspiration BFS à partir de 7 profils initiaux
Clustering des artistes à partir de la popularité en ligne • On caractérise chaque artiste par un vecteur: • Nb. de visites de sa page audience • Nb. de commentaires laissés sur sa page • Nb. de gens l'avoir déclaré comme meilleur ami (autorité) • Nb. d'artistes l'avoir déclaré comme meilleur ami (autorité artistique) • Réciprocité de ses liens • Label: "Major" (=3), "Indie" (=2) ou "Other" (=1) • On groupe les individus avec Kohonen SOM
Clustering des cellules • k-means clustering + expectation maximization algorithm 5 clusters
Description des clusters Nord Est Ouest Réciprocité Audience + Autorité Sud Vert (3):superstars, avec le plus de notoriété, à la fois influents et autoritaires; élites MySpace, avec une forte stratégie marketing online, populaires dans les medias traditionnels Bleu foncé (2): artistes influens avec une notoriété plus faible que les superstars mais avec une stratégie marketing efficace; souvent trendy, avant-garde music. Orange (5): artistes dynamiques d'un point de vue social, avec audience faible; groupes d'artistes non-professionnels bien intégrés dans des scènes locale Bleu (1): artistes avec une audience moyenne, faible autorité et peu de liens réciproques; sans stratégie MySpace importante Rouge (4): artistes anonymes avec peu d'audience et sans pratique sociale active
Caractérisation des liens En utilisant les positions dans les patterns: • Clusters 1 et 4: liens sortants vers 3 • Cluster 2: liens réciproques avec lui-même • Cluster 3: • liens réciproque avec lui-même dans les positions centrales et intermédiaires • liens entrants avec 4 dans les positions périphériques • Cluster 5: • liens réciproques avec 2 et 5 dans les positions centrales • liens sortant vers 3 dans les autres positions
On peut envisager de • Faire des catégories de nœuds pour • grouper les nœuds qui se connectent de la même façon au réseau rôle • identifier les nœuds "spéciaux" nœuds influents, leaders sociaux • comparer à des caractéristiques exogènes au réseau prédiction • Mesurer l'évolution