180 likes | 281 Views
Sebastien Schnettler A Structure Overview of 50 years of small-world research Social Networks, 31:165-178, 2009. Samuel THIRIOT (IRIT-UT1) S é minaire r é seaux, 08/01/2010. Introduction. Sebastian Schnettler Center for Research on Inequality and the Life Course (CIQLE) Yale University
E N D
Sebastien SchnettlerA Structure Overview of 50 years of small-world researchSocial Networks, 31:165-178, 2009 Samuel THIRIOT (IRIT-UT1) Séminaire réseaux, 08/01/2010
Introduction • Sebastian Schnettler • Center for Research on Inequality and the Life Course (CIQLE) • Yale University • But du papier: donner un aperçu synthétique des recherches sur le « small-world » • Article dense, nombreuses références • Plan: • Historique • Taxinomie & review • Quelques réflexions
Histoire • Milgram: The small-world Problem • 1998: Watts & Strogatz • 1998 – nos jours : modèles formels
Histoire • 1902: Guglielmo Marconi (physicien Italien, prix Nobel 1902): combien de stations radio sont nécessaire pour couvrir le monde ? • 1929: Nouvelle du Hongrois Frigyes Karinthy: Chaînes (« Lánceszemek »), 1929 • 1949 (1979): De Sola Pool & Kochen: Contacts and Influence • Milgram: The small-world Problem • 1989-1998: le point • 1998: Watts & Strogatz • 1998 – nos jours : modèles formels
1900: Premières traces non académiques • Guglielmo Marconi (physicien Italien, prix Nobel 1902): combien de stations radio sont nécessaire pour couvrir le monde ? • Fin de la Ière guerre mondiale. On cherche à optimiser les cités, le trafic, etc. • Nouvelle du Hongrois Frigyes Karinthy:Chaînes (« Lánceszemek »), 1929 « Un jeu fascinant naquit de cette discussion. L'un de nous suggéra de préparer l'expérience suivante afin de prouver que la population de la planète est plus proche ensemble maintenant qu'elle ne l'a jamais été dans le passé. Nous devrions sélectionner n'importe quelle personne des 1,5 milliards d'habitants de la planète, n'importe qui, n'importe où. Il paria que, utilisant pas plus de cinq individus, l'un d'entre eux étant une connaissance personnelle, il pourrait contacter les individus choisis utilisant rien d'autre que le réseau des connaissances personnelles. »
Premières traces académiques • Ithiel de Sola Pool & Manfred Kochen rédigent en 1958 un document de travail sur les réseaux, “Contacts and Influence”, qui circulera pendant 20 ans parmi les chercheurs. • Définition intuitive du phénomène small-world: “My, it’s a small world !” « il est pratiquement certain que deux individus au hasard peuvent se contacter au moyen d'au moins deux intermédiaires. Dans une population structurée socialement cela est moins possible mais reste encore probable. Et peut-être pour la population mondiale entière, on aura besoin probablement seulement d'un seul individu de plus. » • Contacts and Influence sera finalement publié dans le tout premier numéro de Social NEtworks (1978) • Milgram travaille avec de Sola Pool & Kochen à Paris
Expérience de Milgram • Milgram crée une expérience pour vérifier l’effet small-world, par l’envoi de lettres • Le réseau étudié est celui des accointances: il faut connaître le prochain destinataire par son prénom • Résultat: 30% des chaines à destination, ~6.4 steps => folklore des 6 degrés de séparation • Papier dans Nature, puis plus détaillé dans Sociometrics • Réplications dans d’autres contextes (Erickson & Kringas, 1975) • Dont réplications dans des catégories sociales différentes: • Blancs vs. noirs (Korte & Milgram 1970, Lin et al 1977) • Juifs Ashkenaz vs. Orientaux (Weimann, 1983) • Femmes vs hommes (Lin et al. 1977) • Des organisations différentes: • Bureaucratisation (Lundberg 1975) • Graduated vs. Undergraduated (Stevenson et al., 1997) • Ou avec des supports différents: • Téléphone (Guiot 1976) • Email (Dodds et al. 2003 a,b)
1989-1998: take stock • 1989: The Small World, Kochen • Bouquin disparate, focalisé sur l’aspect structurel du phénomène small-world • La définition du phénomène small-world demeure qualitative: « The phenomenon of two strangers meeting in a place and discovering that they have a common acquaintance […]. It is related to the equally counter-intuitive fact that a chain of at most seven intermediaries, and more commonly 2 or 3 intermediaries, are sufficient to link most pairs of people in the world. This is the small-world phenomenon » (Kochen, 1989) • Recherches: • Modèles formels, dont des modèles regressifs (Doreian 1989) • Estimations du nombre d’accointances • Impact de la structure sociale sur la diffusion (ex: Burt and Uchiyama, 1989) • Peu d’activité… concept quasi délaissé en 1990.
Conceptualisation de Schnettler • Différenciation passif/actif (Watts 1999) • Comme toute grille d’analyse… discutable
1998: début des modèles formels • 1998, modèle de Watts & Strogatz • Travail fondateur: • nouvelle vague de recherche : the « new » science of networks • « complex networks » : grands réseaux • Intervention de physiciens: (ex Crossley 2005)supprot technique • de plus en plus de datasets disponibles (et ça va continuer (Bainbridge, 2007) ) • Recherches axées sur: • Les propriétés des réseaux • La dynamique sur ces réseaux (assez limité et partiel) • Cherchabilité des réseaux • définition small-world • Newman: « the fact that most pairs of vertices in most networks seem to be connected by a short path through the network » (Newman 2003, p181) • Watts Strogatz: high clustering & short average path length (Watts & Strogatz, 2002) • Barabasi-Albert: high clustering & short average path length & scale-free distribution
Structurel&passif: théorique & empirique small-world • Empirique: • Mis en évidence (démontré ?) par Milgram, dans une structure inconnue • Distance sous-estimée ? (faible participation • Sur estimée ? Problèmes de mémorisation, de recherche du contact • Mesuré sur des ensemble de données (fie sharing, acteurs, open source, boards, german firms, MSN…) • Mise en évidence d’individus “pont” & de rencontres aléatoires (Urry 2004) • Théorique: • court chemin géodésique: théoriquement, oui, même en random pur • court chemin & clustering: il suffit de quelques liens aléatoires pour créer l'effet petit monde (WS) Attention, les processus lui-même n'est pas réaliste (on ne part pas de l'ordre), pas plus que paramètres sans écho dans la réalité (Watts 2006): • Court chemin, clustering & scale-free: Barabasi Albert. Ici, ce sont les huibs qui créent l'effet petit monde • Attention, power law peut apparaître à cause d'autres mécanismes (Keller, 2005) • Modèles: Peut être utilisé pour décrire une structure qui n'est pas totalement connue • => Conditions d’apparition du petit monde = minimale
Structurel&Actif: Algorithmic small-world • L’expérience de Milgram montre qu’il existe des courts chemins, mais aussi qu’ils sont cherchables sur des informations locales • Watts-Strogatz: réseau non cherchable (pas de différenciation entre les liens locaux et distants) • Kleinberg: autre notion de distance. Ajout de poids au liens, qui influencent la proba de reconnection. Faible proba: cherchable, forte proba: pas cherchable • Watts: connaissance des groupes sociaux: info locale permet de chercher dans tout le réseau • Adamic: dans des réseaux scale-free, passer par des hubs
Process&Passif: Diffusion & co • Empirique: efficacité de la diffusion: • exemple de l'information sur un désastre local (Erickson, 78&79). En une heure, 80% des interviewés ont entendu parler du pb – 8.1% direct, 89.2% indirect, 2.7% médias • Diffusion d'innovations (Coleman 1957): plus long ! • … mais parfois avec une structure très différente: • diffusion d'une pétition traçable électroniquement (Liben-Nowell and Kleinberg 2008): chaines de pls centaines • Conceptualisation: • Centola & Macy: diffusion simple ou complexe • Pondération des liens (Van der Leij and Goyal, 2006) • => les processus de diffusion ne sont pas assez généraux, il faut spécialiser les études sur les réseaux pour chaque phénomène
Process&Actif: Search process • Différence entre structure & possibilité de chercher • (Milgram 1977, p294): Si tout le monde est à 5.5 personnes du président, cela ne veut pas dire que ces gens sont vraiment proches. Mathématiquement, c'est petit. Psychologiquement, c'est une distance énorme. Ils ne sont pas à 5 personnes de distance, mais à 5 cercles relationnels, ou 5 structures. • S’oppose aux tenants du capital social qui pensent qu’il augmente de façon exponentielle (Lin 2001). • Usage réel des chaînes ? • Erickson & Kringas: chaines qui permettent aux résidents d'ottawa de contacter leurs représentants: 16/250 chaines réussissent (2 steps). Plusieurs notent qu'ils utiliseraient pas ces chaines pour agir • Granovetter: job, présenté comme un succès: direct ou 1 intermédiaire: 84%, 2 inter: 12.5%, 3 inters: 3.1%, pas plus de 4 ! • => Les chaînes courtes ont-elle une signification pour le comportement réel ? • Résultat inverse: (Lee 1969): recherche pour avortement illégal: 12% chaine de 9 ou plus !, ~5, succès 70/114 (mais plusieurs recherches) • Pistes: • Peu de recherches dans cet axe (Granovetter…) • notion d'incentives pour la recherche (Magnani 2005, Heckathorn 1997)
Psychological: finding pathes • 3 axes: • représentation cognitive de la structure • Surprise: les individus sont-ils conscients de la structure dans laquelle ils sont ? • Quelles stratégies de recherche ? • récupération en mémoire des liens très imparfaite (Bell et al. 2007, Killworth & Bernard 1976) • => même si les individus sont rationnels, résultat biaisé • Mécanismes de recherche des liens mal connus • Une seule étude (Killworth et al., 2006) sur l'efficacité de cette recherche en connaissant toute la structure; 50% plus long que l'optimal
Résumé • L’effet small-world a été identifié dans de nombreux jeux de données; ses conditions d’apparition sont minimales. • On trouve des chaînes moyenne de même taille (~5.5) sur de nombreuses études empiriques et par des modèles théoriques • On n’en sait pas tant que cela… (expériences contradictoire, facteurs explicatifs inconnus) • La tendance est à l’usage de données électroniques; mais un retour à de l’expérimental (sciences humaine) sera peut-être nécessaire pour répondre à plusieurs questions.
Questions ouvertes sur le search • La plupart des études sur le search portent sur le cas artificiel de l’expérience de Milgram. Qu’en est-il pour d’autres types de search ? • Compliqué ! Un but, plusieurs buts, pas de but ? Mieux identifier chaque cas… • Différentes stratégies: être introduit auprès du maillon suivant, ou pas • => pas d’heuristique généralisable, il faut explorer chaque aspect • Facteurs expliquant le succès ou l'échec: confiance, incentives, tie strength, bridges… une nouvelle expérience de Milgram comparative ? • Retour à l’individu: quels individus ont accès aux ressources ? Lesquels savent rechercher ? (affiliations ?) Quel est exactement le rôle des hubs ? • Efficacité de la recherche d’information comparé à autre chose ? (Web, presse...)
Questions ouvertes • social networks are special (hyper complexity) • différents processus sociaux: ressources, power, communication... • définition de la structure pas claire: amitié, accointances, fraternité. Dépend de ce qui nous intéresse • => multiplicité & interférences: quels liens entre différents types de relations ? Par exemple, hiérarchie / amitié, etc. Blockmodelling, mais encore ? • => implications réelle du type de lien sur ce qui y passe. Accointance: très inclusif. On peut être lié à tout le monde par 5 étapes; ce n'est pas pour autant que le SRAS va se diffuser partout ! Le monde est-il un réseau unique ? • Les caractéristiques « small-world » ou « scale-free » ne définissent pas complètement le réseau. Ne peut-on pas se baser sur les processus de formation des réseaux pour créer des choses plus réalistes ?