Analyser une communauté sur Twitter pour détecter le plus grand influenceur!

Partie 2
Chapitre 1 sur 3
Partie 2 – Analyse des réseaux sociaux

Introduction à l’analyse des réseaux sociaux

Enjeu

L’essor de l’Internet et du Web a popularisé l’observation de grands réseaux sociaux. Les nouvelles technologies de l’information permettent d’étudier et de surveiller tous les systèmes de relations, notamment : les réseaux de connaissance (deux individus sont reliés s’ils  se connaissent), les réseaux de contact physique (deux individus sont reliés s’ils ont été  physiquement en contact), les réseaux de collaboration (deux individus sont reliés s’ils  ont travaillé ensemble), les réseaux d’échanges (deux entités sont reliées si elles ont échangé un courrier électronique par exemple).

Qu’est-ce qu’un graphe?

L’analyse des réseaux sociaux considère la société comme un système d’individus reliés par des relations que l’on peut représenter sous la forme d’un graphe. Un graphe est un schéma constitué par un ensemble (supposé fini) de points et par un ensemble de flèches reliant chacune deux points. Les points, qui peuvent correspondre à des individus ou des structures, sont appelés « nœuds » et les flèches, « arcs » du graphe. Le graphe est donc un outil de visualisation des réseaux de relations, mais il est surtout un instrument pour calculer des propriétés relationnelles. On peut ainsi classer les nœuds et explorer les liens.

Ci-contre, on observe un graphe très simple, avec ses deux listes sources explicitées. Deux attributs sont ajoutés aux noeuds : un label (son nom) et un genre. Dans la liste des arêtes, les colonnes “Source” et “Target” réfèrent aux numéros d’identifiants des noeuds. Dans notre exemple, l’attribut de genre détermine la couleur des noeuds. La taille de ces derniers est dépendante de leur “degré” (le nombre d’arêtes qu’ils entretiennent avec les autres noeuds).

Source: Martin GrandJean

Construire un graphe

La réalisation d’un graphe est un processus qui comprend plusieurs étapes : la collecte des données relationnelles, la normalisation, la construction d’une liste de relations et l’analyse des réseaux.

Les caractéristiques des différentes étapes sont récapitulées dans le tableau ci-dessous.

étapes

Collecter

Normaliser Lister

Analyser

objectifs extraire des données d’une source primaire préparer les données pour être exploitables Définir les relations entre les acteurs traitement structural et statistique pour fournir des indicateurs
tâches
  • acquisition de données
  • veille pour les mises à jour
  • sélectionner
  • nettoyer
  • authentifier
  • dédoublonner
  • construire une liste d’adjacence
  • mesurer
  • classer
  • visualiser
output données sources données formatées données validées informations

Principales dimensions de l’analyse

L’analyse des réseaux est donc une méthode adaptée pour comprendre et formaliser les phénomènes complexes faisant intervenir un système de relations interactif. En effet, cette méthode permet de décrire, et de reconstituer, un réseau, de façon simplifiée à travers un graphe. Le graphe représente les interactions entre des objets reliés par des liens.

Pour analyser les réseaux, trois grandes dimensions peuvent être retenues.

  1. La première consiste à identifier les réseaux et à décrire la manière dont les structures de ces réseaux font peser des contraintes sur leurs membres. La connexité est un indicateur qui permet de définir la frontière du réseau au sein d’un graphe. Il y a un réseau, s’il existe toujours un chemin pour relier deux sommets de l’ensemble. Un réseau est donc une composante connexe d’un graphe.
  2. La seconde dimension permet d’identifier la position, plus ou moins dominante, d’un acteur dans le réseau. Elle peut s’évaluer à partir des approches de centralité définies par Freeman (Freeman 1979). La centralité de degré exprime la popularité d’un acteur dans le réseau, c’est-à-dire le nombre de connexions directes d’une entreprise aux autres. La centralité de proximité identifie les entreprises les plus proches des sources de pouvoir et d’influence, c’est-à-dire rapidement joignables par l’ensemble des autres membres du réseau.
  3. La troisième vise à dégager la cohésion des groupes homogènes au sein du réseau. Il s’agit d’analyser les similarités structurales dans le réseau. 2 acteurs sont donc structuralement équivalents s’ils ont des relations identiques avec les autres acteurs du réseau (White, 1981). Des techniques de partitionnement du réseau permettent de détecter des classes d’acteurs ayant une équivalence structurale.