Contexte

La twittosphère représente l’ensemble des utilisateurs de Twitter. C’est un espace virtuel où prennent forme de nombreuses informations publiques, et où elles sont relayées en masse.

Comprendre qui sont les influenceurs de cet écosystème digital devient un enjeu important.

Or, l’influence est un concept multidimensionnel. Le nombre de followers ne suffit pas à déterminer l’influence réelle. Être influent, c’est avoir une position qui permet d’exercer un pouvoir. La position d’influence renvoie à une place centrale d’un acteur par rapport aux autres acteurs du réseau.

Mission

Votre mission consiste à analyser une communauté, c’est-à-dire des ensembles de comptes twitter échangeant les uns avec les autres sur le sujet. L’objectif est d’identifier qui a été le plus influent dans la twittosphère sur le #cybersecurite au cours du mois d’août 2020.

Déroulement

Le Data Challenge se déroulera en plusieurs phases :

  • une phase de collecte des données
  • une phase d’analyse
  • une phase de rédaction et de soumission d’un rapport
  • une phase de soutenance
Tâches

Les candidats peuvent former des équipes de 2 à 3 membres maximum.

Pour réussir ce challenge, les candidats devront réaliser les tâches suivantes :

  • Construire un jeu de données sur #cybersecurite
  • Analyser la communauté (structure du réseaux, cohésion, centralités, partition…)
  • Analyser les contenus
  • Analyser la dynamique
  • Lister les influenceurs en fonction de leur importance
  • Proposer des préconisations pour améliorer sa e-réputation sur la twittosphère

 

 

Livrables

Pour participer au challenge, chaque candidat doit s’inscrire au préalable sur le site web de Management & Data Science, en indiquant un prénom, un nom, une adresse email et une institution d’affiliation (université, école de commerce, entreprise, etc.).

Les candidats soumettent leurs résultat avant le vendredi 28 août 2020 à 13h en envoyant un email à l’adresse suivante : challenge@management-datascience.org .

L’email comportera :

  • en objet « challenge Twitter»
  • les noms, prénoms et affiliation de chaque membre de l’équipe
  • en pièce jointe, un rapport de 3 à 5 pages avec :
    • un titre et un résumé de 100 mots
    • une introduction qui rappelle le contexte, la problématique et ses enjeux,
    • une présentation du jeu de données utilisé,
    • la méthode et les étapes utilisées pour réaliser l’étude;
    • une analyse des résultats avec:
      • des statistiques descriptives
      • une cartographie des tweets
      • une cartographies des acteurs
      • une cartographie des mentions
      • la dynamique du réseau
    • des préconisations pour permettre à un acteur d’améliorer sa e-réputation sur la twittosphère;
    • une conclusion rapide qui montre l’intérêt de l’analyse des réseaux;
    • des références bibliographiques (éventuellement)
Évaluation

Les propositions seront évaluées selon les 4 critères suivant :

  • La pertinence: dans quelle mesure le Livrable répond à la mission ?
  • La rigueur : les résultats proposés sont-ils valides ? (robustesse de la démarche)
  • L’impact : quelle est la valeur de la contribution ?
  • La clarté : la solution proposée est-elle intelligible et pertinente ?
Classement

L’ensemble des propositions sera évalué et classé. Les meilleures propositions iront en finale. Les candidats finalistes présenteront leurs résultats à un jury pendant 10 minutes s’ensuivront 5 minutes de questions. Le jury désignera, ensuite, le groupe vainqueur.

Ressources

Les candidats pourront utiliser les outils suivants

  • NodeXL pour collecter les données sur twitter
  • Excel pour agréger et préparer les données
  • Gephi, pour analyser les réseaux sociaux

Un espace numérique de travail (datalab) est fourni aux candidat à l’adresse suivant: https://desktop.management-datascience.org/index.html

Ce datalab est une suite de services cloud regroupant différentes fonctions de stockage et de calcul. Il s’agit d’un environnement virtuel pour favoriser le travail collaboratif et encourager l’expérimentation. Le datalab est accessible 24h sur 24 depuis un simple navigateur web.

Des cours en ligne sont également fournis aux candidats pour les aider à réussir ce challenge et leur permettre d’améliorer la qualité de leur contribution. A l’issu de ce challenge, les participants seront capables de:

  • concevoir des indicateurs pour identifier un influenceur
  • connaître les fondements de la gestion de l’(e)réputation
  • comprendre le rôle des médias sociaux dans l’(e)réputation
  • analyser les réseaux sociaux et déployer une cartographie d’acteurs pour mesurer l’e-réputation

Les candidats doivent constituer leur propre jeu de données en aspirant les tweets du hashtag #cybersecurite au cours de la période de juillet à août 2020.

Collecte des données

A partir d’un compte Twiter, vous pouvez utiliser NodeXL (template excel) pour « aspirer les tweets » ou Visibrain (outil payant) si vous souhaitez avec l’exhaustivité

Fichiers

A toute fin utile, les fichiers suivants sont remis aux candidats :

  1. une extraction des tweets du #cybersecurite au 4 août 2020  Téléchargement
  2. une extraction des tweets du #cybersecurite au 12 août 2020  Téléchargement
  3. une extraction des tweets du #cybersecurite au 19 août 2020  Téléchargement
  4. une extraction des tweets du #cybersecurite au 26 août 2020  Téléchargement

Il vous appartient d’interpréter vous-même la signification de ces données : en effet, en situation réelle la sémantique précise d’une information n’est pas toujours explicite et vos stratégies d’interprétations des résultats seront alors conditionnées à diverses hypothèses quant à la signification portée par chaque colonne de vos fichiers.

Les résultats ne sont pas disponibles.