Citation
Les auteurs
Olivier Mamavi
(omamavi@gmail.com) - Paris School of Business - ORCID : https://orcid.org/0000-0002-6421-1048Romain Zerbib
(romainzerbib@yahoo.fr) - ICD Business School
Copyright
Déclaration d'intérêts
Financements
Aperçu
Contenu
L’avènement des plateformes numériques a bouleversé les modes d’interaction et de création de contenu en ligne (Assadi, 2018; Béjean et al., 2022; Isckia et al., 2020). En s’appuyant sur une communauté, ces plateformes permettent, entre autres, de résoudre des problèmes, de partager des expériences et de développer des compétences (Lu et al., 2019). Mais l’une des conditions fondamentales de la survie de ces plateformes est d’organiser et de favoriser l’engagement des membres de la communauté à produire et partager du contenu (Mamavi & Zerbib, 2022).
L’engagement est une décision que prennent les utilisateurs et qui se manifeste par les implications et les interactions au sein d’une communauté. Cet engagement ne se mesure pas uniquement par la quantité de participation (nombre de messages, de partages…), mais aussi par la qualité des interactions (discussions pertinentes, respect entre membres…). Comprendre l’engagement des utilisateurs au sein d’une communauté virtuelle (c’est-à-dire les préférences, les jugements et les processus) est devenue crucial pour le succès de ces plateformes.
Cet article présente un ensemble de données collectées sur une plateforme dédiée à la transformation numérique. L’analyse de ces données, issues des journaux de connexion, permettra d’explorer l’engagement des utilisateurs et d’apporter des éclairages précieux sur ce phénomène.
L’objectif principal de l’article est de porter à la connaissance de la communauté scientifique l’existence, l’originalité, la qualité et la disponibilité de cet ensemble de données. Il met également en lumière la valeur de ces données et leur potentiel de réutilisation pour de futures recherches dans divers domaines (management, économie comportementale, sociologie, psychologie, neuroscience…).
Présentation des données
Source des données
Les données sont issues de la plateforme Management & Data Science.
Créée en 2017, la plateforme est un espace communautaire spécialisé dans la transformation numérique. Les membres peuvent produire et partager des connaissances sous la forme d’articles, de scripts, de jeux de données ou de tutoriels (Mamavi & Zerbib, 2021; Mamavi, 2019). La plateforme organise également des challenges numériques, qui sont des compétitions basées sur le modèle d’enchères et inspirées des hackathons afin de résoudre en commun des problèmes (Mamavi & Zerbib, 2024).
Ouverture des données
La politique d’ouverture des données adoptée par la plateforme Management & Datascience (MDS) s’aligne sur les principes de l’Open Science (Budapest Open Access Initiative, 2002), visant à rendre la recherche accessible à tous les niveaux de la société. Cette politique repose également sur le principe de l’Open Innovation (Chesbrough, 2003), qui décrit la manière dont les organisations utilisent à la fois des connaissances internes et externes pour progresser. Cette stratégie d’ouverture de MDS est cruciale pour plusieurs raisons :
- Un tremplin pour la recherche : La reproductibilité et la validation des résultats de recherche seront facilitées par l’accès ouvert aux données, favorisant le progrès scientifique. De nouvelles pistes de recherche et théories pourront émerger, tandis que la transparence et la rigueur des travaux seront renforcées, renforçant la confiance du public dans les résultats scientifiques.
- Un terreau fertile pour l’innovation : L’accès aux données de la plateforme permettra aux chercheurs et développeurs de concevoir des produits, services et solutions innovants. Ils pourront développer de nouveaux algorithmes d’apprentissage automatique, identifier des tendances émergentes et générer des informations exploitables. Cette ouverture favorisera également la collaboration entre chercheurs et acteurs du secteur privé, accélérant les percées et l’impact des innovations.
- Un atout pour l’éducation et la communauté : Les données ouvertes serviront de ressource pédagogique pour enseigner les concepts de la data science et de l’analyse de données aux étudiants, préparant la prochaine génération de chercheurs et professionnels aux défis du monde réel. Elles favoriseront également la collaboration et le partage des connaissances entre chercheurs et praticiens, dynamisant et engageant la communauté autour de la data science et du management.
Description des données
Structure du jeu de données
L’ensemble des données est actuellement organisé autour de 17 jeux de données anonymisées. Le schéma ci-dessous fournit une description formelle de la structure du jeu de données. Il définit les tables, les champs (ou colonnes), les types de données, les clés et les relations entre les tables.
- Tables : Les tables sont les éléments de base d’une base de données relationnelle. Elles stockent des données sur un sujet particulier, comme les clients, les commandes ou les produits.
- Champs (colonnes) : Les champs sont les unités individuelles de stockage de données dans une table. Chaque champ a un nom et un type de données, qui spécifient le type d’informations qu’il peut stocker.
- Types de données : Les types de données définissent les types de valeurs qui peuvent être stockées dans un champ. Les types de données courants incluent les entiers, les chaînes de caractères, les dates et les heures, et les booléens.
- Clés : Les clés sont utilisées pour identifier de manière unique les enregistrements dans une table. La clé primaire est une clé unique qui identifie de manière définitive chaque enregistrement. Les clés étrangères sont utilisées pour référencer des enregistrements dans d’autres tables.
- Relations : Les relations définissent les liens entre les tables. Les deux types de relations les plus courants sont les relations un-à-un et les relations un-à-plusieurs. Une relation un-à-un indique qu’un enregistrement dans une table est associé à un seul enregistrement dans une autre table. Une relation un-à-plusieurs indique qu’un enregistrement dans une table est associé à plusieurs enregistrements dans une autre table.
Structure des jeux de données de Management & Datascience
Variables sur l’engagement
Un jeu de données (table) en particulier dénommé « action_name » permet de mesurer les actions spécifiques effectuées par un visiteur sur la plateforme. Vous trouverez ci-dessous une description des principales variables dépendantes qui permettent de mesurer l’engagement des utilisateurs.
USER | REGISTER | Inscription complétée après l’affichage de la demande de vérification de l’email d’activation. |
ACTIVATE | Compte activé avec confirmation sur l’écran dédié. | |
VISIT PROFILE | Profil personnel visité par l’utilisateur connecté | |
VISIT ACTIVITY | Page d’activité du profil consultée par l’utilisateur connecté | |
MODIFY PROFILE | Mise à jour du profil après enregistrement des modifications par l’utilisateur connecté. | |
QUIT | Compte supprimé après soumission du formulaire dédié par l’utilisateur connecté. | |
REACTION | LIKE | Appréciation donné à une ressource via le bouton approprié |
SHARE | Ressource partagée via le bouton de partage | |
EVALUATE | Évaluation ajoutée à une ressource par un utilisateur connecté | |
CITE | Citation récupérée depuis une page de ressource | |
Page de ressource imprimée | ||
PDF d’une ressource ouvert | ||
COMMENT | Discussion entamée par un commentaire sur une ressource par un utilisateur connecté | |
COMMENT EVALUATION | Discussion entamée par un commentaire sur une évaluation par un utilisateur connecté | |
PUBLISH | FRONT-END CREATE | Création d’une ressource via le formulaire en ligne par un utilisateur connecté |
FRONT-END SUBMIT | Soumission d’une ressource via le bouton dédié par un utilisateur connecté | |
FRONT-END MODIFY | Modification d’une ressource enregistrée via le formulaire en ligne par un utilisateur connecté | |
FRONT-END DELETE | Suppression d’une ressource via le bouton dédié ou depuis la page d’activité par un utilisateur connecté | |
EDITOR CREATE | Création d’une ressource en backend par un éditeur connecté | |
EDITOR MODIFY | Modification d’une ressource en backend par un éditeur connecté | |
EDITOR PUBLISH | Publication (changement de statut à ‘publié’) d’une ressource en backend par un éditeur connecté | |
EDITOR DELETE | Suppression d’une ressource en backend par un éditeur connecté | |
VISIT OWN PUBLICATION | Consultation d’une ressource dont on est auteur ou coauteur par un utilisateur connecté | |
PARTICIPATE | BEGIN COURSE | Cours commencé via le bouton approprié par un utilisateur connecté |
VISIT LESSON | Leçon de cours consultée par un utilisateur connecté | |
FINISH LESSON | Leçon de cours marquée comme terminée par un utilisateur connecté | |
UNFINISH LESSON | Leçon de cours marquée comme non terminée par un utilisateur connecté | |
END COURSE | Cours terminé via le bouton approprié par un utilisateur connecté | |
JOIN DISCUSSION | Participation à une discussion existante par un utilisateur connecté | |
CREATE CONTRIBUTION | Contribution à un projet débutée via le formulaire dédié par un utilisateur connecté | |
CREATE DOCUMENT | Document lié à un projet créé par un utilisateur connecté | |
SUBMIT CONTRIBUTION | Contribution à un projet soumise par un utilisateur connecté | |
VISIT CONTRIBUTED PROJECT | Projet auquel on a contribué visité par un utilisateur connecté | |
ANIMATE | REPLY OWN DISCUSSION | Réponse ajoutée à une discussion initiée par soi-même par un utilisateur connecté |
VISIT OWN ISSUE | Consultation d’un numéro éditorial dont on est éditeur ou coéditeur par un utilisateur connecté | |
CLOSE ISSUE | Clôture d’un numéro éditorial par un éditeur connecté | |
VISIT OWN COLLECTION | Consultation d’une collection éditoriale dont on est éditeur ou coéditeur par un utilisateur connecté | |
MODIFY COLLECTION | Modification d’une collection éditoriale par un éditeur connecté | |
VISIT OWN PROJECT | Consultation d’un projet dont on est créateur ou animateur par un utilisateur connecté | |
CHANGE PROJECT STEP | Changement de l’étape d’un projet par un créateur connecté | |
EVALUATE CONTRIBUTION | Évaluation d’une contribution à un projet par un utilisateur connecté |
Variables sur les utilisateurs
Plusieurs autres jeux de données permettent de connaître les caractéristiques des utilisateurs de la plateformes. A titre d’illustration, vous trouverez ci-dessous une description de quelques variables indépendantes.
- id : Identifiant unique attribué à chaque navigation sur le site
- is_new_visitor : Un indicateur binaire (0 ou 1) signalant si l’utilisateur est un nouveau visiteur.
- is_repeat_visitor : Un indicateur binaire (0 ou 1) signalant si l’utilisateur est un visiteur répété.
- session_id : Identifiant de session attribué à chaque session utilisateur.
- days_since_prior_session : Le nombre de jours écoulés depuis la dernière session de
l’utilisateur. - days_since_first_session : Le nombre de jours écoulés depuis la première session de
l’utilisateur sur le site. - url : L’URL spécifique visitée par l’utilisateur.
- page_title : Le titre de la page web visitée.
- is_searchengine : Un indicateur binaire (0 ou 1) montrant si l’utilisateur est arrivé via un
moteur de recherche. - browser_type : Le type de navigateur web utilisé par l’utilisateur.
- etc…
Exploitation des données
Expérimentation contrôlée
La plateforme Management & Datascience permet d’organiser des expériences contrôlées. Le but d’une expérience contrôlée est de comparer les résultats du groupe expérimental au groupe témoin. Si le groupe expérimental présente des résultats différents du groupe témoin, cela permet de conclure que la variable indépendante a eu un effet sur la variable dépendante. C’est un dispositif puissant pour établir des relations de cause à effet.
Il existe plusieurs types d’expériences contrôlées que l’on peut réaliser sur la plateforme Management & Datascience dont les plus courants sont les suivants :
- Tests A/B : Ce type d’expérience compare deux versions d’une page web, généralement en modifiant un seul élément tel que le titre, le texte ou un bouton d’appel à l’action. Les utilisateurs sont ensuite répartis aléatoirement entre les deux versions de la page, et les résultats sont comparés pour déterminer quelle version est la plus performante. Les tests A/B sont un moyen efficace d’optimiser le taux de conversion d’un site web, car ils permettent d’identifier rapidement les modifications qui ont un impact positif sur le comportement des utilisateurs.
- Tests multivariés : Ce type d’expérience est similaire aux tests A/B, mais il compare plus de deux versions d’une page web. Cela permet de tester plusieurs éléments différents d’une page, tels que le titre, le texte, les images et les boutons d’appel à l’action. Les tests multivariés peuvent être plus complexes à mettre en place que les tests A/B, mais ils peuvent également fournir des informations plus détaillées sur ce qui fonctionne et ce qui ne fonctionne pas sur une page web.
- Tests d’utilisation : Ce type d’expérience observe les utilisateurs en train d’interagir avec un site web afin d’identifier les problèmes d’utilisabilité. Cela peut être réalisé en observant les utilisateurs en direct ou en leur demandant de réaliser des tâches spécifiques. Les tests d’utilisation peuvent être utiles pour identifier les zones d’un site web qui sont difficiles à utiliser ou qui prêtent à confusion pour les utilisateurs.
Dans le cadre des expérimentations contrôlées, nous fournissons des cartes thermiques de clics (heatmaps). Il s’agit d’une représentation visuelle qui montre la concentration des clics des utilisateurs sur une page Web ou une application. Il s’agit d’une technique d’analyse du comportement utilisateur qui permet de visualiser les zones d’une interface qui attirent le plus l’attention des utilisateurs et celles qui suscitent le moins d’intérêt. Ces heatmaps de clics peuvent être un outil précieux pour les chercheurs en sciences sociales qui étudient le comportement humain en ligne. Ils permettent de comprendre l’attention des utilisateurs, de comparer les comportements ou d’identification des points d’intérêt.
cartes thermiques de clics (heatmaps)
Observation des comportements
L’observation des comportements des utilisateurs de la plateforme Management & Datascience est stockée dans un système de gestion de bases de données (SGBD). Ce système de gestion de bases de données (MySQL ou Postgre) offre plusieurs avantages :
- Stockage structuré: Les données sont organisées en tables, lignes et colonnes, ce qui facilite leur recherche, leur analyse et leur manipulation.
- Accès rapide aux données: Les SGBD disposent de puissants moteurs de recherche qui permettent de trouver rapidement des informations spécifiques, même dans de grands ensembles de données.
- Partage de données: Les données stockées dans un SGBD peuvent être facilement partagées entre différents utilisateurs et applications, favorisant la collaboration et la prise de décision éclairée.
- Combinaison de données: Des données provenant de sources multiples peuvent être combinées et enrichies dans le SGBD pour créer un ensemble de données plus complet et informatif.
- Extraction de données: Les données brutes peuvent être extraites du SGBD et converties en un format structuré pour être analysées par des outils d’analyse de données.
système de gestion de bases de données (SGBD)
La base de données permet de visualiser et d’analyser les données de navigation collectées sur la plateforme. Elle offre un large éventail de fonctionnalités, notamment :
- Suivi des indicateurs clés de performance (KPIs): Nombre de visiteurs, pages vues, durée des sessions, taux de rebond, etc.
- Analyse des comportements par segment d’utilisateurs: Démographie, localisation, appareil, source de trafic, etc.
- Visualisation des parcours utilisateurs: Comprendre comment les utilisateurs naviguent sur la plateforme et quelles pages ils consultent.
- Consultation les cartes thermiques des endroits où les utilisateurs cliquent.
- Identification des points d’intérêt et des zones de friction: Déterminer quelles pages sont les plus populaires et quelles pages posent des problèmes aux utilisateurs.
- Suivi des campagnes marketing: Mesurer l’efficacité des campagnes marketing et optimiser les stratégies d’acquisition de trafic.
Analyse comportementale
L’ensemble de données ouvert par la plateforme Management & Datascience offre un terrain fertile pour des analyses scientifiques rigoureuses et innovantes dans le domaine du comportement des utilisateurs dans les environnements numériques. L’exploitation de ce riche ensemble de données permettra aux chercheurs de mieux comprendre les motivations, les interactions et les décisions des utilisateurs dans les plateformes numériques, contribuant ainsi à l’amélioration de la conception, de la gestion et de l’impact de ces plateformes.
Ces analyses peuvent s’inscrire dans différentes approches méthodologiques, chacune apportant des éclairages précieux sur les interactions et les motivations des utilisateurs.
- Analyse économétrique: L’analyse économétrique permet d’étudier les relations économiques sous-jacentes aux comportements des utilisateurs. En s’appuyant sur les variables comportementales disponibles dans le jeu de données, les chercheurs peuvent analyser l’impact de facteurs déterminant l’engagement des utilisateurs.
- Analyse prédictive: L’analyse prédictive utilise des techniques statistiques et d’apprentissage automatique pour identifier des modèles dans les données et prédire des comportements futurs. En s’appuyant sur les données historiques d’utilisation de la plateforme, les chercheurs peuvent développer des modèles prédictifs pour identifier les utilisateurs susceptibles de se désengager de la plateforme ou de prédire le succès d’un nouveau service en ligne. Cette approche permet d’optimiser les stratégies de marketing et de gestion de la plateforme en anticipant les comportements des utilisateurs.
- Analyse de données expérimentales: L’analyse de données expérimentales permet de tester l’impact de différentes interventions sur le comportement des utilisateurs. En menant des expériences en ligne contrôlées, les chercheurs peuvent comparer l’effet de différentes variables, telles que le design d’une interface utilisateur sur l’engagement des utilisateurs. Cette approche permet d’identifier les incitations les plus efficaces pour améliorer l’expérience utilisateur et optimiser les performances de la plateforme.
- Analyse de contenu: L’analyse de contenu permet d’examiner le contenu textuel produit par les utilisateurs sur la plateforme. En analysant le texte des articles, des commentaires ou des discussions, les chercheurs peuvent identifier des thèmes récurrents, des sentiments exprimés ou des stratégies de communication. Cette approche permet de mieux comprendre les préoccupations, les motivations et les perceptions des utilisateurs vis-à-vis de la plateforme et de ses contenus.
Perspectives
Appel à projet
Au-delà de la description du jeu de données, cet article propose un panorama de perspectives de recherche prometteuses. Ces pistes de recherche, qui ne sont qu’un échantillon des possibilités offertes par les données, portent notamment sur :
- L’identification des incitations sociales efficaces pour encourager la production et le partage de connaissances.
- L’analyse de l’impact de l’intelligence artificielle sur l’engagement des utilisateurs.
- L’étude de l’influence de la gamification sur la motivation et la participation des utilisateurs.
- L’évaluation du rôle des fonctionnalités interactives dans la dynamique et la vitalité des communautés en ligne.
- La compréhension des facteurs déterminants pour l’appropriation des plateformes numériques par les utilisateurs.
Ces axes de recherche ouvrent la voie à de nombreuses investigations empiriques et théoriques. L’exploitation du jeu de données présenté dans cet article permettra d’apporter des éclairages précieux sur ces thématiques d’actualité et de contribuer à une meilleure compréhension des comportements humains dans les environnements numériques.
Accès aux données
Afin de faciliter l’accès aux données et de stimuler la recherche, l’ensemble des données anonymisées est mis à disposition de la communauté scientifique en libre accès. Les archives des données sont stockées au format CSV et accessibles librement sur simple demande aux auteurs.
Vous pouvez prévisualiser un échantillon des données de navigation : Téléchargement
Nous invitons toutes les personnes intéressées par les sciences sociales à s’approprier ces données et d’explorer les riches potentialités qu’elles offrent pour la recherche sur le comportement des utilisateurs dans les environnements numériques. La collaboration et le partage des connaissances seront essentiels pour faire progresser la compréhension de ce domaine complexe et en pleine évolution.
Références
- Assadi, D. (2018), Crowdfunding : vers de nouveaux paradigmes de l’innovation ?, Innovations, 56, 5-14.
- Béjean, M., Benavent, C., De Pechpeyrou, P. (2022), Ouvrir la boîte noire des plateformes : structures, acteurs, opérations, Innovations, 69(3), 5-14.
-
Budapest Open Access Initiative. Read the Budapest open access initiative. Budapeste, 2002. disponible sur : http://www. opensocietyfoundations.org/openaccess/read. consulté en avril 2024.
- Chesbrough, Henry (2003a) Open Innovation, Boston: Harvard Business School Press.
- Isckia, T., De Reuver, M., Lescop, D. (2020), Orchestrating Platform Ecosystems: The Interplay of Innovation and Business Development Subsystems, Journal of Innovation Economics & Management, 197-223.
- Mamavi, O., & Zerbib, R. (2024). La compétition entre pairs sur les plateformes collaboratives : un levier d’acquisition du statut d’expert, Innovations, 2024/1 (N° 73), p. 57-81.
- Mamavi, O., & Zerbib, R. (2022). La quête de reconnaissance : un levier d’engagement pour l’apprentissage collaboratif. Question (s) de management – N° 41, pp 97-105
- Mamavi, O., & Zerbib, R. (2021). «Promote or perish»: l’émergence des altmétriques dans la recherche académique. La Revue des Sciences de Gestion. N° 309-310, pp 51-57
- Mamavi, O., (2019). Le rôle des challenges numériques dans l’efficacité des processus d’innovation ouverte. La Revue des Sciences de Gestion. N° 299-300, pp 147-152
il ne peut pas avoir d'altmétriques.)