Citation
L'auteur
Louise Nauleau
(lou.lahouiri@gmail.com) - (Pas d'affiliation)
Copyright
Déclaration d'intérêts
Financements
Aperçu
Contenu
Dans un environnement numérique saturé d’informations, il est impératif pour les entreprises qui ont une présence en ligne de captiver et fidéliser leurs utilisateurs pour survivre. L’engagement utilisateur sur les plateformes en ligne (sites web, applications…) devient ainsi un enjeu majeur dans le domaine du marketing digital. Il influence directement le succès de ces plateformes. Notre mémoire explore les méthodes de prédiction de l’engagement utilisateur en utilisant divers modèles de machine learning.
Il existe de nombreuses littératures sur l’engagement utilisateur, comment le définir, comment le mesurer… Néanmoins, une approche n’a pas encore été abordée par les chercheurs : est-ce possible de prédire l’engagement utilisateur ? Ainsi, nous avons formulé la problématique suivante : dans quelle mesure peut-on prédire les différentes dimensions de l’engagement utilisateur sur une plateforme numérique tout en utilisant des modèles de machine learning ?
Cette étude s’appuie sur un cadre théorique, les trois dimensions de l’engagement utilisateur : la popularité, l’activité et la loyauté, telles que définies par Lehmann et al dans un article publié en 2012. Les objectifs de cette recherche sont d’évaluer l’efficacité de différents algorithmes de machine learning pour prédire les différentes dimensions de l’engagement utilisateur et de déterminer l’impact de l’ajout de variables supplémentaires sur la précision des prédictions. Cette étude vise à fournir des informations pour les entreprises souhaitant améliorer leur stratégie digitale et augmenter l’engagement de leurs utilisateurs.
Fondements théoriques
L’engagement utilisateur
L’engagement utilisateur est un concept essentiel, notamment depuis le développement d’internet au début. O’Brien & Toms (2008) définissent l’engagement comme une « expérience utilisateur caractérisée par des attributs tels que le défi, l’affect positif, l’attention et l’interactivité ». Ils mettent en avant que l’engagement ne se limite pas à une simple utilisation fonctionnelle des technologies, mais inclut également des aspects esthétiques et émotionnels, rendant l’expérience utilisateur plus riche et plus satisfaisante. Lalmas et al. (2011) identifient huit caractéristiques de l’engagement : attention accrue, affect positif, esthétique, endurabilité, nouveauté, richesse, contrôle, et réputation/confiance/attentes. Ces éléments soulignent l’importance de créer des expériences en ligne captivantes pour attirer et retenir les utilisateurs. Ces caractéristiques montrent que l’engagement utilisateur est multidimensionnel, impliquant des aspects psychologiques, sensoriels et comportementaux.
Facteurs de l’engagement
Les facteurs influençant l’engagement utilisateur incluent notamment la conception des sites web et diverses théories explicatives. Garett et al. (2016) listent sept éléments de conception de sites web impactant l’engagement : lisibilité, simplicité, objectif clair, utilité du contenu, organisation, graphisme et navigation. Une conception efficace du site web est cruciale pour captiver et maintenir l’attention des utilisateurs, en offrant une expérience fluide et agréable. Par ailleurs, O’Brien & Toms (2008) identifient quatre théories importantes pour comprendre l’engagement : la théorie du flux (immersion totale dans une activité), la théorie de l’esthétique (importance de l’apparence visuelle), la théorie du jeu (aspect ludique de l’interaction) et la théorie de l’interaction de l’information (interactions entre utilisateurs et interfaces). Ces théories expliquent comment différentes dimensions de l’expérience utilisateur peuvent influencer l’engagement, en rendant les interactions plus immersives, visuellement plaisantes, ludiques et interactives.
Modèles prédictifs
La prédiction de l’engagement utilisateur repose sur les modèles de machine learning, une branche de l’intelligence artificielle. Le machine learning permet aux systèmes d’apprendre à partir des données et de s’améliorer sans être explicitement programmés. Les principales techniques incluent l’apprentissage supervisé, non supervisé, semi-supervisé et par renforcement (Sharifani et Amini, 2023). Les techniques spécifiques utilisées dans notre étude incluent les réseaux de neurones et le deep learning, le random forest et la régression polynomiale. Chaque méthode offre des avantages distincts pour traiter des données complexes et effectuer des prédictions précises, rendant ainsi possible la modélisation efficace de l’engagement utilisateur.
Méthodologie
Le cadre théorique de cette étude est basé sur les travaux de Lehmann et al. (2012), qui définissent l’engagement utilisateur à travers trois dimensions principales : la popularité, l’activité et la loyauté. Ces dimensions sont mesurées respectivement par le nombre de visiteurs uniques, le nombre de pages vues, et le nombre de sessions précédentes.
La méthodologie repose sur une approche quantitative utilisant des algorithmes de machine learning pour analyser les données de trafic du site “Management of Data Science”. Les données ont été collectées via la plateforme Open Web Analytics et incluent diverses variables comme la source d’acquisition, le nombre de pages vues, le nombre de sessions précédentes, etc.
Les données ont été nettoyées pour éliminer les valeurs manquantes et les variables inutiles. Les variables qualitatives ont été transformées en variables quantitatives via le one-hot encoding, une technique permettant de convertir les catégories textuelles en variables numériques utilisables par les algorithmes de machine learning.
Trois algorithmes de machine learning ont été utilisés pour prédire l’engagement utilisateur : la régression linéaire polynomiale, le random forest et le gradient boosting. La régression linéaire polynomiale permet de modéliser des relations non linéaires, plus efficace que la régression linéaire classique. Le random forest utilise plusieurs arbres de décision pour améliorer la précision des prédictions, tandis que le gradient boosting optimise les prédictions en entraînant successivement plusieurs modèles faibles. Ces algorithmes n’ont jamais été utilisés dans le cadre de la prédiction de l’engagement utilisateur et nous souhaitions apporter des informations à ce sujet.
Les données ont été divisées en ensembles d’entraînement et de test pour valider les modèles. Nous avons dans un premier temps utilisé la source d’acquisition comme seule variable indépendante pour nos prédictions. L’ensemble d’entraînement (80% des données) a été utilisé pour entraîner les modèles, tandis que l’ensemble de test (20% des données) a servi à évaluer leur performance. Les performances des modèles ont été évaluées à l’aide de métriques telles que le Mean Squared Error (MSE), le Root Mean Squared Error (RMSE) et le coefficient de détermination (R²). Nous avons ainsi pu comparer ces différentes métriques en fonction des modèles.
Principaux résultats
Dans un premier temps, nous avons tenté de prédire l’engagement utilisateur en utilisant uniquement la source d’acquisition comme variable indépendante. Les résultats obtenus étaient insatisfaisants, avec des modèles incapables de capturer la complexité des comportements des utilisateurs, comme en témoignent les métriques telles que le MSE, RMSE et R², qui étaient toutes mauvaises.
Pour améliorer les performances prédictives, nous avons intégré de nouvelles variables indépendantes telles que ‘days_since_first_session’, ‘days_since_prior_session’, ‘is_repeat_visitor’ et ‘is_bounce’. L’ajout de ces variables a considérablement amélioré les performances des modèles prédictifs, confirmant que l’utilisation de plusieurs variables indépendantes permet d’obtenir des prédictions plus précises.
Les résultats de notre étude révèlent que le modèle random forest offre les meilleures performances prédictives pour les trois dimensions de l’engagement utilisateur : popularité, activité et loyauté. Comparé à la régression polynomiale et au gradient boosting, le random forest a démontré une précision supérieure. Cependant, il est également important de noter l’inclusion du modèle de deep learning dans nos analyses, bien qu’il n’ait pas surpassé le random forest en termes de performance.
Nous avons également testé un algorithme de deep learning en plus du random forest et du gradient boosting. Bien que le deep learning n’ait pas surpassé le random forest, il a montré une amélioration significative avec l’ajout des nouvelles variables. Cela souligne l’importance de combiner différentes approches et d’inclure une diversité de données pour obtenir de meilleures prédictions.
En conclusion, les résultats indiquent clairement que pour obtenir des prédictions fiables et précises de l’engagement utilisateur, il est crucial d’intégrer un ensemble varié de variables indépendantes. Le random forest s’est avéré être l’outil le plus efficace dans ce contexte, mais le deep learning présente également un potentiel intéressant. Cette étude offre des perspectives prometteuses pour l’application des techniques de machine learning dans l’analyse de l’engagement utilisateur, ouvrant la voie à des stratégies marketing plus informées et adaptées.
Recommandations
Sur la base des résultats obtenus, il est fortement recommandé aux entreprises d’adopter le modèle random forest pour la prédiction de l’engagement utilisateur. Ce modèle a démontré une précision supérieure par rapport à d’autres algorithmes testés, ce qui en fait un outil précieux pour éclairer les décisions managériales et affiner les stratégies de marketing.
Pour maximiser l’efficacité de ces prédictions, il est également crucial de collecter et d’intégrer une diversité de données. Cela inclut non seulement les sources d’acquisition mais aussi des métriques supplémentaires telles que les comportements de navigation des utilisateurs, les données démographiques et les historiques d’interactions sur le site. L’intégration de ces variables permettra d’améliorer la précision des modèles prédictifs et d’obtenir une vision plus complète et nuancée des comportements des utilisateurs.
De plus, il est essentiel que les entreprises investissent dans la formation de leurs équipes marketing et data science. Ces équipes doivent être compétentes dans l’utilisation et l’interprétation des résultats fournis par les modèles de machine learning. Il est également important de mettre en place des processus de suivi rigoureux pour ajuster et améliorer continuellement les modèles en fonction des nouvelles données disponibles et des évolutions des comportements utilisateurs. Cette approche proactive garantira que les modèles restent pertinents et efficaces, permettant aux entreprises de rester compétitives et de mieux répondre aux attentes de leurs utilisateurs.
Impacts et utilité
Cet article peut ouvrir la voie à de potentiels recherches sur l’application du machine learning à l’engagement utilisateur. Pour les entreprises, l’utilisation de modèles de machine learning comme le random forest peut améliorer la compréhension des comportements des utilisateurs et optimiser les stratégies d’engagement. Cela peut conduire à une augmentation de la fidélité des utilisateurs, une meilleure personnalisation des contenus et plus globalement au succès des organisations. L’intégration de plusieurs variables permet des prédictions plus précises, ce qui est essentiel pour développer des expériences utilisateurs engageantes et différenciantes.
Pour les chercheurs, cette étude offre une base solide pour explorer davantage les techniques de machine learning dans le contexte de l’engagement utilisateur. Elle ouvre des perspectives pour des recherches futures sur d’autres plateformes et avec d’autres variables, contribuant ainsi à l’avancement des connaissances dans ce domaine. Les résultats obtenus montrent l’importance de combiner différentes approches et d’utiliser des données variées pour obtenir des prédictions plus fiables.
En somme, cette recherche démontre l’intérêt de l’application des techniques de machine learning pour analyser et prédire l’engagement utilisateur, fournissant des outils précieux tant pour le secteur commercial que pour la communauté académique. Cela souligne également l’importance de continuer à investir dans la recherche et le développement de nouvelles méthodes pour améliorer l’engagement utilisateur de manière significative.
Conclusion
En conclusion, cette recherche a démontré l’importance de l’utilisation de multiples variables pour améliorer les prédictions de l’engagement utilisateur. Le modèle random forest s’est révélé être l’algorithme le plus performant, offrant les meilleures prédictions pour les trois dimensions de l’engagement.
Les résultats montrent que l’intégration de données variées est cruciale pour obtenir des prédictions précises. Les entreprises doivent donc investir dans des outils de collecte et d’analyse de données avancés et former leurs équipes à l’utilisation de ces technologies. Cette étude souligne aussi l’importance d’aller au-delà des simples sources d’acquisition pour capturer la complexité des comportements utilisateurs. En intégrant de nouvelles données de web analyse, nous avons pu améliorer les performances prédictives des modèles.
Ce travail contribue à la compréhension des techniques de machine learning et de leur application à l’engagement utilisateur. Les recommandations fournies peuvent servir de base pour des stratégies digitales plus efficaces, tout en respectant les contraintes légales liées à la protection des données. En somme, cette recherche offre des perspectives prometteuses pour l’amélioration des pratiques de marketing digital et l’engagement des utilisateurs en ligne, tout en soulignant la nécessité d’une collecte de données éthique et responsable.
il ne peut pas avoir d'altmétriques.)
Nb. de commentaires
0