Citation
Les auteurs
Caroline Riché
(caroline_riche@yahoo.fr) - Université Paris SaclayOlivier Mamavi
(omamavi@gmail.com) - Paris School of Business - ORCID : https://orcid.org/0000-0002-6421-1048Romain Zerbib
(romainzerbib@yahoo.fr) - ICD Business School
Copyright
Déclaration d'intérêts
Financements
Aperçu
Contenu
Chaque minute, il y a dans le monde près de 2 milliards d’octets de données qui sont créés. Ces données massives représentent de nouvelles ressources, de nouvelles opportunités mais également de nouveaux défis à relever. Au confluent entre innovation technologique et management, la gestion et l’analyse de ces données massives intéressent de nombreux secteurs d’activités (télécom, santé, publicité, grande consommation, finance). Elles supposent, également, des mutations profondes au sein des organisations. Alors que Google ou Facebook fondent leur modèle économique sur les données, la plupart des entreprises sont aux prémices du développement en la matière. Pourtant, lorsque les données massives sont analysées à l’échelle de l’entreprise, les distributeurs, par exemple, augmenteraient leurs marges opérationnelles de plus de 60%. Dans un autre contexte, une utilisation efficace des données analytiques permettraient de réduire de 8% les dépenses de santé aux États-Unis. En France, la transformation numérique est devenue un challenge lancé à tous pour répondre aux défis économiques et sociétaux. Une étude prospective, réalisée par Direction générale des entreprises (DGE), souligne l’importance de la data science et formule des orientations stratégiques sur les technologies à industrialiser pour être attractifs et compétitifs dans 5 à 10 ans. Le rapport Technologies clés 2020 liste 47 technologies stratégiques, avec parmi elles, la valorisation et l’intelligence des données massives, l’intelligence artificielle, l’internet des objets, les capteurs ou les technologies immersives.
La donnée est donc devenue un actif central et stratégique qu’il s’agit de valoriser. Mais comment l’utiliser et l’analyser afin de guider les décisions stratégiques et opérationnelles ? Quels sont les impacts de la data science au sein des organisations ? Comment modifie-t-elle les différentes fonctions de l’entreprise (marketing, finance, production etc.), le travail au quotidien, ou encore les relations entre l’organisation et son écosystème ? Autant de questions auxquelles doit pouvoir aujourd’hui répondre la recherche afin de faire face à ces phénomènes émergents. Cependant, au-delà d’une simple thématique nouvelle, de par la spécificité des phénomènes étudiés, le recours à de nouveaux outils méthodologiques et la fertilisation croisée avec de nombreuses autres disciplines, il nous semble que nous assistons aujourd’hui à l’émergence d’une discipline à part entière. Avant de développer ce point plus avant, une définition de la data science est précisée.
Définition de la data science
La data science fait écho au phénomène big data dont les enjeux pour les entreprises et managers sont particulièrement développés dans la presse professionnelle (e.g. McAfee et Brynjolfsson, 2012). Ce phénomène big data est la conséquence d’une évolution technologique liée au développement des capacités de stockage offert par le cloud et à la puissance de traitement que permet les calculs distribués sur des ordinateurs en réseau. Le big data est souvent appréhendé selon les caractéristiques des « 5 V »: le volume (quantité de données créées), la vitesse (flux de traitement en temps réel), la variété (diversité des sources et hétérogénéité des données), leur véracité (fiabilité des données), la valeur (degré d’opérationnalité des données collectées).
La data science, quant à elle, vise plus particulièrement, à gérer – collecter, stocker, visualiser, croiser, analyser et valoriser – en temps réel des données massives, hétérogènes et déstructurées afin de produire une information opérationnalisable, une data-driven decision. En fait, il s’agit d’extraire des données pertinentes pour le contexte étudié, les smart data (données intelligentes) afin d’envisager une démarche de traitement et de production de connaissances plus efficace. La data science se fonde sur des disciplines comme les statistiques, le data mining et les expertises métiers. Elle se distingue par l’étude systématique de l’organisation et de l’analyse des données ainsi que de la capacité de ces données à permettre des inférences (George et al., 2016 d’après Dhar, 2013).
Issue de la digitalisation du quotidien (« datafication du quotidien »), la data science est en somme une (r)évolution dans l’analyse, l’exploitation et la valorisation des données. Besse et Laurent (2016) penchent par conséquent pour un véritable changement de paradigme.
Des objets d’études spécifiques
Les challenges de la data science pour la recherche en management sont nombreux (Georges et al., 2016). Elle concerne toutes les disciplines traditionnelles de la gestion, comme autant de variables de la chaine de valeur de l’entreprise impactées par l’analytics. C’est le cas, entre autres, pour le « marketing analytics » (Wedel et Kannan, 2016), le « consumer data analytics » (Erevelles et al, 2015), le « human ressources analytics » (Rassmussen et Ulrich, 2015 ; Angrave et al. 2016) ou la « supply chain analytics » (Gunasekaran et al., 2017). De plus, le partage des données et leur confidentialité est aussi une problématique centrale en management (Georges, Haas et Pentland, 2014). Pour les chercheurs, l’enjeu est de produire des théories et connaissances sur les données, la production de valeurs générées par leur traitement, leur contextualisation, ainsi que leur validité et fiabilité des méthodes et résultats obtenus. Les données massives sont un outil au développement de nouvelles théories en management (Georges et al., 2016).
A titre d’exemple, dans la perspective d’une recherche sur la data science en management, le Marketing Science Institute soulève plusieurs questions prioritaires. Ces questions peuvent s’articuler autour de 3 axes de réflexion :
- Gestion de données: comment compiler des données de natures diverses pour produire une décision efficace ? Comment améliorer de collecte des données et leur synthèse ?
- Evolution du cadre conceptuel: Comment intégrer la data science aux théories et cadres conceptuels actuels en management ? Quels rôles pour les neurosciences, l’intelligence artificielle ou le machine learning ?
- Implications managériales: Comment intégrer l’analytics au processus de décision managériale ? Comment comparer les problématiques et insights soulevés par les traitements de données de ceux émanant d’heuristiques managériales ? Comment les organisations peuvent-elles faciliter la compréhension managériale de ces nouvelles approches complexes ? Quelles nouvelles compétences développer ?
Au-delà de ces questionnements, l’objectif premier, des chercheurs des sciences du management, est d’identifier et comprendre les enjeux des méthodes d’analyses sur les sciences de gestion. Inspiré de Wedel et Kannan (2016), le tableau 1 présente des pistes de recherche futures de la data science en management.
Tableau 1: Pistes de recherches en management & data science (d’après Wedel et Kannan, 2016)
Pistes de recherches futures | |
Data (structurées et non structurées) | Ciblage comportemental grâce au croisement de données inter-devices, analyses de données sociales, contextuelles, mobiles; fusion des données internes et et externes; associer « petites statistiques sur des données massives » avec « des statistiques avancées sur des données restreintes » ; développement de méthodes d’analyse permettant de combiner données non structurées avec des données mieux structurées |
Modélisation de la décision managériale | Nouvelles techniques et méthodes pour une mesure fiable de l’impact des outils du marketing et management, leur reporting, et de contrôle des effets. |
Automatisation du management | Techniques de management et décisions automatisées grâce aux technologies et personnalisées selon la cible (e.g. consommateur, salarié, actionnaire, etc.). |
Confidentialité des données | Démarche d’amélioration de la confidentialité des données tout en optimisant la décision managériale |
De nouvelles méthodes d’analyses
Au-delà des phénomènes spécifiques auxquels s’intéresse la data science, cette discipline semble devoir faire face à de nouveaux enjeux du point de vue méthodologique, lui conférant ainsi un statut particulier.
Ainsi, l’avènement des données massives rend accessible l’analyse exhaustive d’une population d’individus sans passer par une étape d’échantillonnage. Grâce aux évolutions technologiques, l’observation d’une population entière évite les biais dus aux techniques de sondages.
Par ailleurs, il n’y a plus besoin d’autant de ressources pour organiser la phase de collecte des données. On peut se focaliser directement sur le traitement et la valorisation des données stockées. Seules les étapes de préparation des données, le data munging, qui précèdent l’analyse, deviennent fondamentales car elles permettent la transformation des variables dans un format facilitant l’analyse et impactant la qualité des résultats.
D’autre part, il arrive que le nombre p d’informations disponibles (e.g. des variables caractérisant un individu ou son comportement) devienne largement plus grand que la taille n des échantillons étudiés (nombre d’individus étudiés). Ce phénomène implique d’adapter les méthodes statistiques car il y a plus d’indétermination que d’information.
De plus, les caractéristiques des données massives (variété, vélocité, etc.), obligent à utiliser de nouveaux outils et méthodes mathématiques pour minimiser les erreurs de prévisions. On assiste à l’importance des algorithmes et au développement de l’usage des techniques d’apprentissage automatique (machine learning) ou des modèles à base de courbes, surfaces ou graphes.
Enfin, la fiabilité des données traitées soulève des questions sur la démarche de collecte des données mais aussi sur les postures et conduites scientifiques à adopter. Par exemple, même si des données de navigation sont collectées, nous ne pouvons pas être certains de l’identité de la personne qui consulte un site internet. A cet égard, Médiamétrie propose une nouvelle mesure de l’audience couplant à la fois des éléments d’informations collectées via son panel (user-centric) à des mesures de fréquentation (site-centric). Cette mesure hybride serait plus pertinente et plus fiable.
De nouveaux défis transdisciplinaires
Le développement de travaux de recherches vise à faire évoluer les cadres conceptuels classiques en management en intégrant de nouveaux concepts, théories et méthodes issues de la data science. Une nouvelle science se développe sur le principe de la fertilisation croisée entre toutes les discipline concernées (sciences de gestion, sciences de l’information, statistiques, data mining, neurosciences, intelligence artificielle, machine learning, etc.).
Les opportunités soulevées par les données massives sont majeures pour la recherche, le partage de connaissances ou le processus d’élaboration des politiques publiques. Un rapport de la commission européenne interroge sur les actions à mener pour être un acteur de cette 4eme révolution industrielle. Comment inciter au partage des données entre disciplines scientifiques et entre secteur privé et public ? Comment accroître les capacités de traitement ? Le European Open Science Cloud (nuage européen pour la science ouverte) propose une réponse intéressante. Il s’agit d’une initiative européenne permettant stocker, partager et réutiliser des données et résultats scientifiques. Axé en premier lieu sur la communauté scientifique, l’objectif est d’étendre la démarche au secteur public, puis à l’industrie.
Enfin, la data science possède des implications substantielles pour la formation des apprenants (Georges, Haas et Pentland, 2014). En effet, dans un environnement tourné vers la data, il va falloir former les scientifiques des données (data scientist) dont les compétences sont à l’interface entre les statistiques, l’économétrie, l’informatique et la gestion (Wedel et Kannan, 2016). Pour chaque domaine de la gestion, voire les sous-domaines de chaque discipline (e.g. pour le marketing: la publicité, ou la gestion de marque, etc.) les data collectées diffèrent et leur analyse également. Ces talents sont encore rares car il est difficile de développer une expertise dans chacun de ces domaines. C’est aussi un challenge pour les enseignants en management afin de concilier des formations classiques en management et celles liées à l’analytics ou la data science. Le challenge est de former des managers qui maitrisent l’analytics avec des profils variés allant du manager avec certaines compétences en analytics jusqu’au data scientists et ingénieurs qui intègrent les enjeux de la gestion. Pour l’entreprise, il s’agira de conjuguer ces talents et entretenir ces compétences par des formations et conférences pour rester informée des derniers développements. Il s’agit d’envisager des métiers hybrides, connectés à la data science.
La version originale de cet article a été publiée sur The Conversation.
Bibliographie
- Angrave, D., Charlwood, A., Kirkpatrick, I., Lawrence, M., & Stuart, M. (2016). HR and analytics: why HR is set to fail the big data challenge. Human Resource Management Journal, 26(1), 1-11.
- Besse, P., & Beatrice, L. (2016). De Statisticien à Data Scientist ; développements pédagogiques à l’INSA Toulouse, Statistique et Enseignement, 7(1), 75–93, http://www.statistique-et-enseignement.fr © Société Française de Statistique (SFdS), Juin/June 2016
- Dhar, V. (2013). Data science and prediction. Communications of the ACM, 56(12), 64-73.
- Erevelles, S., Fukawa, N., & Swayne, L. (2016). Big Data consumer analytics and the transformation of marketing. Journal of Business Research, 69(2), 897-904.
- George, G., Osinga, E. C., Lavie, D., & Scott, B. A. (2016). Big data and data science methods for management research. Academy of Management Journal, 59(5), 1493-1507.
- George, G., Haas, M. R., & Pentland, A. (2014). Big data and management. Academy of Management Journal, 57(2), 321-326.
- Gunasekaran, A., Papadopoulos, T., Dubey, R., Wamba, S. F., Childe, S. J., Hazen, B., & Akter, S. (2017). Big data and predictive analytics for supply chain and organizational performance. Journal of Business Research, 70, 308-317.
- McAfee, A., Brynjolfsson, E., & Davenport, T. H. (2012). Big data: the management revolution. Harvard business review, 90(10), 60-68.
- Rasmussen, T., & Ulrich, D. (2015). Learning from practice: how HR analytics avoids being a management fad. Organizational Dynamics, 44(3), 236-242.
- Wedel, M., & Kannan, P. K. (2016). Marketing analytics for data-rich environments. Journal of Marketing, 80(6), 97-121.