Notice pédagogique – Data Challenge sur l’attrition

Présentation du challenge

La maîtrise de l’attrition clients (Taux de départ, appelé “Churn” par les Anglo-saxons) est devenue primordiale pour les entreprises. En effet, le départ à la concurrence des clients est un phénomène croissant. Cette plus grande volatilité des clients oblige les entreprises à accentuer les actions de fidélisation. En effet, c’est le meilleur investissement marketing possible, car le coût pour fidéliser un client existant est bien moindre que pour en acquérir un nouveau. Toutefois, pour être réellement efficaces, ces actions doivent être finement ciblées.

Afin de mettre en place un plan d’action « anti-churn », il est donc nécessaire de pouvoir détecter les clients sur le départ. Utilisez la science des données pour prédire avec précision quels clients sont à risque et prendre des mesures pour empêcher cette attrition est une bonne solution.

La mission et les objectifs de ce challenge sont:

  • Identifier les clients d’une agence bancaire susceptibles de partir à la concurrence,
  • proposer des mesures préventives « anti-churn ».

Méthode pédagogique

Le challenge numérique est un dispositif de gamification qui utilise les mécanismes du jeu pour atteindre des objectifs pédagogiques. Il repose également sur le principe du crowdsourcing qui utilise une communauté d’experts pour résoudre le problème managériale d’une entreprise.

L’intérêt du challenge est double.

  • Pour les candidats, il s’agit  d’acquérir une expérience, d’améliorer ses compétences, de valoriser son savoir-faire et de booster sa visibilité.
  • Pour les entreprises, il s’agit de trouver la meilleure solution à un problème,  d’identifier les meilleurs talents et de réduire ses coûts de R&D.

Objectifs pédagogiques

A l’issu de ce challenge, les étudiants seront capables de:

  • comprendre les fondements de la data science
  • participer à un projet big data
  • déployer une expertise métier sur l’attrition

Public cible et prérequis

Ce challenge s’adresse aux étudiants de master en école de commerce ou à l’université.

Les prérequis attendus sont:

  • analyse statistique (descriptive et inférentielle)
  • fondements du marketing (stratégique et opérationnelle)
  • comportement du consommateur (satisfaction et fidélisation clients)
  • outils de bureautique (tableur et présentation)

Organisation du challenge

Plateforme

  • Formation des équipes
  • accès aux données
  • accès au datalab (BigML + SLACK+ressources)
  • soumission et évaluation des propositions
  • classement des équipes

Jeu de données

Le jeu de données utilisé pour ce challenge est issu de l’agence d’une grande banque. Les données correspondent aux transactions des clients de l’agence. Chaque ligne représente un client, chaque colonne contient les attributs de ce client. Le jeu de données est composé de près d’un millier d’observations et de 5 variables:

  • date de la dernière transaction
  • mode de paiement
  • fidélité du client
  • profil du client (âge et genre)

Les données sont au format CSV et accessible à l’adresse suivante : jeu de données churn

Livrables

  • 3 pitchs
  • 1 fichier de résultats de la phase d’entrainement
  • 1 fichier de résultats de la phase d’entrainement
  • 1 soutenance de présentation des résultats et des recommandations

Récompenses

  • classement (réputation)
  • publication dans MDS
  • certifications

Démarche

Gestion du projet

  • formation de l’équipe
  • choix d’une méthode agile (i.e. SCRUM)
  • distribution des rôles
  • travail collaboratif avec SLACK
  • rôle du coach et l’usage des ressources allouées (outils, documentation…)
  • quizz d’évaluation des compétences et des connaissances
  • livrables et jalons

Phase d’apprentissage

  • collecte et préparation des données dans un tableau: formatage des données, nettoyage (traitement des valeurs manquantes ou aberrantes), organisation des données en identifiant les variables à expliquer et explicatives, transformation et/ou création de variables, normalisation, …
  • exploration des données à partir de statistiques descriptives: description du churn avec des distributions pour identifier les positions et les dispersions
  • analyse prédictive et modélisation grâce à l’apprentissage statistique (machine learning): corrélation, régression, classification, arbre de décisions, …
  • évaluation des différents modèles prédictifs en fonction de leur précision et choix du modèle final

Phase de test

  • soumission de la proposition
  • score
  • classement

Phase de présentation

  • problématique (rappel)
  • méthodologie
  • résultats
  • validité
  • interprétation
  • limites et perspectives
  • discussions
  • évaluation

Déroulement et scénario pédagogique

Séance de coaching #1 – (4 heures)

  • présentation du challenge
  • organisation du projet (formation des équipes, suivi du travail sur SLACK)
  • initiation à la méthode agile
  • test initial de connaissances sur la data science
  • fondements de la data science (spécificités de la science et du big data)
  • collecte et préparation des données
  • travail en équipe: Compréhension du problème et description des données

Séance de coaching #2 – (4 heures)

  • Pitch 1: Compréhension du problème et description des données
  • statistiques descriptives
  • travail en équipe: Méthodes et outils d’analyses des données

Séance de coaching #3 – (4 heures)

  • Pitch 2: Méthodes et outils d’analyses des données
  • outils d’apprentissage automatique (BigML) et modélisation
  • travail en équipe: Résultats de la phase d’entrainement

Séance de coaching #4 – (4 heures)

  • Pitch 3: Résultats de la phase d’entrainement
  • évaluation par les pairs et axes d’amélioration
  • travail en équipe: présentation des résultats et recommandations

Soutenance finale – (2 heures)

  • score et classement des équipes
  • présentation des résultats et recommandations
  • test final de connaissances sur la data science

Notation

La notation permettant de valider les crédits associés au challenge est composée de l’évaluation du modèle (50%) et de l’évaluation de la soutenance (50%).

Évaluation du modèle

A la fin de la phase d’entraînement, les candidats soumettent leurs prévisions définitives à l’adresse suivante : soumission@challenge-datascience.org

Le fichier à poster est le fichier dataChallenge_soumission_fausses où les candidats devront remplacer les valeurs fausses par leurs prédictions. Il s’agit d’un fichier de type CSV qui contient l’identifiant de la transaction et la variable à prédire.

Avant de soumettre leurs résultats, les candidats devront renommer le fichier de la façon suivante : NOM_PRENOM.csv

Les soumissions sont comparées aux valeurs réelles. La métrique d’évaluation est la précision. La précision est le nombre de churn trouvés rapporté au nombre de churn total proposé dans le jeu de données. Une péréquation est ensuite réalisée pour obtenir une évaluation et réaliser le classement. Plus ce score est petit (de 0 à 1+), meilleure est la soumission.

Évaluation de la soutenance

L’instructeur évalue la soutenance des résultats présenté par chaque équipe selon les critères suivants:

  • qualité de la présentation et du support
  • qualité de la démarche
  • qualité et pertinence des préconisations

Supports et références

  • présentation du challenge
  • fondements de la data science
  • analyse statistique
  • tutoriel de SLACK
  • tutoriel BigML

Éléments d’analyse et résolution du challenge

1) collecter et préparer les données

Les données utilisées pour ce challenge doivent être préparées: nettoyage des valeurs manquantes ou aberrantes, organisation du tableau…

La version du jeu de données prête à l’exploitation est la suivante: Donnes – Attrition bancaire V2

2) décrire le problème

Distribution

3) construire et évaluer des modèles

determinants attrition

4) prédire l’attrition

arbre de décision

5) préconiser des solutions antichurn

Mise en place d’un programme pour diminuer le taux de résiliation et ré-engager les clients:

  • Construction d’une relation client one-to-one avec les clients à risques
  • Identification des causes d’insatisfaction
  • Développement d’une offre commerciale spécifique
  • Propositions d’incitations pour favoriser la rétention
  • Amélioration de l’expérience client

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

%d blogueurs aiment cette page :