• Résumé

    Le challenge consiste à identifier les clients susceptibles de se désabonner d'un fournisseur d'accès à internet, puis de proposer une stratégie anti-churn pour retenir les clients.

    Citation : Mamavi, O. (Nov 2022). Prédire les clients qui vont se désabonner d’un fournisseur d’accès à internet. https://management-datascience.org/projects/21690/.
    L'auteur : 
    • Olivier Mamavi
       (omamavi@gmail.com) - Paris School of Business  - ORCID : https://orcid.org/0000-0002-6421-1048
    Copyright : © 2022 l'auteur. Publication sous licence Creative Commons CC BY-ND.
    Liens d'intérêts : Le ou les auteurs déclarent ne pas avoir connaissance de conflit d'intérêts impliqués par l'écriture de cet article.
    Financement : Le ou les auteurs déclarent ne pas avoir bénéficié de financement pour le travail mis en jeu par cet article.
    Objectifs

    Contexte

    La maîtrise de l’attrition des clients, c’est-à-dire du taux de départ (appelé “churn” par les Anglo-saxons) est  devenue fondamentale pour la survie des fournisseur d’accès à internet !

    La volatilité des clients oblige les entreprises à accentuer les actions de fidélisation. En effet, c’est le meilleur investissement marketing possible, car le coût pour fidéliser un client existant est bien moindre que pour en acquérir un nouveau. Toutefois, pour être réellement efficaces, ces actions doivent être finement ciblées.

    Mission

    Afin de mettre en place un plan d’action « anti-churn », il est donc nécessaire de pouvoir détecter les clients sur le départ. Utilisez la science des données pour prédire avec précision quels clients sont à risque et proposez des mesures pour empêcher cette attrition.

    Votre mission consiste à identifier les clients susceptibles de se désabonner de l’opérateur puis de proposer une stratégie anti-attrition pour retenir les clients.

    Modalités

    Déroulement

    Le challenge se déroulera en trois (3) round :

    1. analyse du churn avec un persona
    2. analyse du churn avec un modèle d’arbre de décision
    3. analyse du churn avec un algorithme d’apprentissage statistique

    Livrables

    Pour participer au challenge, chaque candidat doit s’inscrire au préalable sur le site web de Management & Data Science, puis vous connecter et créer votre équipe dans l’onglet « Participer ».

    A la fin de l’étape d’entraînement, les candidats soumettent leurs résultats qui comprend :

    1. le fichier d’évaluation avec les prévisions définitives. Les candidats auront complété les valeurs vierges par leurs prédictions.
    2. une vidéo explicative de 7 minutes max avec :
      • un titre
      • une introduction qui rappelle le contexte, la problématique et ses enjeux,
      • la méthode et les étapes utilisées pour réaliser les prédictions (transformation des données, modélisation, comparaisons des algorithmes utilisés, stratégie d’optimisation du modèle, évaluation du modèle) ;
      • des préconisations managériales pour réduire le churn (stratégies de rétention);
      • une conclusion rapide qui montre l’intérêt de la data science en marketing;

    Évaluation

    1) les prévisions

    Les soumissions sont comparées aux valeurs réelles. Plus les soumissions sont précises, plus les candidats obtiennent un score élevé.

    La métrique d’évaluation principale sera l’exactitude (accuracy), c’est-à-dire le nombre de prédictions justes rapporté au nombre de cas de test dans le jeu de test.

    Une péréquation est ensuite réalisée pour obtenir un score et réaliser le classement du challenge entre les équipes.

    2) La vidéo explicative

    La qualité de la vidéo sera évaluée suivant les critères suivants

    • la pertinence: dans quelle mesure le livrable répond à la mission ? (qualité de la prédiction)
    • la rigueur : les résultats proposés sont-ils valides ? (robustesse de la démarche)
    • l’impact : quelle est la valeur de la contribution ? (qualité des préconisations)
    • la clarté : la solution proposée est-elle intelligible et originale ? (qualité de la présentation du rapport)
    Données

    Description

    Les candidats ont accès à un jeu de données comprenant 15 attributs et  5.986 instances.

    La description des variables est la suivante :

    • ID : identification de la ligne (ce n’est donc pas une variable ! Elle se trouve en première colonne du fichier)
    • La variable à prédire (Y = « Désabonnement ») est une variable binaire qui correspond à un désabonnement (Oui, Non) ; elle se trouve en dernière colonne du fichier
    • Les variables explicatives (X = … ) sont les suivantes:
      • Informations démographiques sur les clients
        • Genre: le sexe du client (Homme, Femme)
        • Senior : indique si le client a 65 ans ou plus : Oui, Non
        • Enfant: indique si le client a des enfants à charge.
      • Services auxquels chaque client s’est inscrit
        • Ancienneté : depuis combien de temps (en mois) il est client
        • lignes multiples : si le client a plusieurs lignes ou non
        • services internet : type de fourniture d’accès Internet du client (DSL, Fibre optique, Non).
        • Autre service : si le client dispose ou non d’une sécurité en ligne.
        • Partenaire : si le client a un partenaire.
      • Informations sur le compte client
        • type de contrat,
        • mode de paiement,
        • facturation sans papier,
        • frais mensuels,
        • frais totaux.

    Fichiers

    Les candidats ont accès aux fichiers suivants :

    • Aucune ressource disponible.
      • Service Externe
        BigML : Plateforme de Machine Learning sans programmation
    • 6 contributeurs  |  4 contributions envoyées