Déroulement
Il y a 4 ans
Il y a 4 ans
Il y a 4 ans
Citation
L'auteur
Olivier Mamavi
(omamavi@gmail.com) - Paris School of Business - ORCID : https://orcid.org/0000-0002-6421-1048
Copyright
Déclaration d'intérêts
Financements
Aperçu
Contenu
Contexte
Le nombre de clients quittant leur banque a presque doublé en trois ans en France. Les banques traditionnelles pourraient perdre un quart de leur revenu d’ici 2020 si elles ne réagissent pas. La maîtrise de l’attrition clients (Taux de départ, appelé “Churn” par les Anglo-saxons) est donc devenue primordiale!
Cette plus grande volatilité des clients oblige les banques à accentuer les actions de fidélisation. En effet, c’est le meilleur investissement marketing possible, car le coût pour fidéliser un client existant est bien moindre que pour en acquérir un nouveau. Toutefois, pour être réellement efficaces, ces actions doivent être finement ciblées.
Afin de mettre en place un plan d’action « anti-churn », il est donc nécessaire de pouvoir détecter les clients sur le départ. Utilisez la science des données pour prédire avec précision quels clients sont à risque et prendre des mesures pour empêcher cette attrition est une bonne solution.
Mission
La mission est de proposer une stratégie anti-attrition pour retenir les clients d’une agence bancaire parisienne. Pour cela, l’objectif du challenge est d’identifier les clients susceptibles de partir à la concurrence.
Participants
Ce challenge s’adresse aux étudiants (toutes écoles et universités confondues).
Inscription
Pour participer au challenge, chaque candidat doit s’inscrire au préalable sur le site web de Management & Data Science, en indiquant un prénom, un nom, une adresse email et une institution d’affiliation (université, école de commerce, entreprise, etc.).
Déroulement
Le déroulement du challenge sera le suivant :
- Inscription individuelle au data challenge
- Constitution d’une équipe
- Téléchargement du jeu de données
- Analyse des données
- rédaction d’un rapport
- Soumission des résultats
- Résultats et classement
Démarche
Le challenge est organisé en 2 phases.
- Phase d’apprentissage (entraînement)
- collecte et préparation des données dans un tableau (formatage des données, nettoyage, organisation des données , transformation et/ou création de variables, normalisation, …)
- exploration des données à partir de statistiques descriptives (description du churn avec des distributions pour identifier les positions et les dispersions)
- analyse prédictive et modélisation grâce à l’apprentissage statistique (machine learning)
- Phase de prédiction (test)
- évaluation des différents modèles prédictifs en fonction de leur précision et choix du modèle final
- soumission des prédictions
- rédaction d’un rapport
Livrables
Au cours du challenge, les participants devront réaliser les éléments suivants :
- Une prédiction à partir du jeu de données de prédiction via la plate-forme de Management & Data Science. Le fichier à poster est le jeu de données de prédiction où les candidats devront remplir la colonne attrition avec leurs prédictions.
- Un rapport (Synthèse de 2 pages maximum de 4500 signes) à déposer via la plate-forme de Management & Data Science. Le rapport devra comprendre :
- une introduction (rappel de la problématique et des enjeux)
- une présentation du jeu de données
- un exposé de la démarche
- les principaux résultats
- des préconisations pour une stratégie anti-churn
- une conclusion sur l’intérêt des outils d’intelligence artificielle dans le marketing
Évaluation
Les propositions seront évaluées selon les 4 critères suivant :
- la pertinence: dans quelle mesure le livrable répond à la mission ? (qualité de la prédiction)
- la rigueur : les résultats proposés sont-ils valides ? (robustesse de la démarche)
- l’impact : quelle est la valeur de la contribution ? (qualité des préconisations)
- la clarté : la solution proposée est-elle intelligible et originale ? (qualité de la présentation du rapport)
Pour l’évaluation de la pertinence, les soumissions sont comparées aux valeurs réelles. La métrique d’évaluation est la précision. La précision est le nombre de churn trouvés rapporté au nombre de churn total proposé dans le jeu de données. Une péréquation est ensuite réalisée pour obtenir un score et réaliser le classement. Plus les soumissions sont précises, plus les candidats obtiennent un score élevé.
Le jeu de données utilisé pour ce challenge est issu de l’agence d’une agence bancaire de la région parisienne. Les données correspondent à un échantillon des transactions des clients de l’agence. Chaque ligne représente un client, chaque colonne contient les attributs de ce client. Le jeu de données est composé de 5 variables:
- date de la dernière transaction
- mode de paiement
- fidélité du client
- profil du client (âge et genre)
Les participants peuvent télécharger le jeu de données au format CSV :
- un jeu de données d’entraînement – Téléchargement
- un jeu de données de test pour faire la prédiction – Téléchargement
Dans le cadre d’une pédagogie « réaliste », nous vous incitons par ailleurs à envisager l’usage de données complémentaires pour élaborer vos conclusions et recommandations.
Règlement
La participation au Challenge implique pour tout participant l’acceptation entière et sans réserve des règles ci-dessous. Le non-respect dudit Règlement entraîne l’annulation immédiate de la participation et de l’attribution éventuelle des dotations.
- L’inscription et la participation au Challenge est entièrement gratuite.
- Le challenge est ouvert uniquement à une personne physique âgée de dix-huit (18) ans et/ou juridiquement capable au moment de l’inscription. Il ne sera admis qu’une seule participation au challenge par personne. Ce challenge n’est pas ouvert aux membres du personnel des sociétés de solutions de mobilité et autoroutier ainsi qu’aux membres de leur famille.
- La participation au Challenge doit se faire de manière individuelle. Afin de participer au Challenge le participant doit avoir créé un compte utilisateur sur le site de Management & Data Science, et renseigné de manière loyale et complète les informations requises, telles que le nom, prénom, adresse mail, etc.
- Les participants individuels peuvent choisir de former une équipe de deux (2) à trois (3) membres maximum pour soumettre leur livrable.
- Le fait, pour un Participant ou une équipe, de ne pas déposer avant la date limite un Livrable sur le Site du Challenge sera considéré comme un abandon de sa part au Challenge. Le Participant ne pourra en aucun cas réintégrer le Challenge, ni ne pourra obtenir de la Société organisatrice un quelconque dédommagement.
- Le Participant reconnait et accepte que Management & Data Science ou le sponsor du challenge puisse, en France, pour la durée du Challenge et pour une période d’un (1) an suivant la Finale, utiliser le Challenge à des fins publicitaires, y compris de communication et de marketing de la Société organisatrice, quel qu’en soit le format, le moyen et le support (site internet, bannières publicitaires, réseaux sociaux, newsletter, communiqué de presse, etc.), connus ou inconnus à ce jour, à titre gratuit ou onéreux. Cette utilisation n’ouvre droit à aucune rémunération autre que la dotation attribuée, ni ne nécessite de consentement supplémentaire de la part du Participant. La Société organisatrice s’engage expressément à cesser toute utilisation des éléments mentionnés ci-dessus en lien avec le Participant au terme de la période précitée.
- Chaque Participant garantit que : (i) ses contributions sont inédites et originales ; (ii) ses contributions ne portent pas atteinte aux droits d’un tiers ; (iii) tous les éléments composant ses contributions ainsi que toutes les informations communiquées dans les Livrables sont exacts, fiables et complets ; et (iv) la soumission des Livrables ne constitue pas un acte de concurrence déloyale.
- Les participants cèdent l’intégralité des droits ou titres de toute nature (notamment les droits de propriété industrielle et/ou intellectuelle), afférents aux dits documents et livrables, permettant au Sponsor de les exploiter librement, y compris à toutes fins commerciales.
- Les Données personnelles du Participant font l’objet d’un traitement au sens de la réglementation sur la protection des données personnelles (Règlement (UE) 2016/679 du parlement européen et du conseil du 27 avril 2016 dit « RGPD ») pour lequel Management & Data Science définit les finalités et les moyens et est, à ce titre, responsable de ce traitement au sens du RGPD.
- Management & Data Science ne saurait être tenue responsable de toutes perturbations, à la fois sur le réseau Internet ou des difficultés d’accès liées à un grand nombre de connectés ou de Participants. Management & Data Science ne peut en aucune manière être tenue responsable des coupures de communication ou d’accès, des pertes de données, des virus informatiques ou de tout préjudice direct ou indirect quel qu’il soit, éventuellement subi par un Participant avant pendant et après sa participation au Challenge. En conséquence, les Participants renoncent à tout recours contre Management & Data Science et ses préposés pour des dommages et/ou préjudices qu’ils pourraient subir dans le cadre du Challenge.
- Le Règlement et le Challenge sont soumis au droit français.
Contact
Pour tout renseignement : veuillez contacter : Olivier Mamavi – contact@management-datascience.org
il ne peut pas avoir d'altmétriques.)
Date de publication
Catégorie
ORCID
Affiliation
BigML : Plateforme de Machine Learning sans programmation