Prédire le turnover des collaborateurs d'une entreprise

Résumé

Le turnover est un phénomène de plus en plus présent dans la vie des entreprises. L'objectif de ce challenge consiste à analyser les caractéristiques des populations de salariés qui vont rester ou quitter l’entreprise.

Citation : . (Mar 2020). Prédire le turnover des collaborateurs d’une entreprise. https://management-datascience.org/projects/12496/.

L'auteur :

Henri Laude
(henri.laude@ar-p.com) - Advanced Research Partners

Liens d'intérêts : Le ou les auteurs déclarent ne pas avoir connaissance de conflit d'intérêts impliqués par l'écriture de cet article.

Financement : Le ou les auteurs déclarent ne pas avoir bénéficié de financement pour le travail mis en jeu par cet article.

Objectifs

Contexte

Les organisations sont désormais en concurrence sur deux plans : leurs produits et services ainsi que les talents requis pour les produire ou les exécuter.
Le succès d’une organisation sur ses marchés est déterminé par sa capacité à acquérir et retenir des talents. Au moment même où les marchés des entreprises sont en expansion, ce marché des talents semble se rétrécir.
Alors que les connaissances requises pour construire des produits et des services augmente, l’attractivité mais surtout la rétention d’employés expérimentés devient essentielle pour améliorer la productivité et le délai de mise à disposition des offres sur leur marché.

Mission

Votre mission consiste à analyser les caractéristiques des populations de salariés qui vont rester ou quitter l’entreprise « Xcorp » puis de proposer des solutions pour réduire le turnover des collaborateurs.

Déroulement

Le Data Challenge se déroulera en 3 phases :

une phase d’apprentissage (entraînement)
une phase de soumission (test)
une phase de présentation

Modalités

Livrables

Pour participer au challenge, chaque candidat doit s’inscrire au préalable sur le site web de Management & Data Science, en indiquant un prénom, un nom, une adresse email et une institution d’affiliation (université, école de commerce, entreprise, etc.).

A la fin de l’étape d’entraînement, les candidats soumettent leurs résultats qui comprendra :

les noms, prénoms et affiliation de chaque membre du groupe
une notice explicative avec :
- une introduction qui rappelle le contexte, la problématique et ses enjeux,
- une présentation du jeu de données utilisé,
- la méthode et les étapes utilisées pour réaliser les prédictions (transformation des données, modélisation, comparaisons des algorithmes utilisés, stratégie d’optimisation du modèle, évaluation du modèle) ;
- une analyse des résultats (typologie et profil des collaborateurs, facteurs déterminants et prédiction du turnover) et les limites de l’étude;
- des préconisations à l’entreprise pour réduire turnover de ses collaborateurs (stratégies de rétention);
- une conclusion rapide qui montre l’intérêt de la data science dans la gestion des ressources humaines.
le fichier soumission avec les prévisions définitives (format .csv, UTF8, séparateur virgule, noms des colonnes).

Évaluation

1) les prévisions

A partir du fichier soumission où les candidats auront remplacé les valeurs vierges par leurs prédictions (fichier qui contient l’identifiant de la transaction et la variable à prédire), les soumissions sont comparées aux valeurs réelles.

Plus les soumissions sont précises, plus les candidats obtiennent un score élevée.

La métrique d’évaluation principale sera l’exactitude (accuracy), c’est-à-dire le nombre de prédictions justes rapporté au nombre de cas de test dans le jeu de test.

Une péréquation est ensuite réalisée pour obtenir un score et réaliser le classement du challenge entre les équipes.

2) La notice explicative

La qualité du document d’accompagnement de la soumission sera évaluée suivant les critères suivants

Respect des consignes, qualité des illustrations et clarté des explications
Mise en évidence que la méthode utilisée
« Traçabilité » des étapes de la méthode utilisée :
- Hypothèses et essais effectués, réorientation des travaux, tactiques et stratégies …
- Étapes de traitement des données
- Paramétrage de l’outil (et/ou des algorithmes)
Reproductibilité de l’analyse
Interprétation des résultats
Pertinence des préconisations proposées

Classement

L’ensemble des propositions sera évalué et classé. Les 5 meilleures propositions iront en finale. Les candidats finalistes présenteront leurs préconisations à un jury.

Le jury désignera le groupe vainqueur en fonction du classement au challenge et de la qualité des préconisations.

Données

Description

Les candidats ont accès à un jeu de données comprenant dix attributs et plus de 10000 instances (une ligne par collaborateur dont on sait s’il a quitté ou pas l’entreprise). Ce jeu de donné est le fruit d’une collecte l’information effectué dans un contexte international.

La liste des variables est la suivante :

satisfaction_level
last_evaluation
number_project
average_montly_hours
time_spend_company : time spent at the company
Work_accident, whether they have had a work accident
promotion_last_5years whether they have had a promotion in the last 5 years
job (sales – tech – other)
salary
left, whether the employee has left

Il vous appartient d’interpréter vous-même la signification de ces données : en effet, en situation réelle la sémantique précise d’une information n’est pas toujours explicite et vos stratégies d’interprétations des résultats seront alors conditionnées à diverses hypothèses quant à la signification portée par chaque colonne de vos fichiers.

Fichiers

Les fichiers suivants sont remis aux candidats :

le fichier d’entrainement : chaque ligne comporte les caractéristiques d’un collaborateur et s’ils a ou pas quitté l’entreprise (« left ») Téléchargement
un fichier dédié à la soumission dont la colonne à prédire est vierge mais qui comporte les caractéristiques d’autres collaborateurs : la colonne « left » n’est pas renseignée, votre objectif sera de fournir en retour un fichier où les collaborateurs seront dans le même ordre que ce fichier d’origine, mais qui comportera une dernière colonne « left » stipulant si, d’après votre modèle, ce collaborateur aura quitté ou pas l’entreprise Xcorp. Téléchargement

- Service Externe
  BigML : Plateforme de Machine Learning sans programmation
  Accéder
61 contributeurs | 18 contributions envoyées
- Contributions gagnantes

Prédire le turnover des collaborateurs d’une entreprise

Résumé

Henri Laude

Objectifs

Contexte

Mission

Déroulement

Modalités

Livrables

Évaluation

1) les prévisions

2) La notice explicative

Classement

Données

Description

Fichiers

Henri Laude

Henri Laude

MCEInvité

Chief Data Scientist • Advanced Research Partners • France

2 3 2

Affiliation :

Parcourir

Ressources

Prédire le turnover des collaborateurs d’une entreprise

Partager

Prédire le turnover des collaborateurs d’une entreprise

Format APA

Résumé

Henri Laude

Objectifs

Contexte

Mission

Déroulement

Modalités

Livrables

Évaluation

1) les prévisions

2) La notice explicative

Classement

Données

Description

Fichiers

Affiliation :