Contexte

La RSE (Responsabilité Sociétale et Environnementale) des entreprises désigne la prise en compte par les entreprises des enjeux, environnementaux, sociaux, économiques et éthiques dans leurs activités. Les activités des entreprises sont ici entendues au sens large : activités économiques, interactions internes (salariés, dirigeants, actionnaires) et externes (fournisseurs, clients, autres).

La mise en place d’indicateurs est essentielle pour mesurer et suivre la démarche RSE d’une entreprise, et ainsi évaluer sa progression dans le domaine du développement durable. Les indicateurs RSE permettent de relier performance financière, stratégie de développement durable et investissement responsable. Ils rendent compte ainsi des agissements d’une société ou d’un secteur dans l’écologie, dans le droit du travail et dans la gouvernance.

Mission

Votre mission consiste à construire une base de données sur la responsabilité sociétale et environnementale (RSE) des entreprises françaises.

Cette base de données devra intégrer au minimum 2 jeux de données. Un jeu de données avec des variables sur les entreprises (par exemple sur l’identification, la localisation, la taille, la performance économique, l’activité, la performance,…). L’autre jeu de données doit fournir des variables sur les dimensions sociétales et environnementales ( par exemple sur l’émission de gaz, l’emprunte carbone, consommation énergétique, traitement des déchets, qualité de vie et santé au travail, égalité homme/femme, diversité, formation du personnel, hygiène et sécurité au travail, …).

Vous devrez livrer votre contribution sous la forme d’un “data paper“. Le data paper est une publication qui décrit un jeu de données brutes, notamment à l’aide d’informations précises (métadonnées). Il informe la communauté de la disponibilité de ces jeux de données et de leur potentiel pour des utilisations futures. Il montre l’originalité et la portée du jeu de données qu’il décrit. Il valorise les données en exposant leur potentiel pour des utilisations et projets futurs. Enfin, il facilite la réutilisation des données en mettant en évidence la qualité des données et des procédures et les rend plus facilement repérables et citables par d’autres études.

Pour participer au challenge, chaque candidat doit s’inscrire au préalable sur le site web de Management & Data Science, en indiquant un prénom, un nom, une adresse email et une institution d’affiliation.

Déroulement

Le déroulement du challenge sera le suivant :
1. Inscription individuelle au data challenge
2. Constitution d’une équipe
3. Création du jeu de données
4. Description des données
5. Soumission des résultats
6. Présentation des résultats
7. Publication de la meilleure contribution dans la revue Management & Datascience

Soumission

Les contributions des participants doivent obligatoirement être déposées directement sur le formulaire en ligne du site de Management & Data Science, dans l’onglet contribution du menu latéral de la page du challenge.

Vous devez soumettre un “data paper” qui comprend deux parties :

  • une partie descriptive, c’est le data paper proprement dit. Cette partie explique le contexte d’obtention des données, les présente et en démontre la fiabilité.
  • la base de données qui a été construit sur le datalab de MDS. Ce datalab comprend Gitea pour déposer l’ensemble des fichiers des données (data files) et Postgre pour la base de données;

La partie descriptive comprend les éléments suivants :

  • le titre de la contribution (10 mots maximum)
  • un résumé de 100 mots avec les mots clés
  • une introduction présentant l’arrière-plan de l’étude (contexte et enjeu généraux et spécifiques), les questions de recherche à l’origine de la collecte des données, et la plus-value de cette collecte (originalité, importance et potentiel d’utilisation en recherche),
  • la description des matériels et méthodes pour permettre de reproduire l’étude : sources des données, protocole expérimental, méthode d’échantillonnage, descripteurs physiques, procédures de contrôle qualité…
  • la description des données pour permettre de les réutiliser : structure, format, disponibilité, explication de données aberrantes…
  • des informations justifiant la fiabilité et la rigueur des données, si besoin accompagnées de figures et tableaux : validation de la procédure de collecte de données, analyses statistiques de l’erreur expérimentale, évaluation d’échantillons biologiques…
  • si besoin, conseils pour la réutilisation des données,
  • la liste des sources et des références bibliographiques,
  • les figures, tableaux, annexes, relatifs à la méthodologie, à la qualité des données, ou proposant une synthèse des données.

Evaluation

Les propositions seront évaluées selon les 4 critères suivant :

  • La pertinence: dans quelle mesure le livrable répond à la mission ?
  • La reproductibilité : les résultats proposés sont-ils reproductibles ?
  • L’impact : quelle est la valeur de la contribution ?
  • La clarté : la solution proposée est-elle intelligible et originale ?

 

 

Source de données

Pour construire votre base de données, vous devrez vous appuyer sur des sources de données ouvertes et libres d’utilisation. Vous trouverez ci-dessous quelques sources de données :

Clé d’authentification

Vos jeux de données doivent pouvoir s’intégrer dans une base de données relationnelle. Pour permettre la jointure entre les jeux de données, c’est-à-dire l’opération d’appariement permettant de l’associer avec plusieurs tables; vous devez utiliser une clé d’authentification des entreprises. L’objectif principal de la clé d’authentification est de fournir un moyen d’identifier chaque entreprise dans la table.

La clé d’authentification qui est recommandé est le numéro SIRET. Le numéro Siret permet d’identifier géographiquement chaque entreprise ou chaque établissement de la même entreprise. Il identifie le lieu où est produit l’activité du ou des établissements que détient l’entreprise. Si l’activité est produite dans plusieurs locaux, chacun d’eux recevra un numéro Siret différent. Il est composé de 14 chiffres : le numéro Siren (9 chiffres) + le numéro NIC (5 chiffres). Le NIC (numéro interne au classement) définit l’emplacement géographique.