• Résumé

    Votre mission consiste à construire une base de données sur la responsabilité sociétale et environnementale (RSE) des entreprises françaises.

    Citation : Mamavi, O. (Sep 2022). Construire une base de données sur la R.S.E. #2. https://management-datascience.org/challenges/20652/.
    L'auteur : 
    • Olivier Mamavi
       (omamavi@gmail.com) - Paris School of Business  - ORCID : https://orcid.org/0000-0002-6421-1048
    Copyright : © 2022 l'auteur. Publication sous licence Creative Commons CC BY-ND.
    Liens d'intérêts : Le ou les auteurs déclarent ne pas avoir connaissance de conflit d'intérêts impliqués par l'écriture de cet article.
    Financement : Le ou les auteurs déclarent ne pas avoir bénéficié de financement pour le travail mis en jeu par cet article.
    Objectifs

    Contexte

    La RSE (Responsabilité Sociétale et Environnementale) des entreprises désigne la prise en compte par les entreprises des enjeux, environnementaux, sociaux, économiques et éthiques dans leurs activités. La mise en place d’indicateurs est essentielle pour mesurer et suivre la démarche RSE d’une entreprise, et ainsi évaluer sa progression dans le domaine du développement durable.

    Les indicateurs RSE permettent de relier performance financière, stratégie de développement durable et investissement responsable. Ils rendent compte ainsi des agissements d’une société ou d’un secteur dans l’écologie, dans le droit du travail et dans la gouvernance.

    Mission

    Votre mission consiste à construire une base de données sur la responsabilité sociétale et environnementale (RSE) des entreprises françaises.

    Cette base de données devra intégrer au minimum 2 jeux de données. Un jeu de données qui vous est fourni avec des variables sur les entreprises (par exemple sur l’identification, la localisation, la taille, la performance économique, l’activité, la performance,…). L’autre jeu de données que vous devez concevoir et qui doit être composé des variables sur les dimensions sociétales et environnementales ( par exemple sur l’émission de gaz, l’emprunte carbone, consommation énergétique, traitement des déchets, qualité de vie et santé au travail, égalité homme/femme, diversité, formation du personnel, hygiène et sécurité au travail, …).

    Vous présenterez votre contribution sous la forme d’un “data paper“. Le data paper est une publication qui décrit un jeu de données brutes, notamment à l’aide d’informations précises (métadonnées). Il informe la communauté de la disponibilité de ces jeux de données et de leur potentiel pour des utilisations futures. Il montre l’originalité et la portée du jeu de données qu’il décrit. Il valorise les données en exposant leur potentiel pour des utilisations et projets futurs. Enfin, il facilite la réutilisation des données en mettant en évidence la qualité des données et des procédures et les rend plus facilement repérables et citables par d’autres études.

    Modalités

    Déroulement


    Le déroulement du challenge sera le suivant :

    • Inscription individuelle au data challenge
    • Constitution d’une équipe
    • Identification des sources de données
    • Création d’un jeu de données (table)
    • Jointure avec la base de données
    • Rédaction du data paper
    • Soumission des résultats
    • Présentation des résultats
    • Publication de la meilleure contribution dans la revue Management & Datascience

    Livrable


    Vous devez soumettre un “data paper” qui comprend deux parties :

    • une partie descriptive, c’est le data paper proprement dit. Cette partie explique le contexte d’obtention des données, les présente et en démontre la fiabilité.
    • la base de données qui a été construit et déposé dans le  datalab.

    La partie descriptive comprend les éléments suivants :

    • le titre de la contribution (10 mots maximum)
    • un résumé de 100 mots avec les mots clés
    • une introduction présentant l’arrière-plan de l’étude (contexte et enjeu généraux et spécifiques), les questions de recherche à l’origine de la collecte des données, et la plus-value de cette collecte (originalité, importance et potentiel d’utilisation en recherche),
    • la description des matériels et méthodes pour permettre de reproduire l’étude : sources des données, protocole expérimental, méthode d’échantillonnage, descripteurs physiques, procédures de contrôle qualité…
    • la description des données pour permettre de les réutiliser : structure, format, disponibilité, explication de données aberrantes…
    • des informations justifiant la fiabilité et la rigueur des données, si besoin accompagnées de figures et tableaux : validation de la procédure de collecte de données, analyses statistiques de l’erreur expérimentale, évaluation d’échantillons biologiques…
    • si besoin, conseils pour la réutilisation des données,
    • la liste des sources et des références bibliographiques,
    • les figures, tableaux, annexes, relatifs à la méthodologie, à la qualité des données, ou proposant une synthèse des données.

    Evaluation


    Les propositions seront évaluées selon les 4 critères suivant :

    • La pertinence: dans quelle mesure le livrable répond à la mission ?
    • La reproductibilité : les résultats proposés sont-ils reproductibles ?
    • L’impact : quelle est la valeur de la contribution ?
    • La clarté : la solution proposée est-elle intelligible et originale ?

     

    Données

    Source de données

    Pour construire votre base de données, vous devrez vous appuyer sur des sources de données ouvertes et libres d’utilisation.

    La première source de donnée à utiliser est la base Sirene des entreprises et de leurs établissements.  Vous trouverez dans le répertoire db_siren des fichiers sur les entreprises (en fonction du SIRENE et SIRET) avec leur localisation (adresse), leur taille (effectif) et leur activité (code NAF).

    Vous trouverez ci-dessous d’autres sources de données qui pourront vous être utile :

    Clé d’authentification

    Vos jeux de données doivent pouvoir s’intégrer dans une base de données relationnelle. Pour permettre la jointure entre les jeux de données, c’est-à-dire l’opération d’appariement permettant de l’associer avec plusieurs tables; vous devez utiliser une clé d’authentification des entreprises. L’objectif principal de la clé d’authentification est de fournir un moyen d’identifier chaque entreprise dans la table.

    La clé d’authentification qui est recommandé est le numéro SIRET. Le numéro Siret permet d’identifier géographiquement chaque entreprise ou chaque établissement de la même entreprise. Il identifie le lieu où est produit l’activité du ou des établissements que détient l’entreprise. Si l’activité est produite dans plusieurs locaux, chacun d’eux recevra un numéro Siret différent. Il est composé de 14 chiffres : le numéro Siren (9 chiffres) + le numéro NIC (5 chiffres). Le NIC (numéro interne au classement) définit l’emplacement géographique.

     

  • Le challenge n'est pas encore ouvert.
    Pour participer à un Challenge, inscrivez-vous sur la plateforme et fournissez les informations nécessaires pour obtenir un profil de Contributeur. Vous pourrez ensuite Rejoindre une équipe existante ou Créer votre propre équipe.