La plateforme

Management & Data Science est une plateforme ouverte qui permet de créer et de partager des connaissances tout en accédant à des ressources exclusives. Avec plus de 3 500 membres actifs et 150 experts, elle offre un espace unique où chercheurs, professionnels et décideurs collaborent sur des projets de transformation numérique.

Les ressources

Articles

Les articles présentent différents éclairages sur la transformation digitale des entreprises. Les articles sont regroupés sous différents formats : avis d’experts, étude & recherche, application, culture data ou actualité.

Explorez et publiez votre article pour participer aux avancées de la communauté.

Datasets

Les Datasets sont des collections de données structurées préparées pour l’analyse.

Découvrez comment utiliser un Dataset, ou publiez un Dataset pour contribuer au travail de la Communauté.

Scripts

Les scripts sont des programmes spécialisés de traitement des données massives proposés par la communauté et accompagnés de commentaires. Découvrez comment les créer et les tester dans le Datalab.

Cours

Les cours sont des modules d’apprentissage des concepts et des techniques de la datascience. Conçus pour tous les niveaux, ils privilégient une approche concrète et permettent de monter rapidement en compétences au sein de la Communauté.

Découvrez également comment vous pouvez partager vos compétences en publiant un cours.

Projets

Les Projets sont des appels à la Communauté. Ils présentent une question et des modalités pour participer à sa résolution. Ils peuvent être des Appels à contribution, ou des Data Challenges (compétions ouvertes proposées par des organisations).

Vous êtes chercheur, étudiant, datascientist ? Participez à un Projet pour vous confronter à une problématique de terrain ou créez un Projet pour lancer une idée, proposer une piste de réflexion, résoudre un problème.

Vous êtes une entreprise, une administration, une institution ? Découvrez comment organiser un Data Challenge.

Discussions

Les discussions sont une base d’échange de connaissance et de débat sur le contenu de la plateforme ou, plus généralement, toute question relative à la datascience.

Pour trouver une réponse à vos questions, proposer une solution ou un point de vue, découvrez comment créer une discussion.

Datalab

Le Datalab est une suite de services cloud privé qui regroupent différentes solutions de stockage, de calcul et d’intelligence artificielle pour pouvoir traiter de gros volumes de données (big data). Ils peuvent être utilisés par des particuliers (datascientist, chercheur, étudiants, manager,…) notamment pour participer aux data challenges organisés par Management & Datascience.

Ces services cloud sont accessibles en ligne et à partir d’une simple connexion internet.

Une console de programmation

Jupyter est une application web utilisée pour programmer dans plusieurs langages, dont PythonJuliaRubyR, ou encore Scala. Jupyter permet de réaliser des calepins ou notebooks, c’est-à-dire des programmes contenant à la fois du texte en markdown et du code. Ces notebooks sont utilisés en datascience pour explorer et analyser des données.

 

Un serveur de base de données

La base de données relationnelles PostgreSQL a été installé pour indexer les données et faciliter leur exploitation.  Plusieurs extensions sont installées, notamment timescale pour les séries temporelles et AgensGraph pour l’analyse des réseaux sociaux. L’administration de la base de données se fait via une interface graphique PgAdmin.

 

Un serveur de calcul dédié au big data

TensorFlow est l’un des outils d’intelligence artificielle, les plus utilisés, pour développer et exécuter des applications de Machine Learning et de Deep Learning. Créé par Google, il propose un écosystème complet de bibliothèques et de ressources communautaires permettant d’analyser facilement des données massives sur le principe des tenseurs.

 

PyTorch est une bibliothèque logicielle d’apprentissage machine développée par les équipes de recherche de Facebook. PyTorch permet de manipuler des tenseurs (tableaux multidimensionnels), de les échanger facilement avec Numpy et d’effectuer des calculs efficaces sur CPU ou GPU.

 

Un serveur d’hébergement de projets

Gitea est un système de gestion de versions décentralisé. Il offre l’hébergement de projets avec le code source et les données sous Git. Au-delà du stockage, il permet un partage, un suivi, ainsi qu’un contrôle des modifications qui sont apportées sur le projet. Vous serez en mesure de créer votre propre dépôt, local et à distance, et transférer des fichiers d’un dépôt local à un dépôt public.

 

Un système de gestion de contenu

WordPress est le système de gestion de contenu le plus utilisé au monde. Il permet de créer et gérer facilement des contenus dynamiques sans avoir besoin d’utiliser des langages web.