Pour pouvoir analyser de gros volumes de données, il faut disposer d’outils spécifiques. Management & Datascience fournit dans son laboratoire de données (Datalab) l’ensemble de ses outils pour permettre aux data scientists, aux chercheurs et étudiants, de réussir leur projet data.

Qu’est-ce qu’un Datalab?

Le Datalab est une suite de services cloud privé proposées par Management & Datascience.

Ces services regroupent différentes solutions de stockage, de calcul et d’intelligence artificielle pour pouvoir traiter de gros volumes de données (big data).

Ces services cloud sont accessibles en ligne et à partir d’une simple connexion internet. Ils peuvent être utilisés par des particuliers (datascientist, chercheur, étudiants, manager,…) notamment pour participer aux data challenges organisés par Management & Datascience.

Pourquoi utiliser le Datalab de Management & Datascience?

  1. Accéder à votre environnement 24h sur 24, 7 jours sur 7, depuis un simple navigateur web.
  2. Se servir de cet environnement virtuel de travail comme un terrain d’expérimentation et d’entraînement (bac à sable).
  3. Permettre aux utilisateurs individuels de profiter de ressources informatiques à la demande sans avoir à recourir aux administrateurs informatiques.
  4. Epargner aux utilisateurs la gestion d’une infrastructure, l’approvisionnement des serveurs et la configuration des réseaux.
  5. Bénéficier d’un support technique et d’une sauvegarde horaire de vos données

Quels sont les services?

Une console de programmation

Jupyter est une application web utilisée pour programmer dans plusieurs langages, dont PythonJuliaRubyR, ou encore Scala. Jupyter permet de réaliser des calepins ou notebooks, c’est-à-dire des programmes contenant à la fois du texte en markdown et du code. Ces notebooks sont utilisés en datascience pour explorer et analyser des données.

Un serveur de base de données

La base de données relationnelles PostgreSQL a été installé pour indexer les données et faciliter leur exploitation.  Plusieurs extensions sont installées, notamment timescale pour les séries temporelles et AgensGraph pour l’analyse des réseaux sociaux. L’administration de la base de données se fait via une interface graphique PgAdmin.

Un serveur de calcul dédié au big data

TensorFlow est l’un des outils d’intelligence artificielle, les plus utilisés, pour développer et exécuter des applications de Machine Learning et de Deep Learning. Créé par Google, il propose un écosystème complet de bibliothèques et de ressources communautaires permettant d’analyser facilement des données massives sur le principe des tenseurs.

PyTorch est une bibliothèque logicielle d’apprentissage machine développée par les équipes de recherche de Facebook. PyTorch permet de manipuler des tenseurs (tableaux multidimensionnels), de les échanger facilement avec Numpy et d’effectuer des calculs efficaces sur CPU ou GPU.

Un serveur d’hébergement de projets

Gitea est un système de gestion de versions décentralisé. Il offre l’hébergement de projets avec le code source et les données sous Git. Au-delà du stockage, il permet un partage, un suivi, ainsi qu’un contrôle des modifications qui sont apportées sur le projet. Vous serez en mesure de créer votre propre dépôt, local et à distance, et transférer des fichiers d’un dépôt local à un dépôt public.

Un système de gestion de contenu

WordPress est le système de gestion de contenu le plus utilisé au monde. Il permet de créer et gérer facilement des contenus dynamiques sans avoir besoin d’utiliser des langages web.

Pour en savoir plus

Les services cloud du Datalab de Management & Datascience sont facturés, à la demande, par utilisateur et mois.

Faites-nous part de vos besoins. Nous vous aiderons à déployer le Datalab de Management & Datascience pour réussir votre projet data.