Analyser les données du Titanic avec BigML

Consulter le jeu de données

Vous pouvez consulter:

le type de variables
le nombre d’observations
les valeurs manquantes
la distribution

Consulter les statistiques descriptives des variables

Vous pouvez consulter pour chaque variable:

Min = valeur minimum
Mean = Moyenne
Mediane = autant en dessous qu’au dessus
Max = valeur maximum
STD DEV = Standard deviation : Ecart type.
Kurtosis = « Applatissement »
Skewness = « Asymetrie »

Configurer le jeu de données

Vous pouvez définir la/les variables cibles à prédire. La dernière ligne est définie par défaut comme objectif (icône en forme de croix). Le but est ce que nous voulons prédire. BigML appelle cela le champ objectif. Si votre dernière ligne n’est pas l’objectif que vous souhaitez modifier, placez votre souris sur la ligne souhaitée. Une icône apparaîtra pour que vous puissiez apporter les modifications.

Visualiser les relations entre les variables

Vous pouvez faire des figures en définissant vos axes et vos ordonnées.

Configurer le modèle

Vous pouvez choisir de configurer votre modèle prédictif manuellement ou de laisser BigML faire le travail lui-même grâce à ses fonctionnalités “1 clic”.

L’historique des requêtes réalisée sur un jeu de données apparaît ici:

Apprentissage supervisé

Par défaut, BigML représente le modèle prédictif sous la forme d’un arbre de décision.

Vous pouvez également choisir une visualisation sunburst et interagir avec celle-ci (sunburst intégré ci-dessous). La seule différence avec l’arbre de décision est qu’il commence par le centre plutôt que par le haut.

Tuto vidéo pour analyser les données

Chapitre précédent Chapitre suivant

Prédire les survivants du Titanic avec BigML