Evaluer le modèle des données du Titanic avec BigML

Lancer l’évaluation du modèle

Vous pouvez lancer l’évaluation après avoir précisé le jeu de données d’apprentissage à gauche et le jeu de données test à droite.

Sélectionner le modèle

Pour évaluer un modèle, il faut s’assurer que le jeu de données utilisé soit bien divisé en 2 parties.

  • La première partie, appelée ensemble de données d’apprentissage , représente 80% de l’ensemble de données d’origine et sera utilisée pour créer un modèle d’apprentissage.
  • La deuxième partie s’appelle le jeu de données de test , elle représente les 20% restants du jeu de données d’origine.

Après avoir créé avec succès un jeu de données de test et un modèle à partir du jeu de données d’apprentissage , il faut sélectionner le modèle que vous souhaitez évaluer.

Estimer la performance du modèle

Vous obtenez les performances prédictives du modèle en fonction de la variable cible identifiée. Si c’est un modèle de classification, vous avez avec les indicateurs suivants:

  • l’exactitude (accuracy)
  • la précision
  • le rappel (recall)
  • F mesure
  • le coefficient phi

En passant la souris sur les résultats, vous obtenez les explications des indicateurs.

 

L’objectif est de trouver le modèle qui propose la meilleure performance, notamment sur l’accuracy (performance globale de l’algorithme) ou sur la précision (performance de l’algorithme sur une classe). L’historique des évaluations permet de sélectionner le modèle le plus performant.