Partie 2 – Déployer un projet de data marketing avec BigML
Créer un échantillon de test avec BigML
Afin de mesurer la pertinence de vos modèles, il faut diviser vos données en 2:
- des données d’entraînement pour estimer les paramètres des modèles (80% du dataset)
- des données de test pour évaluer l’impact de divers choix de modèles et hyper-paramètres (20% du dataset)
Pour cela, vous devez définir le pourcentage, donner des noms à vos échantillons et créer le jeu de données.
BigML va créer 2 Dataset :
- un « xxx|Trainig 80% », qui servira à entraîner les algorithmes
- un « xxx|Test 20% », qui servira à tester les algorithmes