Optimiser un modèle (feature engineering)
Définition
L’optimisation d’un modèle ou feature engineering concerne les techniques d’ingénierie utiliser pour travailler sur les attributs du problème étudié afin d’en améliorer la performance. En fait, le feature engineering est la pratique qui consiste à transformer des données brutes en la forme la plus appropriée et exploitable pour un algorithme de machine learning.
Démarche
Le feature engineering peut s’organiser en 2 grandes parties.
La première partie consiste à préparer les données en vue de l’élaboration d’un modèle. Cela comprend des processus tels que la détection, puis la suppression des valeurs aberrantes et manquantes. La deuxième partie implique la création et la transformation des attributs (features) communs aux données dans le jeu pour rendre le modèle le plus efficace possible, y compris une combinaison de métriques telles que la précision, le rappel ou la levée.
Ci-dessous les principales tâches à réaliser:
- Contrôler la qualité des données
- Gérer les données manquantes
- Transformer les variables
- Créer de nouvelles variables pour aider les algorithmes
- Réduire le nombre de dimension avec l’analyse factorielle
- Sélectionner le modèle les plus adaptés