Datascience pour les managers

Partie 3
Chapitre 1 sur 5
Partie 3 – L’apprentissage supervisé (Supervised Learning)

Principes de l’apprentissage supervisé

L’apprentissage supervisé consiste à superviser l’apprentissage de la machine en lui montrant des exemples (des données) de la tâche qu’elle doit réalisée.

Pour cela, la machine peut apprendre une relation f : x \rightarrow y qui relie x à y en ayant analysé des millions d’exemples d’associations x \rightarrow y.

Fondements

L’apprentissage supervisé repose sur 2 types de variables :

  • Une variable objectif (targety
  • Une ou plusieurs variables caractéristiques (features) x

L’objectif de l’apprentissage supervisé est de laisser la machine trouver le modèle (c’est-à-dire la fonction mathématique) qui correspond le mieux au Dataset (x, y).

La machine doit trouver les coefficients de cette fonction (paramètres) qui donnent les meilleurs résultats de prédiction.

La Fonction Coût consiste à mesurer les erreurs entre le modèle et le Dataset.

L’apprentissage consiste donc pour une machine (algorithme) à rechercher les paramètres de modèle qui minimisent la Fonction Coût.

Modèles

Les principaux algorithmes d’apprentissage supervisé sont:

  • Régression linéaire
  • Régression logistique
  • Arbre de décision
  • Forêt d’arbres décisionnels
  • Réseaux de neurones
  • Support Vector Machine (SVM)