Principes de l’apprentissage supervisé

L’apprentissage supervisé consiste à superviser l’apprentissage de la machine en lui montrant des exemples (des données) de la tâche qu’elle doit réalisée.

Pour cela, la machine peut apprendre une relation $f : x \rightarrow y$ qui relie $x$ à $y$ en ayant analysé des millions d’exemples d’associations $x \rightarrow y$ .

Fondements

L’apprentissage supervisé repose sur 2 types de variables :

Une variable objectif (target) $y$
Une ou plusieurs variables caractéristiques (features) $x$

L’objectif de l’apprentissage supervisé est de laisser la machine trouver le modèle (c’est-à-dire la fonction mathématique) qui correspond le mieux au Dataset $(x, y)$ .

La machine doit trouver les coefficients de cette fonction (paramètres) qui donnent les meilleurs résultats de prédiction.

La Fonction Coût consiste à mesurer les erreurs entre le modèle et le Dataset.

L’apprentissage consiste donc pour une machine (algorithme) à rechercher les paramètres de modèle qui minimisent la Fonction Coût.

Modèles

Les principaux algorithmes d’apprentissage supervisé sont:

Régression linéaire
Régression logistique
Arbre de décision
Forêt d’arbres décisionnels
Réseaux de neurones
Support Vector Machine (SVM)

Chapitre précédent Chapitre suivant

Datascience pour les managers

Principes de l’apprentissage supervisé

Fondements

Modèles

Table des matières

Partie 1 – Comprendre la data science

Partie 2 – Déployer un projet de data science

Partie 3 – L’apprentissage supervisé (Supervised Learning)

Partie 4 – L’apprentissage non supervisé (Unsupervised Learning)

Partie 5 – Pour aller plus loin…