ValidationCC+examen
EnseignantSylvain Delattre
Horaires hebdomadaires 2 h CM
Années M2 Mathématiques et Informatique pour la Science des Données (DM) M2 Mathématiques et Informatique appliquées à la Science des données

Syllabus

L'apprentissage par renforcement constitue, avec l'apprentissage supervisé et non-supervisé, l'une des trois grandes familles algorithmiques d'apprentissage automatique. Inspirée par la théorie de la décision et la psychologie comportementale, elle a pris une importance de premier plan ces dernières années en fusionnant avec d'autres méthodes d'apprentissage automatique, en particulier celle des réseaux profonds, donnant lieu à des champs d'application encore inexplorés.

Sommaire

  • Différentes familles d'apprentissage par renforcement:
    • model-based,
    • model-free (Q-learning)
  • Exploration des limites structurelles par des cas pratiques d'application.
  • Dernières méthodes (state-of-the-art) et champs de recherche actuels.
  • Fusion avec d'autres méthodes d'apprentissage automatique.

Bibliographie

  • Sutton, R.S. and Barto, A.G. (2018). Reinforcement Learning: An Introduction. MIT Press.