Introduction to Reinforcement Learning


Université Paris–Saclay — 2025–2026
Le mercredi, 9h–12h15, salle 1A13.

Ce cours présente les notions et algorithmes de base de l'apprentissage par renforcement, et comporte un volet pratique.

The course in given in French and the lecture notes are in English

Programme

12 novembre
Processus de décision markoviens et opérateurs de Bellman — TDTP
19 novembre
Optimalité et programmation dynamique
26 novembre
Itérations asynchrones
3 décembre
Approximation stochastique
10 décembre
Q-learning & SARSA
17 décembre
Approximation de la fonction valeur
7 janvier
Méthodes de gradient de politique
14 janvier
Apprentissage par renforcement profond