Introduction to Reinforcement Learning
Université Paris–Saclay — 2025–2026
Le mercredi, 9h–12h15, salle 1A13.
Ce cours présente les notions et algorithmes de base de
l'apprentissage par renforcement, et comporte un volet pratique.
The course in given in French and the lecture notes are in English
Programme
- 12 novembre
- Processus de décision markoviens et opérateurs de Bellman — TD — TP
- 19 novembre
- Optimalité et programmation dynamique
- 26 novembre
- Itérations asynchrones
- 3 décembre
- Approximation stochastique
- 10 décembre
- Q-learning & SARSA
- 17 décembre
- Approximation de la fonction valeur
- 7 janvier
- Méthodes de gradient de politique
- 14 janvier
- Apprentissage par renforcement profond