Introduction to Reinforcement Learning


Université Paris–Saclay — 2025–2026
Le mercredi, 9h–12h15, salle 1A13.

Ce cours présente les notions et algorithmes de base de l'apprentissage par renforcement, et comporte un volet pratique.

The course in given in French and the lecture notes are in English

Programme

12 novembre
Processus de décision markoviens et opérateurs de Bellman — TD (correction)— TP (correction)
19 novembre
Optimalité et programmation dynamique — TD (correction) — TP (correction)
26 novembre
Itérations asynchrones — TD (correction) — TP (correction)
3 décembre
Approximation stochastique — TP (correction)
10 décembre
Q-learning & SARSA — TP
17 décembre
Approximation de la fonction valeur
7 janvier
Méthodes de gradient de politique
14 janvier
Apprentissage par renforcement profond
22 janvier (14h–16h30, salle 1A13)
Examen