Introduction to Reinforcement Learning

Université Paris–Saclay — 2025–2026
Le mercredi, 9h–12h15, salle 1A13.

Ce cours présente les notions et algorithmes de base de l'apprentissage par renforcement, et comporte un volet pratique.

The course in given in French and the lecture notes are in English

Programme

12 novembre: Processus de décision markoviens et opérateurs de Bellman — TD (correction)— TP (correction)
19 novembre: Optimalité et programmation dynamique — TD (correction) — TP (correction)
26 novembre: Itérations asynchrones — TD (correction) — TP (correction)
3 décembre: Approximation stochastique — TP (correction)
10 décembre: Q-learning & SARSA — TP (correction)
17 décembre: Approximation de la fonction valeur — TP (correction)
14 janvier: Méthodes de gradient de politique — TP (correction)
En autonomie: Apprentissage par renforcement profond — TP (correction)
22 janvier (14h–16h30, salle 1A13): Examen (sujet 2025)