Introduction to Reinforcement Learning


Université Paris–Saclay — 2024–2025

Ce cours présente les notions et algorithmes de base de l'apprentissage par renforcement, et comporte un volet pratique.

The course in given in French and the lecture notes are in English

Programme

6 novembre (salle 0A7)
Processus de décision markoviens et opérateurs de Bellman — TD (correction)— TP (correction)
13 novembre (salle 0A3 puis 0E5)
Optimalité et programmation dynamique — TDTP
25 novembre (salle 0D1 puis 0E5)
Itérations asynchrones
27 novembre (salle 0A3 puis 0E5)
Approximation stochastique
5 décembre (salle 0A7 puis 0E5)
Q-learning & SARSA
12 décembre (salle 0A7 puis 0E5)
Approximation de la fonction valeur
19 décembre (salle 0A7 puis 0E5)
Méthodes de gradient de politique
9 janvier (salle 0E5)
Apprentissage par renforcement profond
16 janvier (salle 0E5)
Examen