Introduction to Reinforcement Learning


Université Paris–Saclay — 2023–2024

Ce cours présente les notions et algorithmes de base de l'apprentissage par renforcement, et comporte un volet pratique.

The course in given in French and the lecture notes are in English

Programme

28 novembre (salle 0D1)
Processus de décision markoviens — TD
30 novembre (salle 0D1)
Opérateurs de Bellman et optimalité — TD
5 décembre (salle 0A1 puis 0E10)
Programmation dynamique — TDTP
7 décembre (salle 0D1 puis 0E4)
Itérations asynchrones — TP
12 décembre (salle 0A1 puis 0E6)
Méthodes tabulaires en apprentissage par renforcement — TP
19 décembre (salle 0A1 puis 0D10)
Approximation de la fonction valeur — TP
9 janvier (salle 1A7 puis 0D10)
Approximation de la fonction valeur – II — TP (correction)
16 janvier (salle 1A7 puis 0D10)
Méthodes de gradient de politique — TP (correction)

Évaluation à rendre le 22 janvier au plus tard.