Introduction to Reinforcement Learning

Ce cours présente les notions et algorithmes de base de l'apprentissage par renforcement, et comporte un volet pratique.

The course in given in French and the lecture notes are in English

Programme

6 novembre (salle 0A7): Processus de décision markoviens et opérateurs de Bellman — TD (correction)— TP (correction)
13 novembre (salle 0A3 puis 0E5): Optimalité et programmation dynamique — TD (correction) — TP (correction)
25 novembre (salle 0D1 puis 0E5): Itérations asynchrones — TD (correction) — TP (correction)
27 novembre (salle 0A3 puis 0E5): Approximation stochastique — TP (correction)
5 décembre (salle 0A7 puis 0E5): Q-learning & SARSA — TP (correction)
12 décembre (salle 0A7 puis 0E5): Approximation de la fonction valeur — TP (correction)
19 décembre (salle 0A7 puis 0E5): Méthodes de gradient de politique — TP (correction)
9 janvier (salle 0E5): Apprentissage par renforcement profond — TP (correction)
16 janvier (salle 0E5): Examen