$a összefoglalója | Plateforme pédagogique de l'université de Bordeaux

Enrol users according to the institutional scholarship management system

Apprentissage par renforcement

L’objectif de cette UE est de présenter les fondements théoriques de l’apprentissage par renforcement (RL), afin de les mettre en pratique dans des domaines variés. Une première partie du cours s’appuie sur une riche théorie mathématique (Markov Decision Process(MDP), Monte Carlo Tree Search (MCTS), ...), et permet de saisir les enjeux du domaine, elle est complétée par une deuxième partie plus pratique où l’apprentissage par renforcement se combine aux techniques d’apprentissage profond (Q-Learning, DQN, ...).

Tanár: Lagarde Guillaume
Tanár: Zemmari Akka

Enseignant responsable: Guillaume LAGARDE