Les algorithmes de bandits et leur application aux essais cliniques
Université Laval - Pavillon Poulliot - 1120 1065, avenue de la Médecine, QuebecAudrey Durand, PhD Résumé Le problème des bandits est une instance simplifiée d'un problème de reinforcement learning (RL), dont l'accent est mis sur le compromis entre l'exploration et l'exploitation. Cette présentation traitera plus spécifiquement des bandits contextuels, problème dans lequel un agent recherche l'action optimale dépendant d'un contexte donné. Cette variante de bandits sera présentée... Read more