Les algorithmes de bandits et leur application aux essais cliniques

Université Laval - Pavillon Poulliot - 1120 1065, avenue de la Médecine, Quebec

Audrey Durand, PhD Résumé Le problème des bandits est une instance simplifiée d'un problème de reinforcement learning (RL), dont l'accent est mis sur le compromis entre l'exploration et l'exploitation. Cette présentation traitera plus spécifiquement des bandits contextuels, problème dans lequel un agent recherche l'action optimale dépendant d'un contexte donné. Cette variante de bandits sera présentée à travers une application à l'allocation de traitements adaptative pour la découverte de stratégies de traitement du cancer personnalisées à l’évolution de la maladie. Bio Audrey a obtenu une maîtrise en génie électrique de l’Université Laval, au cours de laquelle elle a collaboré avec des chercheurs du département de médecine sociale et préventive afin d’évaluer et d’améliorer plusieurs activités de prévention. Elle a ensuite complété un doctorat en génie électrique, également à l'Université Laval, dans laquelle elle s'est concentrée sur les algorithmes d'apprentissage par renforcement en ligne de la famille des bandits. En collaboration avec divers chercheurs, elle a utilisé ces algorithmes pour apprendre les stratégies de traitement adaptatif du cancer sur des modèles animaux et pour optimiser l'imagerie haute-résolution. Elle est maintenant chercheure postdoctorale à l'Université McGill, où elle consacre son temps à l'étude de la prise de décision en-ligne et à l'application de l'apprentissage automatique aux défis liés à la santé.