Université de Zürich et Deep RL : des drones FPV apprennent à évoluer de manière autonome sur un parcours
L’équipe du professeur Davide Scaramuzza de l’université de Zürich travaille sur des outils d’apprentissage de trajectoires de vol de drones sur des parcours qui s’apparentent à ceux utilisés lors des courses FPV. Les premières expérimentations avaient permis aux drones autonomes de se mesurer au champion Alexa Vanover, durant l’été 2023 (voir ici).
Apprentissage accéléré par Deep RL
Les travaux des scientifique de l’UZH Zürich se sont poursuivis, principalement centrés sur le « Deep RL » : Deep Reinforcement Learning, l’apprentissage par renforcement profond. Les travaux ont été mis en application le 13 mars 2025 pendant l’événement #WorldMinds2025 qui s’est déroulé à Zürich dans un théâtre. Voici la présentation par Davide Scaramuzza : « […] notre équipe a présenté pour la première fois deux drones de course autonomes basés sur la vision. La préparation de cet événement a été un véritable défi, compte tenu des mauvaises conditions d’éclairage et des contraintes de sécurité d’un théâtre rempli de plus de 500 personnes ! L’écran d’arrière-plan visualise en temps réel les observations de l’algorithme d’IA de chaque drone. Aucune carte [prédéfinie], aucune centrale inertielle, et aucun SLAM [simultaneous localization and mapping ] n’ont été utilisés ! Bravo à Ismail Geles, Leonard Bauersfeld, Yannick Armati, Jiaxu Xing, Angel Romero Aguilar et Daniel (Yifan) Z. pour cette impressionnante performance ! ».
Comment ça fonctionne ?
Le système développé par l’équipe de scientifiques repose principalement sur la vidéo filmée par la caméra à bord. Des images sont extraites les contours des obstacles. Différentes complexes techniques de Deep RL permettent au système d’apprendre le parcours – l’équipe assure parvenir à des réactions sous les 33 millisecondes.
Demain ?
Les drones FPV autonomes vont-ils battre les pilotes humains sur des parcours dans des conditions de faible luminosité, avec des pièges placés par les concepteurs de tracks, en présence d’autres drones, avec un apprentissage réalisé au fur et à mesure des vols ? Ce n’est sans doute qu’une question de temps…
Source : UZH Zürich Robotics and Perception Group
Diverses publications document la progression de l’équipe de l’UZH Zürich :
- Compétition avec des pilotes de drones champions du monde grâce à l’apprentissage par renforcement
- Pourquoi l’apprentissage par renforcement est supérieur au contrôle optimal pour pousser les robots mobiles dans leurs retranchements (et pas seulement les drones)
- Comment nous avons obtenu des résultats sans cartes, sans IMU, sans SLAM
- Comment accélérer l’apprentissage par renforcement basé sur la vision en l’amorçant avec l’apprentissage par imitation
- Comment généraliser l’apprentissage par renforcement à des environnements et des tâches invisibles