CIFRE - Deep Learning-Based Motion Planning for Autonomous Driving

External

Alliancewd · Guyancourt

ContractHybridToday

Deep LearningReinforcement LearningTransformersVue

Cover Letter Connect

Prepare for this interview

Elite

AI-generated questions, company research, and talking points tailored to this role

Benefits

Vision insurance

Additional Information

Company AMPERE SOFTWARE TECHNOLOGY Job Description Contexte La planification de mouvement et la prise de décision sont des composants fondamentaux de l'architecture de la conduite autonome. Elles permettent de transformer les données de perception et le modèle du monde en commandes exploitables assurant la sécurité, le confort et l'efficacité énergétique. Traditionnellement, ces fonctions reposent sur des approches classiques telles que des règles heuristiques, des algorithmes d'optimisation ou des modèles basés sur la physique. Bien qu'efficaces dans des environnements structurés, ces méthodes rencontrent des difficultés dans des scénarios complexes et dynamiques. La conduite dans le monde réel implique des interactions imprévisibles avec de multiples agents (véhicules, piétons, cyclistes), des conditions environnementales variables (météo, luminosité) et des incertitudes liées aux systèmes de perception. Dans ce contexte, le Deep Learning (DL) offre une alternative prometteuse. En exploitant des jeux de données à grande échelle, les modèles de DL peuvent apprendre des représentations complexes et des politiques de conduite sans nécessiter une modélisation explicite de toutes les situations possibles. Les architectures modernes, en particulier le Deep Reinforcement Learning (DRL), démontrent de fortes capacités pour modéliser les interactions multi-agents et prédire les comportements futurs. Cette thèse vise à développer un cadre basé sur le Deep Learning pour la planification de mouvement, capable d'intégrer perception, prédiction et prise de décision dans une approche unifiée. L'objectif est de concevoir des modèles qui mappent des entrées multi-capteurs vers des trajectoires optimisées tout en respectant des contraintes strictes de sécurité, de confort et d'efficacité. Cette recherche s'inscrit dans la vision stratégique de Renault visant à développer des véhicules intelligents, connectés et automatisés, tout en améliorant la sécurité routière et l'expérience de conduite des utilisateurs. État de l'Art Comme le soulignent des études récentes, les approches basées sur des règles peinent à capturer la complexité des environnements dynamiques multi-agents et ne généralisent pas efficacement à des situations réelles diversifiées. Face à ces limitations, des approches basées sur l'apprentissage ont été introduites, suivant principalement deux paradigmes distincts. Le premier paradigme correspond aux approches de bout en bout (end-to-end), qui visent à apprendre une correspondance directe entre les entrées de perception et les commandes de contrôle. Ces méthodes ont montré des résultats prometteurs dans les contextes académiques et industriels, notamment grâce à leur capacité à exploiter des données à grande échelle. Cependant, elles manquent souvent d'interprétabilité et nécessitent de grandes quantités de données pour atteindre des performances robustes. Le second paradigme concerne les approches hybrides, qui conservent la structure modulaire des architectures traditionnelles tout en intégrant des composants basés sur l'apprentissage dans des modules spécifiques, notamment pour la prédiction et la planification. Ces méthodes visent à combiner la robustesse et la traçabilité des pipelines classiques avec la flexibilité et l'adaptabilité des modèles d'apprentissage automatique. Plus récemment, la recherche a convergé vers la combinaison de l'apprentissage par imitation et de l'apprentissage par renforcement. L'apprentissage par imitation permet aux modèles d'apprendre à partir de démonstrations d'experts, offrant une initialisation stable et accélérant la convergence. L'apprentissage par renforcement, quant à lui, permet d'optimiser des objectifs à long terme par interaction avec l'environnement, améliorant ainsi la généralisation et l'adaptabilité. Les avancées en apprentissage de représentations ont également contribué de manière significative à l'amélioration des performances en planification de mouvement. Les représentations en vue de dessus (Bird's Eye View) sont largement adoptées en raison de leur capacité à fournir une représentation structurée et interprétable de l'environnement de conduite. Par ailleurs, les mécanismes d'attention et les architectures basées sur les Transformers ont amélioré la modélisation des dépendances spatio-temporelles ainsi que des interactions entre multiples agents. Dans le domaine de l'apprentissage par renforcement, plusieurs algorithmes tels que Deep Q-Networks, Soft Actor-Critic et Proximal Policy Optimization offrent une meilleure stabilité et efficacité en termes d'échantillonnage. Malgré ces avancées, des défis majeurs subsistent en matière de sécurité, de robustesse et d'explicabilité, qui sont essentiels pour un déploiement dans le monde réel. Objectifs L'objectif principal de cette thèse est de concevoir, développer et valider un système de planification de mouvement basé sur le Deep Learning capable de générer des trajectoires sûres, efficaces et adaptat

Your Match

How well this role fits your profile.

Company Intel

What employees say

Worked at alliancewd? Share your experience

Interested in this role?

Apply on the company's website.

Cover Letter Connect