Ingénieur en apprentissage par renforcement sur jeux à information incomplète

il y a 1 semaine


Palaiseau, France Thales - CortAIx Factory (AI by Thales) Temps plein

Lieu : Palaiseau, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d’activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l’environnement et plus inclusif. Le Groupe investit près de 4 milliards d’euros par an en Recherche & Développement, notamment dans des domaines clés de l’innovation tels que l’IA, la cybersécurité, le quantique, les technologies du cloud et la 6G. Thales compte près de 81 000 collaborateurs dans 68 pays. ​Nos engagements, vos avantagesNotre savoir-faire technologiqueNotre attention portée à l’équilibre des collaborateursUn environnement inclusif et bienveillantUn engagement sociétal et environnemental reconnu (Thales Solidarity, indice CAC 40 ESG…)Votre quotidienThales Research&Technology, notre centre de recherche dans les domaines matériels, et CortAIx Labs, notre centre de recherche en IA et digital ont pour mission de proposer des innovations de ruptures, de maintenir et d’accroitre l’avance technologique et d’en assurer la compétitivité pour le groupe.Résoudre des jeux multi-agents à information incomplète (contrairement aux échecs ou au go) est un défi majeur : chaque agent doit raisonner avec de l’incertitude sur l’état réel du jeu et sur les intentions des adversaires. Les approches de type Counterfactual Regret Minimization (CFR) ont montré leur efficacité lorsque la combinatoire reste limitée. Plus récemment, des travaux de pointe de Google Deepmind en 2023 ont démontré qu’un apprentissage par renforcement et des architectures dédiées peuvent atteindre un niveau expert sur des jeux à très grande combinatoire comme Stratego.Votre objectif sera de reproduire les principes de ces approches de pointe sur le jeu Zenith (multi-agents, information incomplète, complexité intermédiaire). L’enjeu sera de dépasser les limites des méthodes CFR « pures » en s’appuyant sur des techniques d’apprentissage par renforcement et de recherche mieux adaptées à ce cadre.Dans ce contexte, vous aurez pour missions :État de l’art : jeux à information incomplète, CFR/Deep-CFR, self-play, régularisation/équilibres, estimation de croyances (beliefs) et modèles d’adversaires.Modélisation de Zenith : spécification des règles, états partiellement observables, espaces d’actions, mécanismes de révélation d’information.Implémentation : environnement d’entraînement, RL basé sur les agents (policy/value), gestion de l’exploration/exploitation sous incertitude.Évaluation : métriques de performance (win-rate, ELO, exploitabilité), ablations (avec/sans croyances, variations de budget de calcul), robustesse face à des stratégies variées.Valorisation : analyse de la transposabilité aux cas d’usage Thales (entraînement stratégique/tactique, raisonnement en environnement électromagnétique avec brouillage/anti-brouillage).Votre profil STAGE – Ingénieur en apprentissage par renforcement sur jeux à information incomplète (H/F) – 6 moisVous avez envie de découvrir le domaine de la recherche ?Vous avez pour ambition de réaliser votre stage au sein de Thales ?Etudiant en M2, en Ecole d’ingénieur en IA, Maths appliquées ou informatique, vous avez des connaissances en :Pratique de Python et d’un framework deep learning (PyTorch)Vous avez une bonne base en RL, théorie des jeux ou optimisationAnglais (niveau B2-C1 attendu)Rigueur, autonomie et goût pour l’expérimentation sont des atouts que l'on vous reconnait ?Alors ce stage est fait pour vous Tous nos stages sont conventionnés et soumis à une gratification dont le montant est déterminé selon votre niveau d’études.Thales, entreprise Handi-Engagée, reconnait tous les talents. La diversité est notre meilleur atout. Postulez et rejoignez nous Construisons ensemble un avenir de confiance Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d’activité : Défense & Sécurité, Aéronautique & Spatial, et Cybersécurité & Identité numérique. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l’environnement et plus inclusif. Le Groupe investit près de 4 milliards d’euros par an en Recherche & Développement, notamment dans des domaines clés de l’innovation tels que l’IA, la cybersécurité, le quantique, les technologies du cloud et la 6G. Thales compte près de 81 000 collaborateurs dans 68 pays. Avec plus de 600 experts IA et une centaine de doctorants en IA chaque année, et disposant d’un réseau de partenaires industriels, start-up et académiques de premier ordre, Thales est, depuis une décennie, un acteur majeur de l’IA de confiance, transparente, explicable et éthique. Le Groupe figure en tête, en Europe, dans le classement des déposants de brevets dans l’IA des systèmes critiques. Il intègre de l’IA dans plus d’une centaine de ses produits et services. CortAIx est l’accélérateur IA qui dotera les forces armées, les avionneurs et tous les opérateurs d’infrastructures critiques, de solutions hautement sécurisées leur apportant plus d’efficacité dans l’analyse des données et la prise de décision, tout en tenant compte des contraintes spécifiques, telles que la cybersécurité, l’embarquabilité et la frugalité, liées aux environnements critiques. Au sein de cette nouvelle organisation, nous représentons l'axe "cortAIx Factory" qui vise à accélérer la qualification et l’industrialisation des outils de développement de l’IA ainsi que les cas d’usage pour les données des systèmes. Thales dote déjà ses systèmes d’IA et continue d’identifier de nouveaux cas d’usages pour accélérer la performance, comme par exemple la planification de missions, la gestion du trafic aérien, le pilotage de drones et de robots.



  • Palaiseau, Île-de-France Thales Temps plein

    Lieu : Palaiseau, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus...


  • Palaiseau, Île-de-France Thales Temps plein

    Lieu : Palaiseau, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus...


  • Palaiseau, Île-de-France Thales Temps plein

    Lieu : Palaiseau, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus...


  • Palaiseau, Île-de-France Thales Temps plein

    Lieu : Palaiseau, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus...


  • Palaiseau, Île-de-France Thales Temps plein

    Lieu : Palaiseau, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus...


  • Palaiseau, France Thales - CortAIx Factory (AI by Thales) Temps plein

    Lieu : Palaiseau, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d’activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l’environnement et...


  • Palaiseau, France JobiJoba FR S2 Temps plein

    Activités Dans le cadre de votreSTAGE - Apprentissage cross-modal pour la segmentation des nuages H/F, vos missions seront : Objectifs : L’objectif de ce stage est de développer un modèle de deep learning pour la segmentation des nuages dans des images fisheye RGB en utilisant des masques de nuages basés sur l’infrarouge comme vérité terrain. Le...


  • Palaiseau, Île-de-France TotalEnergies Temps plein

    Contexte et environnementAvec l'essor des systèmes de production d'énergie photovoltaïques (PV), le secteur fait face à de nouveaux défis liés à la variabilité à court terme de la production solaire. Les changements rapides de la couverture nuageuse peuvent provoquer des fluctuations importantes de l'irradiance solaire, impactant la stabilité du...


  • Palaiseau, Île-de-France CEA Temps plein

    Informations générales Entité de rattachement Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un...


  • Palaiseau Polytechnique, France Thales Temps plein

    Lieu : Palaiseau, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus...