STAGE - IA - Évaluation et alignement d'agents LLM F/H
il y a 12 heures
Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus inclusif. Le Groupe investit près de 4 milliards d'euros par an en Recherche & Développement, notamment dans des domaines clés de l'innovation tels que l'IA, la cybersécurité, le quantique, les technologies du cloud et la 6G. Thales compte près de collaborateurs dans 68 pays.
Nos engagements, vos avantagesNotre savoir-faire technologique
Notre attention portée à l'équilibre des collaborateurs
Un environnement inclusif et bienveillant
Un engagement sociétal et environnemental reconnu (Thales Solidarity, indice CAC 40 ESG…)
Au sein du département Systèmes de Protection Défense (PRS), notre équipe développe un système agentique basé sur des LLM capable de convertir automatiquement des protocoles militaires structurés (ex. NVG vers ADatP-3, etc.).
Ce système repose sur :
- un agent convertisseur (LangGraph + LLM + outils MCP),
- une infrastructure d'observabilité (Langfuse).
Le stage vise à concevoir un protocole d'évaluation réaliste pour un agent LLM outillé, puis à exploiter les trajectoires collectées pour améliorer l'agent convertisseur via des techniques d'alignement modernes (SFT, DPO, GRPO).
Le sujet se déroulera en 2 étapes :
- Une phase d'évaluation afin de déterminer la performance de l'agent convertisseur à l'aide d'un nouvel agent opérateur
- et une seconde phase d'amélioration de l'agent convertisseur à l'aide des trajectoires générées durant la phase d'évaluation (Self-Imitation Learning).
Tes missions consisteront à :
- Développer un agent simulé : implémenter un agent LangGraph jouant le rôle d'un opérateur humain et piloter des conversations simulées selon des scénarios définis.
- Collecter et traiter les données : utiliser Langfuse pour enregistrer les interactions et consolider les trajectoires au format JSONL.
- Analyser le raisonnement : identifier informations manquantes et hypothèses implicites, reconstituer les actions et analyser les stratégies efficaces.
- Définir les métriques et rewards : mesurer le succès end-to-end, le nombre de tours/actions et types d'échecs, et créer des fonctions de reward pour GRPO.
- Améliorer l'agent convertisseur : créer des datasets pour SFT, DPO et GRPO, évaluer les performances et analyser les gains.
- En dernière année d'école ingénieur ou diplôme équivalent (BAC+5), avec une spécialisation en IA, vous recherchez un stage de 6 mois ?
- Tu maîtrises Python et as déjà travaillé avec des LLM APIs (vLLM on-prem ou équivalent) ainsi que la gestion d'agents (MCP) ?
- Tu possèdes de solides connaissances des frameworks LangGraph et/ou LangChain, et idéalement des outils de tracing et d'observabilité comme Langfuse ?
- Des connaissances en reinforcement learning (TorchRL, TRL) seraient un plus.
- Tu es et as envie d'explorer, comprendre et tester de nouvelles approches ?
- Tu disposes d'un bon esprit d'analyse te permettant de structurer un problèmen d'analyser des résultats et d'en tirer des conclusions.
- Tu savais avancer de manière autonome mais aussi travailler en équipe, partager tes idées et écouter les autres ?
Si tu veux apprendre, innover et contribuer à des projets qui ont du sens, on a hâte de te rencontrer. Postule et viens construire l'IA de demain avec nous
Tous nos stages sont conventionnés et soumis à une gratification dont le montant est déterminé selon votre niveau d'études.Thales, entreprise Handi-Engagée, reconnait tous les talents. La diversité est notre meilleur atout. Postulez et rejoignez nous-
Vélizy-Villacoublay, Île-de-France AEROCONTACT Temps pleinSafran est un groupe international de haute technologie opérant dans les domaines de l'aéronautique (propulsion, équipements et intérieurs), de l'espace et de la défense. Sa mission : contribuer durablement à un monde plus sûr, où le transport aérien devient toujours plus respectueux de l'environnement, plus confortable et plus accessible. Implanté...
-
Stage Cybersécurité/IA
il y a 4 jours
Vélizy-Villacoublay, Île-de-France Caplogy SAS Temps pleinDéveloppement d'un système de défense autonome : prédiction d'attaques DDoS et recommandation automatique de contre-mesures (RL & IA décisionnelle)ContexteLes travaux précédents ont permis de développer des modèles de prédiction d'attaques DDoS atteignant plus de 99 % de précision avec XGBoost sur des jeux de données de référence (CICDDoS2019 /...
-
241208/Data Scientist Azure ML Python Gitlab LLM
il y a 7 jours
Vélizy-Villacoublay, Île-de-France Worldwide People Temps pleinData Scientist Azure ML Python Gitlab LLM La mission concerne, une nouvelle entité du client créée pour développer de nouveaux cas d?utilisation en Intelligence Artificielle. La mission s?organise autour de trois axes : Identification et analyse des besoins : participation à des ateliers d?idéation pour identifier les besoins du client et proposition...
-
STAGE - IA pour l'Ingénierie Sûreté de Fonctionnement (SdF) - F/H
il y a 1 semaine
Vélizy-Villacoublay, Île-de-France Thales Temps pleinLieu : Vélizy-Villacoublay, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de...
-
Vélizy-Villacoublay, Île-de-France Thales Temps pleinLieu : Vélizy-Villacoublay, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de...
-
STAGE - IA pour l'Ingénierie Sûreté de Fonctionnement (SdF) - F/H
il y a 13 heures
Vélizy-Villacoublay, Île-de-France Thales Temps pleinLieu : Vélizy-Villacoublay, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de...
-
Vélizy-Villacoublay, Île-de-France Thales Temps pleinLieu : Vélizy-Villacoublay, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de...
-
STAGE - IA - Système d'analyse de contenu vidéo F/H
il y a 1 semaine
Vélizy-Villacoublay, Île-de-France Thales Temps pleinLieu : Vélizy-Villacoublay, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de...
-
Stage Robotique/IA
il y a 4 jours
Vélizy-Villacoublay, Île-de-France Caplogy SAS Temps pleinDéveloppement d'un système de stabilisation dynamique intelligent pour un drone dédié à la collecte des déchets maritimes échouésContexte et objectifsDans une optique de protection des écosystèmes côtiers, les drones autonomes sont de plus en plus utilisés pour la collecte de déchets maritimes échoués sur les plages, les berges et les zones...
-
Stage développement Fullstack Equipe R&D
il y a 2 semaines
Vélizy-Villacoublay, Île-de-France Groupe SII Temps pleinEt si ton code pouvait transformer la formation médicale ?Tu es en dernière année d'école à l'EFREI et tu veux que ton stage ait un vrai impact ? Tu veux travailler sur un projet tech qui a du sens, avec de l'IA, des avatars et du médical ?Alorsstoppe ton scroll.Ce stage est peut-être ton prochain défi.Le pôle R&D de SII IDF, en collaboration avec...