Stage 2026 - IA - Nlp - Gestion d'Incertitude et Hallucination dans les Réponses d'Agents IA H/F

il y a 1 jour


Labège, France Berger Levrault Temps plein

Sujet : Détection et gestion d'incertitude dans les réponses d'agents IA Contexte : Au sein de la Direction de la Recherche et de l'Innovation Technologique (DRIT), le Lab IA explore les nouveaux paradigmes d'intelligence artificielle, et en particulier l'intégration des modèles de langage de grande taille (LLM) dans des systèmes multi-agents intelligents. L'un des défis majeurs de ces systèmes concerne la fiabilité et la transparence des réponses générées : les modèles peuvent produire des affirmations incorrectes tout en affichant une confiance élevée. Cette « illusion de certitude » nuit à la confiance des utilisateurs et à la robustesse globale du système. Le stage s'inscrit dans une démarche de R&D exploratoire, visant à concevoir et expérimenter des mécanismes d'auto-évaluation et de calibration de confiance pour des agents conversationnels intégrant des LLM. Ce travail contribuera à l'amélioration de la fiabilité, de la traçabilité et de l'ergonomie cognitive de l'assistant IA développé dans le cadre du projet Athena de Berger-Levrault. Missions : - Étudier les approches existantes de détection d'incertitude et de calibration de confiance dans les modèles de langage : estimation probabiliste, self-consistency, chain-of-thought scoring, contradiction detection, LLM uncertainty estimation. - Concevoir un module d'évaluation de fiabilité, capable d'estimer la fiabilité d'une réponse générée à partir d'indicateurs sémantiques : évaluation de similarité de la réponse principale avec des réponses candidates, cohérence inter-agent, vérification de sources externes (API sur sites web de référence ou corpus métier de référence, etc.). - Mettre en place un système de scoring sémantique pour évaluer la cohérence interne des réponses et identifier les contradictions ou divergences logiques. - Prototyper un mécanisme de retour d'incertitude dans l'interface agentique : visualisation de la confiance (barres, couleurs, reformulations automatiques), feedback utilisateur. - Évaluer scientifiquement le dispositif, via un protocole expérimental mesurant précision, robustesse, calibrage et perception utilisateur. Selon l'avancement de la mission d'autres pistes comme la suggestion de correction seraient envisageable. Approches et technologies envisagées : - LLM : Modèles de Mistral AI - Frameworks : LangChain - Méthodes : self-consistency, contradiction-check, semantic similarity scoring (SBERT, Cosine distance), combinaison de métriques - Stack possible : Python, FastAPI, Streamlit pour les tests, VectorDB (Weaviate). Livrables attendus : - Une étude comparative des méthodes d'estimation de confiance pour les LLM. - Un prototype fonctionnel d'agent capable de produire un score de confiance accompagné d'une visualisation explicite. - Un protocole d'évaluation et un rapport scientifique présentant les résultats. - Des recommandations pour l'intégration de ce module Profil : Vous êtes étudiant(e) en Master 2, école d'ingénieurs ou formation universitaire en intelligence artificielle, data science, NLP ou informatique. Et vous recherchez un stage de 6 mois débutant au printemps 2026. Vous présentez un intérêt marqué pour la recherche appliquée et les modèles de langage (LLM). Vous maîtrisez Python ainsi que la manipulation de modèles de langage et d'embeddings. Vous faites preuve de curiosité scientifique, de rigueur méthodologique et d'un réel goût pour l'expérimentation. Informations : Votre future dream team: Intégré(e) à la Direction de la Recherche et de l'Innovation Technologique (DRIT) de Berger Levrault, vous rejoindrez une équipe innovante qui valorise la curiosité, la collaboration et l'expérimentation. Chercheurs, doctorants, étudiants et ingénieurs collaborent quotidiennement pour concevoir des solutions innovantes et préparer les usages technologiques de demain.



  • Labège, Occitanie, France Berger-Levrault Temps plein

    Informations généralesSTAGE IA / NLP - Gestion d'incertitude et hallucination dans les réponses d'agents IA - F/HLabège,FRANCE Label Pro Vélo - Niveau Argent : nous sommes en selle… vous venez ? (site de Labège)BERGER-LEVRAULT : L'EDITEUR QUI BOULEVERSE L'UNIVERS DES LOGICIELSBerger-Levrault est un éditeur de logiciel international basé en France...


  • Labège, Occitanie, France BERGER-LEVRAULT Temps plein

    Informations généralesSTAGE IA / NPL - Détection et gestion d'incertitude dans les réponses d'agents IA - F/HLabège, FRANCELabel Pro Vélo - Niveau Argent : nous sommes en selle… vous venez ? (site de Labège)BERGER-LEVRAULT : L'EDITEUR QUI BOULEVERSE L'UNIVERS DES LOGICIELSBerger-Levrault est un éditeur de logiciel international basé en France qui...


  • Labège, France Berger Levrault Temps plein

    Sujet : Apprentissage des préférences utilisateur - personnalisation de la stratégie d'agent IA Contexte : Au sein de la Direction de la Recherche et de l'Innovation Technologique (DRIT), le Lab IA explore les nouveaux paradigmes d'intelligence artificielle, et en particulier l'intégration des modèles de langage de grande taille (LLMs) dans des...


  • Labège, France Berger Levrault Temps plein

    Sujet : Extraction automatisée de règles budgétaires vertes à partir de la documentation de l'État par IA Générative Contexte : Face aux enjeux climatiques, l'État français a introduit le concept de « budgets verts », une approche inédite visant à évaluer l'impact environnemental de chaque dépense publique. Mais comment traduire des lignes...


  • Labège, Occitanie, France BERGER-LEVRAULT Temps plein

    Informations généralesSTAGE IA / NPL - Apprentissage des préférences utilisateur - F/HLabège, FRANCELabel Pro Vélo - Niveau Argent : nous sommes en selle… vous venez ? (site de Labège)BERGER-LEVRAULT : L'EDITEUR QUI BOULEVERSE L'UNIVERS DES LOGICIELSBerger-Levrault est un éditeur de logiciel international basé en France qui s'adresse aux...


  • Labège, Occitanie, France BERGER-LEVRAULT Temps plein

    Informations généralesSTAGE Recherche Opérationnelle et IA - F/HLabège, FRANCECARL BERGER-LEVRAULT : 30 ANNEES DE SPECIALISATION EN GMAO ET ASSET MANAGEMENTCARL, marque de Berger-Levrault est un éditeur de logiciel spécialisé dans la gestion de la maintenance industrielle et tertiaire, numéro 1 en France et leader européen.L'entreprise accompagne...


  • Labège, France Thales Temps plein

    STAGE - Ingénieur Gestion des Risques Cybersécurité IA - F/H Lieu : Toulouse Labege, France Construisons ensemble un avenir de confiance Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d’activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui...

  • Alternance Référent Ia

    il y a 2 jours


    Labège, France Skyted Temps plein

    **Skyted**, entreprise pionnière dans la création de solutions de **communication fluides & silencieuses**, repousse les limites de l'innovation pour améliorer la manière dont nous communiquons au quotidien. **Notre mission ?** Proposer aux **"nouveaux nomades"** _(voyageurs en train, avion, taxi)_ et aux professionnels en **open-space ou call...


  • Labège, Occitanie, France Thales Temps plein

    Lieu : Toulouse Labege, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et...


  • Labège, France Cegedim Temps plein

    Fondée en1969, Cegedim est une entreprise innovante de technologies et de servicesspécialisée dans la gestion des flux numériques de l’écosystème santé et BtoB,ainsi que dans la conception de logiciels métiers destinés aux professionnelsde santé et de l’assurance. Cegedim compte plus de 6700 collaborateurs dansplus de 10 pays et a réalisé un...