Stage 2026 - IA - Nlp - Apprentissage des Préférences Utilisateur Mémoire H/F
il y a 1 jour
Sujet : Apprentissage des préférences utilisateur - personnalisation de la stratégie d'agent IA Contexte : Au sein de la Direction de la Recherche et de l'Innovation Technologique (DRIT), le Lab IA explore les nouveaux paradigmes d'intelligence artificielle, et en particulier l'intégration des modèles de langage de grande taille (LLMs) dans des systèmes multi-agents intelligents. L'un des défis de ces systèmes d'agents IA modernes est de pouvoir s'adapter à leurs utilisateurs : niveau de technicité attendu, style de communication, granularité des explications, ou encore préférences dans la façon d'exécuter des tâches. Le stage s'inscrit dans une démarche de R&D exploratoire, visant à concevoir et expérimenter un mécanisme d'apprentissage et de personnalisation adaptative permettant à un agent IA de moduler ses réponses et stratégies en fonction du profil et du comportement de chaque utilisateur. Ce travail s'intègre dans le cadre du projet Athena, une plateforme d'agents IA développée par Berger-Levrault, visant à créer des assistants capables de raisonner, collaborer et s'adapter de manière autonome Missions : - Étudier les approches existantes de personnalisation d'agents IA : apprentissage implicite/explicite des préférences, reinforcement learning from user feedback (RLHF/RLAIF), retrieval personalization, contextual prompt tuning, profilage dynamique. - Concevoir une architecture d'agent capable de : - observer et enregistrer les interactions utilisateur (préférences, styles, contextes d'usage), - apprendre à inférer les préférences implicites (ton, niveau d'explication, format de réponse, etc.), - adapter dynamiquement sa stratégie d'orchestration, son prompting ou son contenu généré. - Prototyper un système d'apprentissage continu des préférences, connecté à la plateforme d'agents IA Athena. - Définir des métriques de satisfaction et de pertinence personnalisée, et mettre en place un protocole expérimental d'évaluation. Approches et technologies envisagées : - Techniques de personnalisation :- Profilage utilisateur dynamique (embedding comportemental, clustering sémantique) - Contextual Prompt Adaptation - Few-shot personalization (mémoire courte + profil long terme) - Reinforcement Learning from User Feedback (RLHF / RLAIF simplifié) - Stack technique :- Python, LangChain - Vector store pour stockage de préférences (Weaviate) - Streamlit / React pour le tableau de bord de suivi utilisateur - LLMs : Mistral Livrables attendus : - État de l'art sur les approches de personnalisation d'agents IA et apprentissage des préférences - Prototype d'un agent capable d'adapter son comportement à chaque utilisateur - Mécanisme de suivi et de visualisation de la personnalisation - Rapport sur la performance du modèle d'adaptation et les gains observés Profil : Vous êtes étudiant(e) en Master 2, en école d'ingénieurs ou en formation universitaire en intelligence artificielle, data science, NLP ou informatique. Et vous recherchez un stage de 6 mois débutant au printemps 2026. Vous démontrez un intérêt marqué pour la recherche appliquée et les LLMs. Vous possédez de bonnes compétences en Python ainsi qu'en manipulation de modèles de langage et d'embeddings. Vous faites preuve de curiosité scientifique, de rigueur méthodologique et d'un réel goût pour l'expérimentation. Informations : Votre future dream team: Intégré(e) à la Direction de la Recherche et de l'Innovation Technologique (DRIT) de Berger Levrault, vous rejoindrez une équipe innovante qui valorise la curiosité, la collaboration et l'expérimentation. Chercheurs, doctorants, étudiants et ingénieurs collaborent quotidiennement pour concevoir des solutions innovantes et préparer les usages technologiques de demain.
-
Labège, Occitanie, France BERGER-LEVRAULT Temps pleinInformations généralesSTAGE IA / NPL - Apprentissage des préférences utilisateur - F/HLabège, FRANCELabel Pro Vélo - Niveau Argent : nous sommes en selle… vous venez ? (site de Labège)BERGER-LEVRAULT : L'EDITEUR QUI BOULEVERSE L'UNIVERS DES LOGICIELSBerger-Levrault est un éditeur de logiciel international basé en France qui s'adresse aux...
-
Labège, France Berger Levrault Temps pleinSujet : Extraction automatisée de règles budgétaires vertes à partir de la documentation de l'État par IA Générative Contexte : Face aux enjeux climatiques, l'État français a introduit le concept de « budgets verts », une approche inédite visant à évaluer l'impact environnemental de chaque dépense publique. Mais comment traduire des lignes...
-
Labège, France Berger Levrault Temps pleinSujet : Détection et gestion d'incertitude dans les réponses d'agents IA Contexte : Au sein de la Direction de la Recherche et de l'Innovation Technologique (DRIT), le Lab IA explore les nouveaux paradigmes d'intelligence artificielle, et en particulier l'intégration des modèles de langage de grande taille (LLM) dans des systèmes multi-agents...
-
Labège, Occitanie, France Berger-Levrault Temps pleinInformations généralesSTAGE IA / NLP - Gestion d'incertitude et hallucination dans les réponses d'agents IA - F/HLabège,FRANCE Label Pro Vélo - Niveau Argent : nous sommes en selle… vous venez ? (site de Labège)BERGER-LEVRAULT : L'EDITEUR QUI BOULEVERSE L'UNIVERS DES LOGICIELSBerger-Levrault est un éditeur de logiciel international basé en France...
-
Labège, Occitanie, France BERGER-LEVRAULT Temps pleinInformations généralesSTAGE IA / NPL - Détection et gestion d'incertitude dans les réponses d'agents IA - F/HLabège, FRANCELabel Pro Vélo - Niveau Argent : nous sommes en selle… vous venez ? (site de Labège)BERGER-LEVRAULT : L'EDITEUR QUI BOULEVERSE L'UNIVERS DES LOGICIELSBerger-Levrault est un éditeur de logiciel international basé en France qui...
-
STAGE 2026 - Recherche Opérationnelle et IA - F/H
il y a 2 semaines
Labège, Occitanie, France BERGER-LEVRAULT Temps pleinInformations généralesSTAGE Recherche Opérationnelle et IA - F/HLabège, FRANCECARL BERGER-LEVRAULT : 30 ANNEES DE SPECIALISATION EN GMAO ET ASSET MANAGEMENTCARL, marque de Berger-Levrault est un éditeur de logiciel spécialisé dans la gestion de la maintenance industrielle et tertiaire, numéro 1 en France et leader européen.L'entreprise accompagne...
-
STAGE - Ingénieur Gestion des Risques Cybersécurité IA - F/H
il y a 2 semaines
Labège, France Thales Temps pleinSTAGE - Ingénieur Gestion des Risques Cybersécurité IA - F/H Lieu : Toulouse Labege, France Construisons ensemble un avenir de confiance Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d’activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui...
-
Alternance Référent Ia
il y a 2 jours
Labège, France Skyted Temps plein**Skyted**, entreprise pionnière dans la création de solutions de **communication fluides & silencieuses**, repousse les limites de l'innovation pour améliorer la manière dont nous communiquons au quotidien. **Notre mission ?** Proposer aux **"nouveaux nomades"** _(voyageurs en train, avion, taxi)_ et aux professionnels en **open-space ou call...
-
Labège, Occitanie, France Thales Temps pleinLieu : Toulouse Labege, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et...
-
STAGE Ingénieur(e) Matériaux
il y a 2 semaines
Labège, Occitanie, France CEA Temps pleinInformations générales Entité de rattachement Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un...