Apprentissage Par Renforcement Pour Une Ia Agentique Fiable
il y a 5 jours
**Description de l'entreprise**
Trouver des solutions au dérèglement climatique est la priorité du 21ème siècle, et implique de switcher à l’énergie bas-carbone. Chez Assystem, on s’est donc donné pour mission d’accélérer la transition énergétique partout dans le monde. Et pour y parvenir, nos 8000 Switchers couplent leur expertise historique en ingénierie et en management de projet aux technologies digitales.
Présent dans 13 pays (Europe, Moyen-Orient, Asie), nous travaillons sur la production et la distribution d’électricité bas-carbone, à travers le développement des énergies nucléaires et renouvelables. Nous participons également à modernisation des réseaux électriques et l’électrification des usages, à travers l’hydrogène pour décarboner les secteurs des transports et de l’industrie.
**Description du poste**
Nous recherchons un(e) stagiaire pour participer à la mise en place d**’IA agentique**sure et efficace pour des workflows d’ingénierie en contexte réglementé nucléaire. Vous appliquerez **l’apprentissage par renforcement (RL)** - associé à des garde fous solides à une évaluation rigoureuse - pour permettre à un agent LLM de **planifier, d’utiliser les outils et de vérifier les résultats** sur une infrastructure cloud et sur site.
Vous travaillerez main dans la main avec notre référent technique LLM pour appliquer des méthodes de RL de pointe (optimisation des préférences (DPO/IPO), bandits, RL hors ligne) à des cas d’usages concrets à destination des équipes d’ingénierie - tout en répondant aux attentes du secteur en matière de sécurité et de conformité.
Missions principales:
- Construire une **boucle d’agents**(planning appels outils vérification) avec garde-fous.
- Récompenses multi objectifs **multi-objective rewards** prenant en compte également latence, coût..
- Construire un** pipeline**preference/feedback RLHF/RLAIF.
- Explorer différentes méthodes RL **:preference optimization (DPO/IPO)**, bandits;
- ** Sécuriser** le pipeline: règles, provenance tracking, confidence, human-in-the-loop approvals.
- ** Appliquer** à la réalisation d’un **assistant pilote agentique** démontrant un gain de temps sur des cas d’usage réels.
**Pourquoi réaliser votre stage chez Assystem ? On a 3 bonnes raisons pour vous convaincre **
Travailler au sein d’une équipe engagée qui ramène expertise et croissants le matin
Découvrir pourquoi 92% de nos stagiaires apprécient l’ambiance et leur environnement de travail
Gagner en compétences et développer votre expertise métier en échangeant au quotidien avec les collaborateurs Assystem, ainsi que le client en direct pour plus de proximité
**Qualifications** Niveau de formation**:
Étudiant en **BAC+5** (Master, école d’ingénieur ou équivalent).
**Domaine de spécialisation**:
Informatique, Intelligence Artificielle, ou Mathématiques appliquées.
**Compétences techniques**:
- Solide maîtrise de **Python**, avec une expérience sur **PyTorch** (ou **TensorFlow**).
- Intérêt marqué pour l’**apprentissage par renforcement** (_reward design, bandits, policy/preference optimization_).
- Intérêt pour les **LLMs** et les **agents intelligents** ; une expérience avec **LangChain**, **LangGraph** ou outils similaires est un plus.
- Bonne compréhension des **bonnes pratiques de développement** : tests, reproductibilité, suivi des expériences (_experiment tracking_).
- Familiarité avec **Git** et **Docker**.
**Compétences transverses**:
Curiosité, rigueur, autonomie, esprit d’initiative, sens de la collaboration, et **anglais opérationnel**.
**Informations supplémentaires
-
EXPERT IA GÉNÉRATIVE
il y a 1 semaine
Courbevoie, France SOFTEAM Expertise Data & IA Temps pleinÀ propos de l'entreprise SOFTEAM, filiale du Groupe Docaposte et acteur de référence dans la transformation digitale, recherche un Expert en Intelligence Artificielle Générative pour renforcer son Lab IA interne. À propos du rôle Dans un contexte où l'IA redéfinit les modèles économiques, vous aurez l'opportunité de concevoir et déployer des...
-
Expert IA Générative
il y a 1 semaine
Courbevoie, France SOFTEAM Expertise Data & IA Temps pleinUne entreprise de transformation digitale recherche un Expert en Intelligence Artificielle Générative pour rejoindre son Lab IA. Vous concevrez et déploierez des solutions novatrices pour des clients prestigieux du CAC40, tout en mentorant les équipes et en intégrant les dernières avancées en IA. Des compétences en Python, RAG et architectures LLM...
-
Ingénieur Copilot Studio
il y a 1 semaine
Courbevoie, France Collective Temps pleinUne entreprise de technologie recherche un expert pour renforcer son Copilot Agent Center. Vous aurez la responsabilité de déployer des agents IA via Copilot Studio, assurer leur performance et garantir la qualité des livrables. Ce rôle exige une expérience confirmée en automatisation et en conception de solutions IA, ainsi que de bonnes connaissances...
-
Enseignant Chercheur Ia Générative
il y a 2 semaines
Courbevoie, France De Vinci Higher Education Temps pleinAvantages: - RTT - Tickets restaurants - Mutuelle - Plan d'épargne entreprise - Chèques cadeaux - Remboursement des transports à 75% - Formation **Vos missions**: En tant qu’**Enseignant-Chercheur en Intelligence Artificielle Générative**, vous rejoignez le **Département Informatique** de l’ESILV et contribuez aux activités académiques et...
-
Développeur Python IA
il y a 1 semaine
Courbevoie, France VeoNum Temps pleinUne entreprise innovante en informatique recherche un développeur Python motivé pour développer des API backend et travailler sur des solutions d'IA générative. Vous participerez à des projets modernes en cloud AWS et aurez l'opportunité d'évoluer rapidement dans un environnement stimulant. Les candidats doivent posséder de solides bases en Python...
-
Développeur Python
il y a 1 semaine
Courbevoie, France VeoNum Temps pleinDans le cadre du développement d’une plateforme utilisant l’IA générative, nous recherchons un développeur Python motivé, prêt à monter rapidement en compétences et à s’investir sur des technologies modernes. Développer et optimiser des API backend en Python Participer à la conception et l’évolution d’une infrastructure Cloud AWS(S3,...
-
Courbevoie, France TRANSATEL Temps pleinAttention stage uniquement (pas d'alternance possible)Transatel est un fournisseur mondial de solutions de connectivité cellulaire et le 1er agrégateur d’opérateurs mobiles alternatifs MVNO en Europe. Et si vous connectiez le monde, au-delà des frontières ?Contexte et enjeuxL’intelligence artificielle transforme profondément les pratiques en...
-
Courbevoie, France TRANSATEL (an NTT company) Temps pleinStage - Coordination et mise en œuvre d’initiatives IA et Automatisation (H/F)Stage - Coordination et mise en œuvre d’initiatives IA et Automatisation (H/F)Attention stage uniquement (pas d'alternance possible)Transatel est un fournisseur mondial de solutions de connectivité cellulaire et le 1er agrégateur d’opérateurs mobiles alternatifs MVNO en...
-
Data scientist IA gen
il y a 3 jours
Courbevoie, Île-de-France Partenor Temps pleinStarClay recherche un Data Scientist spécialisé en Intelligence Artificielle pour une mission auprès de son client, leader de l'information juridique. La mission s'inscrit dans un contexte de développement et d'industrialisation de solutions d'IA avancées visant à enrichir les contenus et les produits juridiques du client à l'international.Le...
-
Stage - Développement Ia (H/F)
il y a 5 jours
Courbevoie, France Equans Temps plein**Requisition ID**: 51878 **Domain**: Engineering/Data **Contract type**: Internship **Schedule**: EQUANS ambitionne d’être le leader mondial dans un environnement concurrentiel fort en valorisant des savoir-faire techniques et technologiques de pointe toujours plus innovants et performants pour ses clients. L’équipe Intelligence Artificielle du...