Stage - Système D’évaluation Dynamique Pour Agent Llm

il y a 2 semaines


Toulouse, France Toloxa Temps plein

À propos

Toloxa est une start-up toulousaine qui bâtit un assistant de diagnostic et réparation pour systèmes électroniques/mécaniques, fondé sur une **architecture multi-agent** pilotée par des **LLM** (recherche d’information, diagnostic, analyse de causes, guidage pas-à-pas). Notre pipeline **speech-to-speech** (STT → agents → TTS) rend l’interaction fluide et naturelle.
Le stage est **co-encadré** par **ANITI** et l’**IRT Saint-Exupéry**, au sein du programme **FOR** (IA de confiance), avec accès à un écosystème académique et industriel de premier plan.

Mission

Concevoir un **système d’évaluation dynamique** qui choisit automatiquement le **meilleur modèle de langage** et les **bons réglages** pour chaque rôle de notre plateforme multi-agent (router, extractor, planner, critic, etc.). Objectif : optimiser **qualité**, **robustesse**, **latence** et **coût**.

Ce que vous ferez
- Construire des **datasets de validation** par agent (cas réels + données synthétiques).
- Définir des **métriques objectives** : qualité, robustesse, stabilité inter-runs, latence, coûts.
- Développer un **banc d’évaluation multi-modèles** (batchs complets, intégration **OpenRouter**/APIs LLM).
- Implémenter des **stratégies de sélection** : règles, scoring multi-critères, routage budget/latence, bandits/contextuels.
- Expérimenter **prompting** par rôle et **hyperparamètres** (température, top-p, longueur max ).
- Créer des **dashboards** et **rapports** pour suivre la performance et guider les choix de modèles.
- (Selon résultats) **Valorisation scientifique** : revue de littérature, rédaction/soumission de papier (workshop/conférence/journal) avec ANITI & IRT.

Profil recherché

Dernière année d’école d’ingénieur ou **Master 2** (IA/NLP/ML/Software), autonome, rigoureux-se, curieux-se, à l’aise pour structurer des expériences et analyser des résultats.

Compétences appréciées
- **Python** & bibliothèques IA/LLM (numpy, pydantic, Hugging Face ).
- **LLM & évaluation** : prompting, réglages de génération, jeux de validation, métriques.
- **APIs LLM / OpenRouter** : intégration multi-fournisseurs, parallélisation, robustesse/quotas.
- **Systèmes multi-agent** : compréhension des rôles et de leurs interactions.
- **RAG (bonus)** : embeddings, retrieval-augmented generation.
- **Veille/bibliographie scientifique** et synthèse.
- **LaTeX** pour rapports techniques.
- **Collaboration** : Git/GitHub (branches, PR, commits clairs).
- **Soft skills** : esprit d’analyse, communication, autonomie, sens produit.

Pourquoi nous rejoindre ?
- Impact direct sur un **produit** en construction (pas un POC oublié).
- **Co-encadrement** ANITI & IRT Saint-Exupéry, immersion dans l’écosystème toulousain (programme FOR).
- Cadre **startup** : ownership fort, itération rapide, idées mises en production.
- Télétravail partiel, horaires flexibles, **montée en compétences** accélérée.
- Possibilité de **publications** et de **mise en open-source** partielle (si pertinent).

Modalités
- **Lieu** : ANITI - B612, Toulouse (télétravail partiel possible).
- **Temps de travail** : 35h/semaine.
- **Encadrement** : Toloxa + ANITI + IRT Saint-Exupéry.

Candidature

**Objet**: _Candidature - Stage PFE Projet Pulse (Évaluation dynamique LLM)_
Décrivez en quelques lignes un projet technique dont vous êtes fier-e et votre motivation pour le sujet.

Type d'emploi : Stage
Durée du contrat : 6 mois

Rémunération : 561,00€ à 1 200,00€ par mois

Avantages:

- Flextime
- Travail à domicile occasionnel

Formation:

- Bac +4 (Maîtrise) (Requis)

Lieu du poste : Télétravail hybride (31400 Toulouse)



  • Toulouse, Occitanie, France Toloxa Temps plein

    Toloxa est une jeune start-up toulousaine qui développe un assistant intelligent capable de diagnostiquer et réparer des appareils électroniques et mécaniques grâce à une architecture multi-agent avancée basée sur des modèles de langage. Notre vision : rendre la résolution de pannes aussi simple qu'une conversation, qu'il s'agisse d'un ordinateur,...


  • Toulouse, France Thales Group Temps plein

    Lieu : Toulouse, France## **Construisons ensemble un avenir de confiance**Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d’activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l’environnement...


  • Toulouse, France Sopra Steria Temps plein

    Description de l'entreprise CS, filiale du groupe Sopra Steria, est un acteur technologique de référence dans la conception, l’intégration et l’exploitation de systèmes critiques. Présents dans 7 pays avec plus de 2 600 collaborateurs passionnés, nous intervenons au cœur des enjeux de souveraineté, de sécurité et de performance, dans des...


  • Toulouse, France Liebherr-Aerospace Toulouse SAS Temps plein

    Stage de 5 à 6 mois **Présentation du service** Au sein de la Direction Technique et Programme, dans le département Développement des Equipements Internes, le service Machine Tournante est responsable du développement des turbomachines (composants clés de nos systèmes) dans laquelle on retrouve des étages compresseur, turbine ou ventilateur,...

  • Ingénieur·e IA

    il y a 1 jour


    Toulouse, France CELAD Temps plein

    A LIRE ATTENTIVEMENT AVANT DE POSTULER 2 jours de télétravail / semaine - Toulouse - Expérience de 3 ans minimum Envie de rejoindre une équipe où la tech et les projets stimulants sont au rendez-vous ? Cette opportunité est faite pour vous ! Nous poursuivons notre développement et recherchons actuellement un.e Ingénieur·e IA - plateformes agentiques...


  • Toulouse, France CELAD-Toulouse Temps plein

    Bienvenue chez CELAD - L'ingénierie à visage humain Depuis 1990, CELAD accompagne la transformation digitale des entreprises, en conjuguant innovation technologique et proximité humaine. D'abord ancrés dans le monde bancaire, nous sommes aujourd'hui une ESN de référence dans les Systèmes d'Information et l'Informatique Industrielle, forte de plus de...


  • Toulouse, France Centre national d'études spatiales Temps plein

    ## Ingénieur.e modélisation et simulation de dynamique du vol / systèmes spatiaux* Internship, 4-6 months* Full-time * Experience: no preference* MBA* Ingénierie LogicielleCe stage vous permettra d'acquérir des connaissances en **mécanique spatiale**, en **simulation système** et de découvrir la façon dont sont **testés** et **validés** les...

  • Ingénieur·e IA

    il y a 1 jour


    Toulouse, France CELAD Temps plein

    Description du poste A LIRE ATTENTIVEMENT AVANT DE POSTULER 2 jours de télétravail / semaine - Toulouse - Expérience de 3 ans minimum Envie de rejoindre une équipe où la tech et les projets stimulants sont au rendez-vous ? Cette opportunité est faite pour vous ! Nous poursuivons notre développement et recherchons actuellement un.e Ingénieur·e IA -...


  • Toulouse, France CAPGEMINI FRANCE Temps plein

    Développeuse/Développeur Python – Stage H/F (Stage) CAPGEMINI FRANCE•Toulouse, Haute-Garonne, France Description de poste Le poste pouvant nécessiter d'accéder à des informations relevant du secret de la défense nationale, la personne retenue pourra faire l'objet d'une procédure d'habilitation, conformément aux dispositions des articles R.2311-1...

  • Ingénierie Logicielle

    il y a 1 semaine


    Toulouse, France Centre national d'études spatiales Temps plein

    "Quelle est la date de la prochaine Eclipse de Lune?", "Génère avec Blender un terrain martien réalisteavec 2500 rochers", … Voilà deux exemples de ce que l’on pourrait demander à SIDONIE (le «ChatGPT like»du CNES, basé sur des LLM Open Source) si celle-ci était couplée à des outils d’manique spatiale ou de modélisation3D. Eh bien, c’est...