Stage - Modélisation de l'espace latent pour les modèles de Deep Learning utilisés en segmentation d'instances H/F

il y a 9 heures


Trappes, Île-de-France LNE Temps plein

Contexte
Des travaux de recherche sont menés depuis plusieurs années au sein du département Science des Données et Incertitudes sur l'évaluation des incertitudes associées aux prédictions des algorithmes d'apprentissage. Une thèse portant sur deux sources d'incertitude (incertitude prédictive induite par l'incertitude des entrées [Monchot et
al
., 2023] et incertitude dite de répétabilité correspondant à l'incertitude liée au réentraînement du même réseau) a été soutenue fin 2023.

À présent, nos efforts se portent sur l'incertitude du jeu de données d'entraînement et plus spécifiquement l'incertitude d'échantillonnage afin de cadrer notamment le domaine de validité des modèles d'apprentissage profond. Dans la littérature scientifique actuelle, le recours à la géométrie différentielle pour représenter les données et l'utilisation de modèles génératifs (VAEs, GANs, modèles de Diffusion, modèles basés sur les flux, etc.) sont prédominants. À titre d'exemple, Chadebec et Allassonnière [2022] proposent un échantillonnage par HMC (Hamiltonian Monte Carlo) de la distribution uniforme dérivée intrinsèquement de l'espace latent riemannien appris par un VAE comme nouvelle approche d'augmentation de données. Les travaux de Wu et Pan [2025], quant à eux, suggèrent d'utiliser un modèle de mélange Gaussien comme prior dans l'espace latent du VAE. Ces contributions récentes témoignent de l'importance de repenser la modélisation latente comme un espace structuré, où la géométrie peut jouer un rôle central dans la définition du domaine de validité et la quantification de l'incertitude d'échantillonnage notamment.

Pour se faire, le(a) stagiaire identifiera les approches les plus pertinentes de l'état de l'art pour modéliser l'espace de représentation latent et implémentera les méthodes sélectionnées afin de réaliser une première comparaison numérique. L'application industrielle attachée à ces développements est la segmentation d'instances de particules à partir de mesures en microscopie électronique à balayage.

Missions
Intégré(e) Au Sein Du Département Science Des Données Et Incertitudes, Les Développements à Réaliser Au Cours De Ce Stage S'articulent De La Manière Suivante

  • Étude bibliographique des méthodes à l'état de l'art pour modéliser l'espace de représentation latent des données d'entraînement adaptée aux tâches de segmentation d'instances
  • Sélection et implémentation des différentes méthodes
  • Génération de nouveaux échantillons à partir des différentes approches et évaluation de la robustesse des modèles de segmentation d'instances utilisés en interne
  • Rédiger un rapport scientifique synthétisant vos résultats
  • Fournir les codes Python développés

Profil
Étudiant(e) en M2 ou en dernière année d'école d'ingénieur, spécialisé(e) en mathématiques ou statistiques appliquées.

Doté(e) d'une forte curiosité scientifique et d'un goût pour le travail en équipe, vous souhaitez mettre en œuvre et enrichir vos compétences en apprentissage automatique.

La maîtrise du langage de programmation Python est essentielle et la connaissance de PyTorch et des librairies couramment utilisées dans le domaine du Deep Learning est évidemment souhaitée.

Ce stage pourra donner lieu à une thèse.
Gratification
1280 € brut/mois pour une formation Bac +5.

Références
[1] Monchot, P., Coquelin, L., Petit, S. J., Marmin, S., Le Pennec, E., & Fischer, N Input uncertainty propagation through trained neural networks. In International Conference on Machine Learning 2023.

[2] Chadebec, C., & Allassonnière, S A geometric perspective on variational autoencoders. Advances in neural information processing systems, 35,

[3] Wu, P., & Pan, L Deep unsupervised clustering by information maximization on Gaussian mixture autoencoders. Information Sciences,



  • Trappes, Île-de-France LNE Temps plein

    Contexte Les nanomatériaux s'imposent aujourd'hui dans de multiples secteurs d'activités et le cadre réglementaire a été adapté pour prendre en compte leurs spécificités. La première difficulté consiste à identifier le classement comme nanomatériau d'une substance à l'état particulaire en fonction des différentes définitions existantes au...


  • Trappes, Île-de-France LNE Temps plein

    ContexteCe stage s'inscrit dans le cadre d'un projet de recherche en métrologie française visant à maintenir et à développer les étalons de puissance au sein du Laboratoire National de Métrologie et d'Essais (LNE) pour la bande de fréquence 50 GHz à 75 GHz. Ce projet s'inscrit également dans le cadre européen, en lien avec le projet RF Key...


  • Trappes, Île-de-France Communauté d'agglomération de Saint-Quentin-en-Yvelines Temps plein

    Au sein du service Nature en ville développant des compétences techniques et innovantes en espaces verts mobilier urbain, vous serez rattaché(e) au technicien chargé du secteur géographique de Elancourt, Maurepas, Coignières et La Verrière. Vous serez le garant de la bonne exécution des travaux d'entretien et de maintenance des 140 ha d'espaces verts...


  • Trappes, Île-de-France LNE Temps plein

    ContexteDepuis plusieurs années, le LNE développe une plateforme (CARMEN) regroupant plusieurs instruments dédiés à la métrologie des nanomatériaux. L'objectif est de caractériser diverses propriétés physico-chimiques de nanoobjets : taille, forme, composition chimique, structure cristallographique, surface spécifique, état...


  • Trappes, Île-de-France LNE Temps plein

    ContexteDepuis plusieurs années, le LNE développe une plateforme (CARMEN) regroupant plusieurs instruments dédiés à la métrologie des nanomatériaux. L'objectif est de caractériser diverses propriétés physico-chimiques de nanoobjets : taille, forme, composition chimique, structure cristallographique, surface spécifique, état...


  • Trappes, Île-de-France Cap Vert Temps plein

    Depuis Plusieurs Années, Le Groupe CAP VERT Façonne Et Préserve Les Espaces Extérieurs, Alliant Innovation, Expertise Et Engagement Écologique. Leader Dans La Gestion Des Espaces Verts, Nous Avons Construit Notre Réputation Autour De Trois Pôles D'excellenceSoins des arbres : protéger et valoriser le patrimoine arboré pour une biodiversité...


  • Trappes, Île-de-France Golf Bluegreen de Saint-Quentin-en-Yvelines Temps plein

    Le golf BLUEGREEN de Saint-Quentin-en-Yvelines (78) est à la recherche d'un Jardinier de Golf (H/F) dans le cadre d'un CDI pour intégrer son équipe.VOS MISSIONS : Rattaché au Grennkeeper, vos missions seront :Entretien du parcours : tontes roughs/fairways/départs/greens, ratissage des bunkers, travaux spécifiques Entretien des espaces verts : abords du...


  • Trappes, Île-de-France Communauté d'agglomération de Saint-Quentin-en-Yvelines Temps plein

    Avec 150 carrefours de feux tricolores répartis sur les 12 communes, SQY intervient sur des questions toujours plus innovantes liées à la gestion de trafic et aux services aux usagers.Rattaché(e) et accompagné(e) par la responsable du service éclairage, énergie et télécom, au sein d'une équipe de 8 personnes, vous garantissez la pérennité du...


  • Trappes, Île-de-France Segula Technologies Temps plein

    Description de l'entreprise Explorez de nouveaux horizons au sein d'un groupe d'ingénierie mondiale à forte croissance. Chez SEGULA Technologies, vous aurez l'opportunité de travailler sur des projets passionnants et de façonner l'avenir au sein d'une entreprise pour qui l'innovation est indissociable de l'ingénierie. Nouvelles mobilités, véhicules...


  • Trappes, Île-de-France Communauté d'Agglomération de Saint-Quentin-en-Yvelines Temps plein

    À propos de nous12 communes, 1 agglomération. Deuxième pôle économique de l'Ouest Parisien, à 30 minutes de Paris, Saint-Quentin-en-Yvelines représente habitants, entreprises, et regroupe 25% des emplois des Yvelines. Ses 670 agents imaginent, bâtissent et aménagent chaque jour un cadre de vie équilibré et solidaire.MissionAvec 150 carrefours de...