Modèles de Diffusion Pour La Robustesse en Machine
il y a 3 jours
**Contexte du stage**:
Au sein de l’Institut de Recherche Technologique SystemX, situé au cœur du campus scientifique d’excellence mondiale de Paris-Saclay, vous prendrez une part active au développement d’un centre de recherche technologique de niveau international dans le domaine de l’ingénierie numérique des systèmes. Adossé aux meilleurs organismes de recherche français du domaine et constitué par des équipes mixtes d’industriels et d’académiques, ce centre a pour mission de générer de nouvelles connaissances et solutions technologiques en s’appuyant sur les percées de l’ingénierie numérique et de diffuser ses compétences dans tous les secteurs économiques.
Vous serez encadré par un ingénieur-chercheur SystemX du domaine Science des données et IA.
Vous travaillerez au sein du projet de recherche exploratoire « GenAI pour l’évaluation et l’amélioration de la généralisation Out-Of-Distribution en ML ».
**Présentation du sujet**:
L’essor spectaculaire de l’IA Générative (IAGen, GenAI en anglais) au cours des dernières années a fait émerger, et rendu primordial, le besoin de comprendre leur fonctionnement afin d’assurer leur industrialisation dans des systèmes critiques à base de Machine Learning (ML). En effet, les plus récents composants à base d’IA sont souvent multi-modèles, multitâches, multimodaux et multifonctions, intègrent des modèles de fondation entraînés sur de grandes bases de données, dont ils héritent la problématique de la généralisation Out-of-Distribution (OOD) d’une part, et les difficultés liées à la gestion des données d’adaptation, dont l’hétérogénéité est intrinsèque, d’une autre part. Or, de récentes corrections méthodologiques d’évaluation ont permis de montrer que des modèles de fondation tels que CLIP n’ont en réalité pas d’avantage de propriété de généralisation OOD par rapport à des modèles plus petits [7]. Ainsi, la maîtrise des deux challenges énoncés est un sujet d’actualité pour les industriels souhaitant intégrer de tels composants dans des systèmes critiques pour se conformer aux réglementations en vigueur.
L’objectif du stage est d’appliquer des méthodes de robustesse OOD via des modèles de diffusion sur une sélection des réseaux de neurones profonds de l’état de l’art, et de démontrer par la suite leur efficacité par rapport aux méthodes classiques dans le cadre d’un cas d’usage industriel.
Ainsi, le stagiaire sera amené à:
- Faire un état de l’art autour de la robustesse OOD le long du cycle de vie d’un modèle M
- Prendre en main l’implémentation des méthodes existantes [5] identifiées dans l’état de l’art en vue de l’implémentation d’un démonstrateur les rassemblant ;
- Contribuer au développement de méthodes d’amélioration de la robustesse OOD via des modèles de diffusion [1, 2, 3, 4].
Références bibliographiques:
- Song et-al, _Score-Based Generative Modelling through Stochastic Differential Equations_, ICLR 2021.
- Nie et-al, _Diffusion Models for Adversarial Purification_, ICML 2022.
- Esser et-al, _Scaling Rectified Flow Transformers for High-Resolution Image Synthesis_, ICML 2024 (Best Paper Award).
- Lynch et-al, _Spawrious:_ _A Benchmark for Fine Control of Spurious Correlation Biases_, 2023
- Liu, J., et-al, _Geometry-Calibrated DRO: Combating Over-Pessimism with Free Energy Implications,_ ICML, 2024.
- Kadkhodaie et-al_, Generalization of Diffusion Models Arise from Geometry-Adaptive Harmonic Representations_, ICLR 2024 (Outstanding Paper Award).
- Mayilvahanan et al, _In Search of Forgotten Domain Generalization,_ ICML 2024.
Profil et compétences
De formation : BAC + 5 / école d’ingénieur ou université master, dans le domaine de Machine Learning et/ou Mathématiques Appliquées.
**Compétences** souhaitées**:
- Python, Pytorch ou Tensorflow
- Maîtrise des modèles ML avancés (U-Nets, Transformers)
- Théorie des probabilités, analyse stochastique
**Aptitudes **personnelles**:
- Motivation et dynamisme
- Esprit d’équipe de recherche
- Force de proposition
**Informations clés**:
**Durée du stage**: 6 mois
**Date de démarrage envisagée** : février 2025
**Localisation du poste**: Palaiseau (91)
Postuler à cette offre d’emploi
**Merci de joindre CV, lettre de motivation et relevé(s) de notes.**
**Domaine**:
- Science des données et IA
-
Palaiseau, France EDF Temps pleinMise en ligne le 2025-09-30 Type de contrat : Stage Niveau de formation : BAC +4 / BAC +5 Spécialité(s) : Ingénierie / Expertise / Recherche Pays / Région : France / Ile-de-France Département : Essonne (91) Ville : 7 Boulevard Gaspard Monge 91120 Palaiseau **Description de l'offre**: Contexte général: La détection précoce des défauts dans les...
-
Test d'indépendance conditionnelle efficace et robuste
il y a 4 jours
Palaiseau, Île-de-France Ecole Polytechnique Temps pleinTest d'indépendance conditionnelle efficace et robuste // Scalable and Robust Conditional Independence TestingRéf ABG-135047ADUM-68476Sujet de Thèse13/01/2026École polytechniqueLieu de travailPalaiseau Cedex - Ile-de-France - FranceIntitulé du sujetTest d'indépendance conditionnelle efficace et robuste // Scalable and Robust Conditional Independence...
-
Palaiseau, France Direction générale de l'Institut Mines-Télécom Temps pleinNous recherchons une enseignante-chercheuse ou un enseignant-chercheur en modèles multimodaux d'IA génératives pour l'audio. Vous rejoindrez le groupe de recherche ADASP/Audio au sein de l'équipe Signal, Statistic and Learning (S2A). Contexte scientifique : Le nombre de défis méthodologiques soulevés par l'application des approches de type IA...
-
Palaiseau, France Direction générale de l'Institut Mines-Télécom Temps pleinTélécom Paris, centre international pluridisciplinaire de formation, recherche et innovation, est une référence dans le monde du numérique. Nous recherchons une enseignante-chercheuse ou un enseignant-chercheur en Codage pour Images et Vidéo. Vous rejoindrez l'équipe Multimédia (MM) au sein du département Image, Données, Signal (IDS). Contexte...
-
Doctorant (F/H) Surveillance Santé Robuste en
il y a 2 semaines
Palaiseau, France Inria Temps plein**Type de contrat **:CDD **Niveau de diplôme exigé **:Bac + 5 ou équivalent **Fonction **:Doctorant **Contexte et atouts du poste**: **Contexte de la thèse**: **Encadrement**: L’étudiant-e sera inscrit à l’Ecole Doctorale MEGA Lyon et en formation doctorale à l’Ecole Centrale de Lyon. **Lieu **:La thèse se déroulera principalement à...
-
Robust Federated Learning
il y a 7 jours
Palaiseau, France CEA Temps pleinDescription du poste **Domaine**: - Systèmes d'information **Contrat**: - Stage **Intitulé de l'offre**: - Robust Federated Learning - Internship H/F **Sujet de stage**: - This internship focuses on the exploration of Multi-Party Computation (MPC) in a Federated Learning setting, particularly under adversarial conditions. The primary aim is to...
-
Test d'indépendance conditionnelle efficace et robuste
il y a 3 jours
Palaiseau, France École polytechnique Temps pleinTopic description Les tests d'indépendance conditionnelle constituent un problème fondamental en statistique et apprentissage automatique, avec des applications allant de la découverte causale à la génétique. Le test consiste à déterminer si deux variables restent dépendantes une fois contrôlées pour une troisième variable de confusion....
-
Ingénieur Data
Il y a 13 minutes
Palaiseau, France CVA IPEC Temps pleinIngénieur Interopérabilité & Jumeaux Numériques - Photovoltaïque Localisation : Palaiseau (91) Contexte & enjeux Dans le cadre du renforcement des capacités de simulation et d'interopérabilité numérique des systèmes photovoltaïques, nous recherchons un(e) Ingénieur(e) spécialisé(e) en modélisation, données et systèmes énergétiques. La...
-
Palaiseau, Île-de-France ECOLE NATIONALE SUPERIEURE DE TECHNIQUES AVANCEES Temps pleinModélisation du comportement en fatigue des composites d'hydrogel architecturés // Modelling of fatigue behaviours of architected hydrogel compositesRéf ABG-135048ADUM-68477Sujet de Thèse13/01/2026Contrat doctoralÉcole nationale supérieure de techniques avancéesLieu de travailPalaiseau - Ile-de-France - FranceIntitulé du sujetModélisation du...
-
Synthèse de Fonds Texturés Par Modèles de
il y a 3 jours
Palaiseau, France ONERA - The French Aerospace Lab Temps plein**Synthèse de fonds texturés par modèles de diffusion**: - Réf **ABG-126241** - Stage master 2 / Ingénieur- Durée 5 mois- Salaire net mensuel 1000- 11/10/2024- ONERA - The French Aerospace Lab- Lieu de travail- palaiseau Ile-de-France France- Champs scientifiques- Mathématiques- 01/01/2025**Établissement recruteur**: **Site web**: L'ONERA (Office...