Test d'indépendance conditionnelle efficace et robuste
il y a 2 semaines
Réf ABG-135047
ADUM-68476
Sujet de Thèse
13/01/2026
École polytechnique
Lieu de travail
Palaiseau Cedex - Ile-de-France - France
Intitulé du sujet
Test d'indépendance conditionnelle efficace et robuste // Scalable and Robust Conditional Independence Testing
Champs scientifiques
- Mathématiques
Mots clés
Test d'indépendance conditionnelle, Apprentissage de Représentation, Causalité
Conditional Independence Testing, Representation Learning, Causality
Les tests d'indépendance conditionnelle constituent un problème fondamental en statistique et apprentissage automatique, avec des applications allant de la découverte causale à la génétique. Le test consiste à déterminer si deux variables restent dépendantes une fois contrôlées pour une troisième variable de confusion.
Cependant, ce problème se heurte à des obstacles théoriques majeurs. Shah \& Peters ont prouvé que sans hypothèses structurelles supplémentaires, aucun test ne peut simultanément contrôler l'erreur de type I et avoir de la puissance contre les alternatives. Les approches récentes contournent cette impossibilité en imposant des hypothèses restrictives: les méthodes basées sur la régularité supposent des distributions lisses, les méthodes Model-X nécessitent la connaissance exacte de distributions conditionnelles, et les tests de permutation échouent en haute dimension.
Les méthodes à noyaux offrent une alternative plus flexible via l'opérateur de covariance partielle, dont la norme caractérise l'indépendance conditionnelle. Cette approche est structurellement agnostique: la régularité, la parcimonie ou la faible dimensionalité sont implicitement capturées par les propriétés spectrales de l'opérateur. Cependant, les méthodes à noyaux classiques souffrent de convergence lente et d'une mauvaise extensibilité.
Cette thèse propose de revisiter le test d'indépendance conditionnelle à travers la théorie des opérateurs, en développant des méthodes computationnelles modernes qui surmontent les limitations des approches classiques. La recherche combinera l'apprentissage de représentations spectrales avec des garanties statistiques rigoureuses. Sur le plan théorique, nous établirons les distributions asymptotiques sous l'hypothèse nulle, caractériserons la puissance sous les alternatives, et analyserons l'adaptation automatique de nos méthodes à la structure intrinsèque des données.
Les algorithmes développés viseront l'extensibilité sur grands ensembles de données via l'adaptativité sans réglage manuel, et seront accompagnés de garanties théoriques vérifiables. L'objectif est d'établir un nouveau paradigme pour le test d'indépendance conditionnelle qui soit simultanément statistiquement rigoureux, computationnellement extensible et structurellement adaptatif.Conditional independence testing is a fundamental problem in statistics and machine learning, with applications ranging from causal discovery to genetics. The task is to determine whether two variables remain dependent after controlling for a third confounding variable.
However, this problem faces major theoretical obstacles. Shah \& Peters proved that without additional structural assumptions, no test can simultaneously control type I error and have power against alternatives. Recent approaches circumvent this impossibility by imposing restrictive assumptions: smoothness-based methods assume smooth distributions, Model-X methods require exact knowledge of conditional distributions, and permutation tests fail in high dimensions.
Kernel methods offer a more flexible alternative via the partial covariance operator, whose norm characterizes conditional independence. This approach is structurally agnostic: smoothness, sparsity, or low dimensionality are implicitly captured by the operator's spectral properties. However, classical kernel methods suffer from slow convergence and poor scalability.
This thesis proposes to revisit conditional independence testing through operator theory, developing modern computational methods that overcome limitations of classical approaches. The research will combine spectral representation learning with rigorous statistical guarantees. Theoretically, we will establish asymptotic null distributions, characterize power under alternatives, and analyze automatic adaptation to intrinsic data structure.
The algorithms developed will target scalability to large datasets via adaptivity without manual tuning, and will be accompanied by verifiable theoretical guarantees. The goal is to establish a new paradigm for conditional independence testing that is simultaneously statistically rigorous, computationally scalable, and structurally adaptive.Début de la thèse : 01/10/2026
Nature du financementPrécisions sur le financement
Allocation doctorale AMX*Appel anticipé*Associations, fondations, programmes privés étrangers*
Présentation établissement et labo d'accueilÉcole polytechnique
Etablissement délivrant le doctoratÉcole polytechnique
Ecole doctorale574 Mathématiques Hadamard
Profil du candidatCandidat issu d'un Master 2 en Mathématiques Appliquées dans le domaine des Statistiques, du Machine Learning et de l'Intelligence Artificielle; competences en PyTorch recommandées
Candidate with a Master's degree (M2) in Applied Mathematics specializing in Statistics, Machine Learning, and Artificial Intelligence; Experience with PyTorch is recommended.
Date limite de candidature
15/03/2026
-
Testeur logiciel manuel
il y a 7 jours
Palaiseau, Île-de-France Cabinet EKINOX Temps pleinActeur historique et en forte croissance, notre client évolue depuis près de 40 ans dans le domainede l'informatique industrielle, scientifique et technique.Fort d'un portefeuille de près de 1 000 clients, dont la majorité des entreprises du CAC 40, il est reconnu pourson expertise, sa fiabilité et sa position de leader sur son marchéPOSTE / MISSIONSAu...
-
Technicien QA Logiciel H/F
il y a 1 semaine
Palaiseau, Île-de-France EXOSENS Temps pleinExosens est un groupe international de haute technologie, leader des solutions d'amplification, de détection et d'imagerie de précision pour les marchés de la défense, du spatial, des sciences, du nucléaire et de l'industrie.Portés par une forte croissance et une présence mondiale, nous recherchons un(e) Technicien(ne) QA Logiciel - Test & Validation...
-
Palaiseau, Île-de-France TotalEnergies Temps plein*Contexte et environnement*La conception électrique des grandes centrales photovoltaïques est un enjeu clé pour optimiser la performance, la fiabilité et le coût des installations solaires. Aujourd'hui, les outils de simulation internes (comme SolarOPS) sont performants pour la modélisation optique, mais limités pour la génération automatique de...
-
Stagiaire Développement Interface
il y a 1 semaine
Palaiseau, Île-de-France Advanced Care Technologies Temps pleinFiche de poste - Stagiaire Développement Interface / Système Embarqué(Advanced Care Technologies - ACT) Advanced Care Technologies est une start-up innovante spécialisée dans les technologies médicales visant à redonner des sensations aux personnes amputées. Nous développons un dispositif médical de stimulation sensorielle qui s'intègre au plus...
-
Stage R&D
il y a 1 semaine
Palaiseau, Île-de-France Visionairy Temps pleinContexteNous développons des solutions de vision industrielle basées sur l'intelligence artificielle pour automatiser le contrôle qualité chez des industriels (production 24/7, environnements contraints, exigences élevées de fiabilité).Un des freins majeurs au déploiement de modèles robustes est lemanque de données de défauts, en particulier pour...
-
technicien en electronique h/f
il y a 4 jours
Palaiseau, Île-de-France LYNRED Temps pleinIntitulé du posteTECHNICIEN EN ELECTRONIQUE H/FDescription entrepriseLynred recrute pour sa filiale New Imaging Technologies (NIT), PME francilienne, située à Verrières le Buisson (91).L'entreprise développe et fabrique des capteurs et caméras à infrarouges dans le domaine du SWIR et pour des applications industrielles, scientifiques, spatiales &...
-
Ingénieur en calcul quantique pour écoulements multi-physiques
il y a 3 heures
Palaiseau, Île-de-France ONERA - The French Aerospace Lab Temps pleinL'ONERA, acteur central de la recherche aéronautique et spatiale, emploie plus de 2200 personnes. Placé sous la tutelle du Ministère des Armées, il dispose d'un budget de 336 millions d'euros (2024), dont plus de la moitié provient de contrats d'études, de recherche et d'essais. Expert étatique, l'ONERA prépare la défense de demain, répond aux...
-
Développeur Senior C/C++ Linux Embarqué H/F
il y a 1 semaine
Palaiseau, Île-de-France EXOSENS Temps pleinExosens est un groupe international de haute technologie, leader des solutions d'amplification, de détection et d'imagerie de précision pour les marchés de la défense, du spatial, des sciences, du nucléaire et de l'industrie.Portés par une forte croissance et une présence mondiale, nous recherchons un(e) Développeur(euse) Senior C/C++ Linux Embarqué...
-
Développeur Senior C/C++ Linux Embarqué H/F
il y a 3 jours
Palaiseau, Île-de-France Exosens Temps pleinExosens est ungroupe international avecplus de 85 ans d'expérience dans l'innovation, le développement, la fabrication et la vente de technologies dans le domaine de la détection, de la photo-détection et de l'imagerie.Notre mission est de fournir des solutions innovantes pour permettre des avancées technologiques au service d'un monde plus sûr.Nous...
-
Palaiseau, Île-de-France ONERA - The French Aerospace Lab Temps pleinL'ONERA, acteur central de la recherche aéronautique et spatiale, emploie plus de 2200 personnes. Placé sous la tutelle du Ministère des Armées, il dispose d'un budget de 336 millions d'euros (2024), dont plus de la moitié provient de contrats d'études, de recherche et d'essais. Expert étatique, l'ONERA prépare la défense de demain, répond aux...