Test d'indépendance conditionnelle efficace et robuste

il y a 2 heures


Palaiseau, France École polytechnique Temps plein

Topic description Les tests d'indépendance conditionnelle constituent un problème fondamental en statistique et apprentissage automatique, avec des applications allant de la découverte causale à la génétique. Le test consiste à déterminer si deux variables restent dépendantes une fois contrôlées pour une troisième variable de confusion. Cependant, ce problème se heurte à des obstacles théoriques majeurs. Shah \& Peters ont prouvé que sans hypothèses structurelles supplémentaires, aucun test ne peut simultanément contrôler l'erreur de type I et avoir de la puissance contre les alternatives. Les approches récentes contournent cette impossibilité en imposant des hypothèses restrictives: les méthodes basées sur la régularité supposent des distributions lisses, les méthodes Model-X nécessitent la connaissance exacte de distributions conditionnelles, et les tests de permutation échouent en haute dimension. Les méthodes à noyaux offrent une alternative plus flexible via l'opérateur de covariance partielle, dont la norme caractérise l'indépendance conditionnelle. Cette approche est structurellement agnostique: la régularité, la parcimonie ou la faible dimensionalité sont implicitement capturées par les propriétés spectrales de l'opérateur. Cependant, les méthodes à noyaux classiques souffrent de convergence lente et d'une mauvaise extensibilité. Cette thèse propose de revisiter le test d'indépendance conditionnelle à travers la théorie des opérateurs, en développant des méthodes computationnelles modernes qui surmontent les limitations des approches classiques. La recherche combinera l'apprentissage de représentations spectrales avec des garanties statistiques rigoureuses. Sur le plan théorique, nous établirons les distributions asymptotiques sous l'hypothèse nulle, caractériserons la puissance sous les alternatives, et analyserons l'adaptation automatique de nos méthodes à la structure intrinsèque des données. Les algorithmes développés viseront l'extensibilité sur grands ensembles de données via l'adaptativité sans réglage manuel, et seront accompagnés de garanties théoriques vérifiables. L'objectif est d'établir un nouveau paradigme pour le test d'indépendance conditionnelle qui soit simultanément statistiquement rigoureux, computationnellement extensible et structurellement adaptatif.------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------Conditional independence testing is a fundamental problem in statistics and machine learning, with applications ranging from causal discovery to genetics. The task is to determine whether two variables remain dependent after controlling for a third confounding variable. However, this problem faces major theoretical obstacles. Shah \& Peters proved that without additional structural assumptions, no test can simultaneously control type I error and have power against alternatives. Recent approaches circumvent this impossibility by imposing restrictive assumptions: smoothness-based methods assume smooth distributions, Model-X methods require exact knowledge of conditional distributions, and permutation tests fail in high dimensions. Kernel methods offer a more flexible alternative via the partial covariance operator, whose norm characterizes conditional independence. This approach is structurally agnostic: smoothness, sparsity, or low dimensionality are implicitly captured by the operator's spectral properties. However, classical kernel methods suffer from slow convergence and poor scalability. This thesis proposes to revisit conditional independence testing through operator theory, developing modern computational methods that overcome limitations of classical approaches. The research will combine spectral representation learning with rigorous statistical guarantees. Theoretically, we will establish asymptotic null distributions, characterize power under alternatives, and analyze automatic adaptation to intrinsic data structure. The algorithms developed will target scalability to large datasets via adaptivity without manual tuning, and will be accompanied by verifiable theoretical guarantees. The goal is to establish a new paradigm for conditional independence testing that is simultaneously statistically rigorous, computationally scalable, and structurally adaptive.------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------Début de la thèse : 01/10/ Funding category Funding further details Allocation doctorale AMX*Appel anticipé*Associations, fondations, programmes privés étrangers*



  • Palaiseau, Île-de-France Ecole Polytechnique Temps plein

    Test d'indépendance conditionnelle efficace et robuste // Scalable and Robust Conditional Independence TestingRéf ABG-135047ADUM-68476Sujet de Thèse13/01/2026École polytechniqueLieu de travailPalaiseau Cedex - Ile-de-France - FranceIntitulé du sujetTest d'indépendance conditionnelle efficace et robuste // Scalable and Robust Conditional Independence...


  • Palaiseau, France École polytechnique Temps plein

    Topic description Les tests d'indépendance conditionnelle constituent un problème fondamental en statistique et apprentissage automatique, avec des applications allant de la découverte causale à la génétique. Le test consiste à déterminer si deux variables restent dépendantes une fois contrôlées pour une troisième variable de confusion....


  • Palaiseau, France Inria Temps plein

    **Type de contrat **:CDD **Niveau de diplôme exigé **:Bac + 5 ou équivalent **Fonction **:Doctorant **Contexte et atouts du poste**: **Contexte de la thèse**: **Encadrement**: L’étudiant-e sera inscrit à l’Ecole Doctorale MEGA Lyon et en formation doctorale à l’Ecole Centrale de Lyon. **Lieu **:La thèse se déroulera principalement à...


  • Palaiseau, France Adecco Temps plein

    Adecco Tech & Ingénierie est la marque du Groupe Adecco spécialisée dans le recrutement (intérim – CDD – CDI) de profils IT, Ingénierie et Scientifique.Nous recrutons en Intérim pour notre client à Palaiseau un Ingénieur H/F. Poste à pourvoir dès que possible pour une durée de 4 mois .Vos missions :Étendre la norme PVCollada pour y intégrer...

  • Magasinier (H/F)

    il y a 2 semaines


    Palaiseau, France Mavrommatis Temps plein

    **Description offre**: Au sein de notre site de production et rattaché(e) au Gestionnaire des stocks, vos missions seront les suivantes: **Mission** **principale**: Vous assurez la réception, le stockage et les sorties de matières premières, articles de conditionnement et produits finis. Vous êtes en charge de la gestion des mouvements de stocks, de la...


  • Palaiseau, France CEA Temps plein

    Description du poste **Domaine**: - Mathématiques, information scientifique, logiciel **Contrat**: - Stage **Intitulé de l'offre**: - STAGE - Attaques adverses et contre-exemples pour la vérification de réseaux de neurones H/F **Sujet de stage**: - Implémentation d'attaques adverses et contre-exemples pour la vérification de réseaux de...


  • Palaiseau, France École polytechnique Temps plein

    Topic description Le cancer du col de l'utérus demeure un problème de santé majeur, notamment en raison de la difficulté à le détecter de manière précoce et fiable. La procédure conventionnelle de détection des lésions précancéreuses repose sur la colposcopie, qui utilise un colposcope (microscope binoculaire à faible grossissement) permettant...

  • Ingénieur Logiciel C++

    il y a 1 semaine


    Palaiseau, France Cabinet EKINOX Temps plein

    Vous rejoindrez une équipe à taille humaine spécialisée dans le développement de solutions logicielles industrielles à forte valeur ajoutée technique. Ces applications sont utilisées dans des environnements exigeants (production, instrumentation, contrôle-commande, simulation, supervision, ou automatisation). Au sein de l'équipe R&D, vous...


  • Palaiseau, France ONERA - The French Aerospace Lab Temps plein

    Ingénieur en calcul quantique pour écoulements multi-physiques (H/F) L'ONERA, acteur central de la recherche aéronautique et spatiale, emploie plus de 2200 personnes. Placé sous la tutelle du Ministère des Armées, il dispose d'un budget de 336 millions d'euros (2024), dont plus de la moitié provient de contrats d'études, de recherche et d'essais....

  • Stage R&D

    il y a 3 heures


    Palaiseau, Île-de-France Visionairy Temps plein

    ContexteNous développons des solutions de vision industrielle basées sur l'intelligence artificielle pour automatiser le contrôle qualité chez des industriels (production 24/7, environnements contraints, exigences élevées de fiabilité).Un des freins majeurs au déploiement de modèles robustes est lemanque de données de défauts, en particulier pour...