Offre de stage – Projet de stage de recherche M2
il y a 6 jours
Exploration causale et explicabilité des relations entre variables dans les Bilans Carbone : vers une compréhension fine et vérifiable des émissions organisationnelles.
Qui sommes-nous ?
Le Laboratoire d'Informatique de Paris 6 (LIP6 – Sorbonne Université) est une unité de recherche de référence en intelligence artificielle explicable et en modélisation probabiliste. En partenariat avec l'Association pour la Transition Bas Carbone (ABC), structure pionnière du Bilan Carbone en France, nous développons des outils scientifiques et opérationnels pour accompagner les organisations dans leur transition bas carbone.
Contexte scientifique et opérationnel
Le
Bilan Carbone
est une méthode de comptabilité
des gaz à effet de serre (GES)
développée en France depuis 2004 pour aider les organisations à évaluer et à réduire leurs émissions. Chaque source d'émission repose sur une
donnée d'activité (DA)
et un
facteur d'émission (FE),
dont la précision et la disponibilité dépendent du contexte sectoriel et de la qualité des données collectées. Cette variabilité entraîne une forte hétérogénéité dans la qualité des bilans réalisés. Pour y remédier,
l'Association pour la transition Bas Carbone (ABC)
a constitué une
base de données nationale (OCCF)
regroupant des Bilans Carbone et Bilans GES réglementaires. Cette base constitue une ressource unique pour étudier la structure, la cohérence et les déterminants des émissions des organisations françaises.
Des travaux exploratoires menés au LIP6 (Sorbonne Université)
ont permis de produire des statistiques descriptives et d'identifier des dépendances statistiques entre variables. Ce stage propose d'approfondir cette analyse en mobilisant les approches de causalité, d'explicabilité et de
raisonnement bayésien
afin de mieux comprendre les mécanismes sous-jacents à la production et à la variabilité des Bilans Carbone.
Cadre théorique
Causalité et inférence structurelle
Les approches causales, initiées par
Judea Pearl
et développées dans la lignée de la « causal revolution » (Causality : Models, Reasoning, and Inference, 2000), visent à dépasser la simple corrélation pour identifier des
relations de cause à effet.
Elles reposent sur la modélisation des dépendances via des
graphes causaux dirigés
(DAGs) et sur 1 des opérateurs d'intervention (do-calculus), permettant de répondre à des questions du type : que se passerait-il si une variable changeait? Dans le contexte du Bilan Carbone, cela permet d'étudier l'effet causal du secteur d'activité, de la taille ou du périmètre organisationnel sur la structure et la répartition des émissions.
Apprentissage de structure causale
L'apprentissage de structure causale
vise à inférer la forme du graphe causal directement à partir des données. Deux grandes familles d'approches coexistent :
è
Les méthodes basées sur des tests d'indépendance conditionnelle
(comme PC, IC, SGS), qui s'appuient sur la détection d'indépendances statistiques entre variables pour reconstruire la structure du graphe.
è
Les méthodes basées sur le score
(comme GES, NOTEARS), qui cherchent la structure la plus probable en optimisant un critère (AIC, BIC, score bayésien, etc.) tout en imposant la contrainte d'acyclicité.
Ces algorithmes permettent de révéler les dépendances structurelles entre postes d'émission, secteurs d'activité, intensité énergétique et émissions totales. Ils peuvent ensuite être validés ou ajustés par des experts métier, garantissant un équilibre entre
rigueur statistique
et
interprétation domain-specific
.
Réseaux bayésiens
Les réseaux bayésiens
, formalisés par
Pearl (1985), Lauritzen & Spiegelhalter (1988),
permettent
la prédiction
,
la simulation
, mais aussi l'inférence causale lorsqu'ils sont combinés avec des hypothèses structurelles. Appliqués à la base OCCF, ces réseaux peuvent révéler les interactions latentes entre les postes d'émission, les catégories d'activité et les variables organisationnelles. Ils servent également de base à
la simulation de bilans hypothétiques
et à
la détection d'anomalies
.
Explicabilité et intelligence artificielle interprétable
L'
explicabilité
(Explainable Artificial Intelligence, ou
XAI
) est devenue une exigence majeure pour les modèles d'apprentissage automatique utilisés dans des domaines sensibles ou décisionnels.
Les méthodes comme
LIME
(Local Interpretable Model-agnostic Explanations, Ribeiro et al., 2016) ou
SHAP
(SHapley Additive exPlanations, Lundberg & Lee, 2017) permettent de visualiser et d'interpréter la contribution des variables à la décision d'un modèle.
Dans le cadre du Bilan Carbone, ces approches permettront d'expliquer
pourquoi
un modèle estime une incohérence dans un bilan ou attribue un certain poids à une catégorie d'émission renforçant
la transparence et la vérifiabilité
des analyses.
Objectifs du stage
L'objectif principal du stage est d'intégrer les outils de causalité explicable dans l'analyse des Bilans Carbone afin de :
Identifier les relations causales entre variables structurantes (secteur, taille, postes d'émission, méthodologie, etc.);
Développer des modèles explicables permettant d'évaluer la cohérence interne et la qualité des bilans;
Mettre en œuvre des algorithmes d'apprentissage de structure causale pour cartographier les dépendances entre variables;
Proposer des visualisations et scores de qualité interprétables exploitables par l'ABC et les bureaux d'études carbone.
Questions de recherche
- Quelles variables exercent une influence causale sur la structure et le volume des émissions?
- Comment distinguer corrélation et causalité dans les relations entre postes d'émission?
- Quels algorithmes d'apprentissage de structure sont les plus adaptés à des données environnementales partiellement observées?
- Comment rendre les modèles de vérification explicables pour des utilisateurs non spécialistes?
- Peut-on définir un score explicable de qualité pour les bilans carbone, basé sur la cohérence causale des données?
Vos missions
Sous la supervision d'un chercheur en apprentissage causal et d'un référent métier de l'ABC, vous serez amené·e à :
1.Préparation et exploration des données
- Nettoyer et homogénéiser les bilans issus de la base nationale OCCF.
- Sélectionner des sous-ensembles cohérents par secteur et taille d'organisation.
- Réaliser des analyses descriptives et identifier les variables clés.
2.Apprentissage causal et inférence structurelle
- Construire des graphes causaux avec
pyAgrum
. - Mettre en œuvre des algorithmes d'apprentissage de structure (PC, GES, FCI, NOTEARS).
- Valider les résultats par tests d'indépendance et expertise métier.
- Simuler des interventions et analyser des scénarios contre-factuels.
3.Explicabilité et visualisation
- Appliquer des méthodes d'explicabilité (SHAP, LIME, PDP, Feature Importance).
- Développer des visualisations interactives et interprétables des graphes causaux.
- Documenter la sensibilité des résultats aux hypothèses de modélisation.
4.Score de qualité explicable
- Concevoir un score composite (cohérence, complétude, plausibilité).
- Implémenter ce score dans un notebook Python reproductible.
- Tester et valider sur un échantillon de bilans réels.
Résultats attendus
- Un modèle causal interprétable décrivant les interactions majeures entre variables du Bilan Carbone.
- Un score explicable de qualité pour les bilans entrants dans la base OCCF.
- Des graphes causaux validés et commentés, offrant une lecture intuitive des dépendances environnementales.
- Des recommandations méthodologiques pour l'ABC.
- Une valorisation scientifique (article court ou communication).
Compétences et connaissances attendues
- Maîtrise du langage Python et des bibliothèques associées (
Pandas, Scikit-learn, pyAgrum, SHAP
). - Solides connaissances en probabilités, statistiques, causalité et apprentissage automatique.
- Intérêt marqué pour la modélisation des systèmes complexes, l'environnement et l'explicabilité de l'IA.
- Capacité à produire un code clair, reproductible et documenté.
Profil recherché
- Étudiant·e en Master 2 (informatique, mathématiques appliquées, data science, IA).
- Curiosité scientifique et goût pour la recherche appliquée.
- Sensibilité aux enjeux environnementaux et à la transition bas carbone.
Conditions de stage
- Durée : 6 mois
- Période : Février à juillet 2025 (adaptable)
- Lieu : LIP6 (Sorbonne Université, Paris), avec interactions régulières avec l'ABC.
- Encadrement : un chercheur en apprentissage causal + un référent métier de l'ABC.
Avantages
- Gratification : 800 €/mois
- Tickets restaurant pris en charge à hauteur de 50% par l'association.
- Temps plein (32 h/semaine – selon l'accord de performance collective), soit une organisation du travail sur 4 jours par semaine.
Processus de candidature
Si vous souhaitez contribuer à une recherche innovante au service de la transition bas carbone, nous serions ravi·e·s de vous accueillir.
Candidature : Envoyez votre CV et lettre de motivation à :
- Pierre-Henri Wuillemin – pierre-
- En copie -
-
Bibliographie sélective
o Pearl, J Causality : Models, Reasoning and Inference.
o Pearl, J., & Mackenzie, D The Book of Why : The New Science of Cause and Effect.
o Spirtes, P., Glymour, C., & Scheines, R Causation, Prediction, and Search. MIT Press.
o Lauritzen, S. L., & Spiegelhalter, D. J Local computations with probabilities on graphical structures and their application to expert systems. Journal of the Royal Statistical Society : Series B, 50(2), 157–224.
o Peters, J., Janzing, D., & Schölkopf, B Elements of Causal Inference : Foundations and Learning Algorithms. MIT Press.
o Glymour, C., Zhang, K., & Spirtes, P Review of Causal Discovery Methods Based on Graphical Models. Frontiers in Genetics, 10, 524.
o Zheng, X., Aragam, B., Ravikumar, P., & Xing, E. P DAGs with NO TEARS : Continuous Optimization for Structure Learning. Advances in Neural Information Processing Systems (NeurIPS).
-
Stage M2
il y a 7 jours
Paris 05 Panthéon, Île-de-France Choisir le Service Public Temps pleinInformations générales Organisme de rattachement CNRS Référence UMR7159-CAMART-001 Date de début de diffusion /01/2026 Date de parution /01/2026 Date de fin de diffusion /01/2026 Intitulé long de l'offre Stage M2 (H/F) Date limite de candidature26/01/2026 VersantFonction Publique de l'Etat CatégorieCatégorie C (employé) Nature de...
-
Stage de Recherche en Économétrie – Crédit Immobilier
il y a 6 jours
Paris, Île-de-France Pretto Temps pleinQui sommes-nous chez Pretto ? L'achat immobilier est l'un des moments les plus importants d'une vie. Mais c'est aussi une étape stressante et complexe, surtout quand il s'agit de trouver le prêt immobilier qui valide son projet. Pretto, c'est la fintech qui rend simple, efficace et équitable la recherche de crédit immobilier. Notre secret sauce...
-
Offre de stage
il y a 1 semaine
Paris, Île-de-France Fédération Française d'Athlétisme Temps pleinStage - Paris (Siège FFA)Prise de poste : début févrierDurée du stage : 6 moisQui sommes nous ?La Fédération Française d'Athlétisme (FFA) organise, soutient et développe la pratique de l'athlétisme en France. Intégrer la FFA, c'est œuvrer au cœur d'un projet sportif et sociétal ambitieux et travailler avec passion pour promouvoir les valeurs de...
-
Stage - Coordination et Projets H/F
il y a 2 semaines
Paris 15 Vaugirard, Île-de-France Amundi Temps pleinInformations générales Entité Premier gérant d'actifs européen parmi les 10 premiers acteurs mondiaux (1), Amundi propose à ses 100 millions de clients - particuliers, institutionnels et entreprises - une gamme complète de solutions d'épargne et d'investissement en gestion active et passive, en actifs traditionnels ou réels. Cette offre est...
-
Stage Assistant
il y a 1 semaine
Paris, Île-de-France groupe-bel Temps pleinVous recherchez l'excellence, des responsabilités, de l'autonomie ? Ce stage correspond exactement à ce que vous recherchez Lisez la suite de l'annonce et postulez.VOUS NOUS CONNAISSEZ DEJA, C'EST SÛRVous avez déjà consommé nos produits (peut-être) sans le savoir For All. For Good, notre signature d'entreprise, traduit l'engagement de Bel pour une...
-
Stage - Charge-E De Communication Reseaux Sociaux H/F
il y a 2 semaines
Paris, Île-de-France Agence Française de Développement Temps pleinJOB.TITLE What will be your role? Sous l'autorité de la responsable de pilotageéditorial et en lien avec les chargés de mission, le stage sera organisé autourdes volets suivants :Appui à la rédaction, la programmation et la diffusion des publications sur les 5 comptes RS du siège de l'AFD, et particulièrement Instagram ;Appui à la préparation et...
-
Paris, Île-de-France Association BLOOM Temps pleinStage 6 mois - A partir de janvier Paris À propos de BLOOMBLOOM est une ONG française dont l'objectif est d'œuvrer pour le bien commun en protégeant l'océan et les équilibres sociaux qui en dépendent, en restaurant la richesse biologique des écosystèmes marins et l'intégrité des habitats marins, en luttant contre le changement climatique et...
-
Stage analyste quantitatif – Gestion assurantielle H/F
il y a 2 semaines
Paris 15 Vaugirard, Île-de-France Amundi Temps pleinInformations générales Entité Premier gérant d'actifs européen parmi les 10 premiers acteurs mondiaux (1), Amundi propose à ses 100 millions de clients - particuliers, institutionnels et entreprises - une gamme complète de solutions d'épargne et d'investissement en gestion active et passive, en actifs traditionnels ou réels. Cette offre est...
-
Stage Programmation Informatique
il y a 6 jours
Paris, Île-de-France Engie Temps pleinSTAGE - Programmateur Informatique - Kingersheim (68)Site du stage : Kingersheim, France, 68260Chez GRDF EST, nous sommes à la recherche d'un talent motivé pour intégrer un stage long rémunéré au sein de nos équipes.À partir de mars 2026Durée : entre 4 et 6 moisÀ propos de GRDF Gaz Réseau Distribution France est le gestionnaire du réseau de...
-
Stage - Analyste pour le département Recherche crédit H/F
il y a 1 semaine
Paris 15 Vaugirard, Île-de-France Crédit Agricole Temps pleinInformations générales Entité Premier gérant d'actifs européen parmi les 10 premiers acteurs mondiaux (1), Amundi propose à ses 100 millions de clients - particuliers, institutionnels et entreprises - une gamme complète de solutions d'épargne et d'investissement en gestion active et passive, en actifs traditionnels ou réels. Cette offre est...