doctorant-e : modèles génératifs profonds pour la génération procédurale directe et inverse

il y a 2 semaines


ChampssurMarne, Île-de-France Institut national de l'information géographique et forestière (IGN) Temps plein

L'entraînement de modèles d'apprentissage profond pour l'interprétation d'images aériennes et satellitaires requiert de grandes quantités de données annotées. Toutefois, si d'importants volumes de données d'Observation de la Terre (OT) sont disponibles grâce aux satellites européens Sentinel-2 et aux programmes français d'imagerie SPOT et BDORTHO, cette masse de données est non-étiquetée. En effet, peu d'images de télédétection sont annotées avec des information sémantiques utiles pour entraîner des modèles profonds. Ce phénomène est d'autant plus critique pour la cartographie d'urgence: les catastrophes naturelles sont des événements rares, ce qui réduit d'autant les images disponibles.

Pour pallier ces difficultés, la recherche en intelligence artificielle s'est intéressée à la génération de bases de données d'images synthétiques. La popularisation de l'intelligence artificielle dite générative permet ainsi de produire des jeux de données annotés, en générant des images diverses dans des configurations connues. La génération procédurale est en outre un procédé historiquement bien connu dans la communauté du jeu vidéo, permettant de produire rapidement de grands mondes virtuels en trois dimensions.

L'Institut national de l'information géographique et forestière (IGN) est un établissement public à caractère administratif placé sous la tutelle des ministères chargés de l'écologie et de la forêt. Sa vocation est de produire et diffuser des données (open data) et des représentations (cartes en ligne et papier, géovisualisation) de référence relatives à la connaissance du territoire national et des forêts françaises ainsi qu'à leur évolution. Grâce à son école d'ingénieurs, l'ENSG-Géomatique, et à ses équipes de recherche pluridisciplinaires, l'institut cultive un potentiel d'innovation de haut niveau dans plusieurs domaines (géodésie, forêt, photogrammétrie, intelligence artificielle, analyse spatiale, visualisation 3D, etc.).

Le LASTIG (LAboratoire en Sciences et Technologies de l'Information Géographique pour la ville intelligente et les territoires durables) est une unité mixte de recherche sous la tutelle de l'IGN-ENSG et de l'Université Gustave Eiffel. Le laboratoire mène des recherches finalisées en sciences et techniques de l'information géographique, couvrant l'ensemble du cycle de vie de la donnée géographique ou spatiale. Au sein du laboratoire, l'équipe STRUDEL s'intéresse notamment aux structures spatio-temporelles pour l'analyse des territoires, notamment sur l'extraction et la structuration de connaissances concernant la description du territoire, sur les caractérisations possibles du territoire et de ses évolutions et la réutilisation de ces connaissances pour simuler les évolutions territoriales. Dans ce cadre, l'équipe mène des travaux de recherches sur l'exploitation de données synthétiques pour la simulation, la création de jumeaux numériques et l'apprentissage semi-supervisé.

L'objectif principal de cette thèse est de combiner les forces de l'apprentissage profond et de la génération procédurale basée grammaire pour les données géospatiales.

La génération procédurale désigne les algorithmes de création de contenu, en particulier pour le jeu vidéo . Ces techniquent permettent de créer des mondes virtuels cohérents , notamment pour la modélisation et la simulation du réel, La génération procédurale connaît un regain de popularité car elle permet de produire de grands volumes de données synthétiques annotées, sur lesquels entraîner des réseaux de neurones profonds . Historiquement, la génération procédurale s'est appuyé sur quatre grande familles de méthodes: les approches basées exploration , les approches par satisfaction de contraintes , les méthodes basées grammaire , et les approches par apprentissage .

Les approches basées grammaire (ou assimilées, par exemple basées système-L ) sont particulièrement intéressantes. Elles se fondent sur un langage formel qui définit quelles sont les instances acceptables des objets à générer. Cette grammaire permet d'inclure une connaissance experte et peut être considérée comme interprétable. Cependant, définir manuellement une grammaire requiert une certaine expertise et implique souvent une approche itérative par essai-erreur. En comparaison, la génération procédurale par apprentissage statistique permet d'apprendre à générer des objets à partir d'un corpus existant. Toutefois, les modèles appris sont susceptibles de générer des objets inacceptables (par exemple, des maisons sans aucune porte). Par ailleurs, les approches récentes, notamment par apprentissage profond, nécessitent des jeux de données de grande taille pour exceller, ce qui n'est pas toujours possible. En particulier, les entités géographiques urbaines (typiquement les routes et les bâtiments) doivent respecter des a priori géométriques forts qui peuvent être complexes à satisfaire .

Ce sujet de thèse s'intéresse ainsi à l'hybridation entre la génération procédurale symbolique, en particulier exploitant les grammaires, et l'apprentissage profond. Des approches hybrides peuvent permettre d'apprendre à partir de moins d'exemples, tout en respectant mieux les contraintes imposées sur les données par une grammaire . L'objectif est double:

Dans un premier temps, il s'agit de concevoir des architectures génératives de réseaux de neurones dont les sorties sont contraintes par une grammaire. Ainsi, le modèle sera garanti de ne générer que des objets acceptables vis à vis d'une grammaire fournie par l'usager . Plus précisément, on s'intéressera:

à contraindre les cartes de segmentation d'un modèle prédictif à respecter une grammaire sur l'agencement spatial des objets,

ou bien à des modèles génératifs qui ne peuvent produire que des objets acceptables selon une grammaire imposée, par exemple de bâtiments.

Dans un second temps, de développer des modèles capables d'inférer tout ou partie d'une grammaire à partir d'un corpus d'exemples (génération procédurale inverse et inférence de grammaire). En particulier, on cherchera:

des méthodes capables d'apprendre automatiquement les symboles terminaux du langage, notamment à l'aide de l'apprentissage de prototypes ,

puis à des méthodes capables de déduire les règles de production de la grammaire .

Ces techniques de génération seront appliquées à divers types de données géospatiales en 2D et 3D pour la génération de villes . En particulier, les applications pourront inclure les plans cadastraux (emprises au sol de parcelles et de bâtiments), des modèles 3D de bâtiments (produits manuellement ou extraits du Lidar HD) ou des cartes d'occupation du sol.

Le ou la candidate idéale dispose d'une formation de niveau bac+5 (master ou ingénieur) dans l'un des domaines suivants: science des données, jeu vidéo, géomatique. Il ou elle démontre une expérience de la programmation, en particulier avec le langage Python. Une connaissance des outils de gestion projet informatique, notamment Git, sera appréciée. Une bonne maîtrise de l'anglais (écrit et oral) est un pré-requis. Sans être indispensable, une première expérience avec la génération procédurale, les modèles profonds génératifs ou les données géospatiales est un plus.

  • Cadre académique de la recherche au sein du laboratoire LASTIG et de l'université Gustave Eiffel
  • Liens avec les services d'innovation et de production de l'IGN pour l'identification de verrous scientifiques à fort impact sociétal
  • Pratique possible du télétravail après une période de prise de poste
  • Équipements sportifs disponibles sur site
  • Associations culturelles et sportives au sein de l'IGN
  • Restauration d'entreprise
  • Remboursement transport 75% et indemnités kilométriques vélo

Missions ponctuelles dans le cadre de séminaires et de conférences.



  • Champs-sur-Marne, Île-de-France Institut national de l'information géographique et forestière (IGN) Temps plein

    La détection de changement est au cœur de l'interprétation des séries temporelles d'images aériennes ou satellitaires. En effet, le changement climatique, mais aussi les évolutions du territoire, sont générateurs de changements majeurs qu'il est impossible de cartographier manuellement. En outre, les phénomènes extrêmes (incendies, inondations,...


  • Champs-sur-Marne, Île-de-France Institut national de l'information géographique et forestière (IGN) Temps plein

    L'entraînement de modèles d'apprentissage profond pour l'interprétation d'images aériennes et satellitaires requiert de grandes quantités de données annotées. Toutefois, si d'importants volumes de données d'observation de la Terre sont disponibles grâce aux satellites européens Sentinel-2 et aux programmes français SPOT et BDORTHO, cette masse de...


  • Champs-sur-Marne, Île-de-France Institut national de l'information géographique et forestière (IGN) Temps plein

    La détection de changement est au cœur de l'interprétation des séries temporelles d'images aériennes ou satellitaires. En effet, le changement climatique, mais aussi les évolutions du territoire, sont générateurs de changements majeurs qu'il est impossible de cartographier manuellement. En outre, les phénomènes extrêmes (incendies, inondations,...


  • Champs-sur-Marne, Île-de-France Institut national de l'information géographique et forestière (IGN) Temps plein

    La reconstruction 3D constitue une tâche essentielle pour l'analyse urbaine et la production de jumeaux numériques à partir de données LiDAR. Si la reconstruction des bâtiments, notamment selon différents niveaux de détail (LoD), a été largement étudiée, la reconstruction des arbres demeure encore peu explorée. Pourtant, pour obtenir des jumeaux...


  • Champs-sur-Marne, Île-de-France Institut national de l'information géographique et forestière (IGN) Temps plein

    L'Institut national de l'information géographique et forestière (IGN) est un établissement public à caractère administratif placé sous la tutelle des ministères chargés de l'écologie et de la forêt. Sa vocation est de produire et diffuser des données (open data) et des représentations (cartes en ligne et papier, géovisualisation) de référence...


  • Champs-sur-Marne, Île-de-France Institut national de l'information géographique et forestière (IGN) Temps plein

    Les glaciers, par leur réponse aux fluctuations climatiques, constituent d'excellents indicateurs du changement climatique. Ils fournissent des ressources en eau douce aux populations locales et contribuent actuellement à hauteur de 25 à 30 \% à l'élévation du niveau de la mer. Malgré des améliorations substantielles dans la représentation des...


  • Champs-sur-Marne, Île-de-France Institut national de l'information géographique et forestière (IGN) Temps plein

    Les zones côtières, essentielles pour la société mais fortement vulnérables au changement climatique, nécessitent des informations précises et actualisées sur les habitats benthiques. La télédétection est devenue un outil majeur, et les images à très haute résolution (THR) issues d'UAV ou de campagnes aériennes offrent un potentiel...

  • Développement IA Générative

    il y a 2 semaines


    Ivry-sur-Seine, Île-de-France DOCAPOSTE Temps plein

    Intitulé du posteDéveloppement IA Générative - Stage F/HContratStageTélétravailHybrideDescription de la missionNous recherchons un stagiaire passionné par l'IA générative et motivé par l'exploration des capacités offertes par cette technologie.Vous rejoindrez notre équipe resserrée et agile de développement pour travailler sur des projets...


  • Ivry-sur-Seine, Île-de-France Docaposte Temps plein

    Informations généralesEntité de rattachementRéférent de la confiance numérique en France et filiale du groupe La Poste, Docaposte accompagne toutes les entreprises et institutions publiques dans leur transformation et leur permet de l'accélérer, en confiance.L'entreprise se compose de filiales, marques et Business Units qui adressent de nombreux...


  • Champs-sur-Marne, Île-de-France Choisir le Service Public Temps plein

    Informations générales Organisme de rattachement CNRS   Référence UMR8205-OLIPIT-004   Date de début de diffusion /12/2025 Date de parution /12/2025 Date de fin de diffusion /01/2026 VersantFonction Publique de l'Etat CatégorieCatégorie A (cadre) Nature de l'emploiEmploi ouvert uniquement aux contractuels Domaine / MétierRecherche -...