Stage - Couplage de ModÈles D'ocr & Détection D'objets Pour L'extraction de Lieux Nommés
il y a 1 jour
Dans un contexte où la transformation humaine des écosystèmes devient un enjeu de savoir majeur, mesurer et analyser les dynamiques passées qui modèlent le territoire aide à mieux saisir celles à l’œuvre aujourd’hui. Pour saisir les dynamiques de peuplement, environnementales ou industrielles, les sciences sociales exploitent de plus en plus largement les fonds cartographiques anciens numérisés en masse par les institutions patrimoniales (ex. BnF) et cartographiques (ex. IGN). On s’intéressera ici tout particulièrement aux lieux nommés figurés dans les cartes à partir du XVIIe siècle par un pictogramme et accompagnés d’une étiquette : villes, moulins, villages, ports, forts, etc. Présents en très grands nombres, ce sont des témoins précieux de l’organisation démographique, (proto)industrielle, infrastructurelle, politique, religieuse ou encore militaire d’une région.
Pour ce stage, nous faisons l’hypothèse qu’un modèle de détection - pour les pictogrammes - et un modèle OCR - pour les étiquettes - peuvent bénéficier d’un couplage. La localisation des étiquettes et des pictogrammes est corrélée, le nom d’un lieu étant écrit à proximité de son pictogramme sur la carte. Le contenu du texte et la classe du pictogramme peuvent aussi être liés, par exemple une abbaye sera symbolisée par un pictogramme dédié et son labels contiendra souvent une référence à sa fonction, comme « A.B. », « Abb. » ou « Abbaye de...». Coupler ces deux modèles constituera un premier objectif du stage. Dans un second temps, on s’intéressera au liage des différentes extractions, afin de mettre en relation les pictogrammes détectés avec le label leur correspondant.
Missions:
- évaluer les performances de modèles OCR « sur étagère » sur un jeu de cartes anciennes
- proposer une approche de couplage de YOLO et du modèle OCR sélectionné pour détecter et extraire les lieux nommés dans la carte de Cassini & évaluer les performances de l’approche
- proposer une méthode d’appariement des étiquettes et pictogrammes extraits & évaluer ses performances
- explorer la montée en généricité des approches proposées sur d’autres corpus numériques issus des collections Gallica de la BnF.
Productions attendues:
- un modèle OCR spécialisé pour les cartes anciennes : poids, code d’entraînements, rapport d’évaluation
- une architecture de couplage des modèles OCR et de détection : code, rapport d’évaluation
- l’implémentation d’une méthode de liage des labels & pictogrammes extraits : code, documentation
- un jeu de données géohistoriques de grande taille des lieux nommés extraits, sur la carte de Cassini et d’autres corpus de cartes issues de Gallica.
étudiant ou étudiante, M2 ou ingénieur en 3ème année.
Sur le campus de l'Université Gustave Eiffel, accès facile par le RER A. Accès aux bibliothèques, au restaurant universitaire et au restaurant de l'entreprise.
Le stage s’insérera dans une dynamique de recherche interdisciplinaire déjà en place entre le LASTIG de l’IGN et le Centre de Recherches Historique de l’EHESS et bénéficiera d’un cadre de travail résultant d’une collaboration de longue durée entre les deux équipes de recherche.
Ce travail s’inscrit dans une démarche de science ouverte, l’intégralité des codes et modèles seront déposés en open source/data sur des plateformes ouvertes.
-
Vendeur (H/F) - 35 Et 39 Heures - Beaumont Sur Oise
il y a 1 semaine
Beaumont-sur-Oise, France Boulangerie Rouget Temps pleinLa Boulangerie Rouget située à Beaumont-sur-Oise, **élue meilleure boulangerie de France en 2013, **recherche des vendeurs à temps plein **(39h)**: Ouverture d'une troisième boulangerie à Ezanville (fin 2024) **:possibilités d'évolution**. **CDI uniquement (pas de contrat saisonnier).** **- POSTE N°1 : 35 HEURES**: **REPOS LUNDI ET...
-
Champs-sur-Marne, Île-de-France Institut national de l'information géographique et forestière (IGN) Temps pleinEn janvier 2019, le Gouvernement français a mis en place le Grand Débat national (GDN) afin de recueillir les doléances de l'ensemble de la population, comme une des réponses au mouvement des Gilets jaunes. Deux modalités de contributions ont été proposées : des cahiers papier ouverts en mairie d'expression libre sans consignes de thème, nommés les...
-
Cadre Commercial
il y a 2 semaines
Chalon-sur-Saône, France BUBENDORFF VOLET ROULANT SAS Temps pleinEntreprise innovante et leader dans le secteur de l'industrie, BUBENDORFF SAS est une référence en matière de volets roulants et engagée dans une démarche de développement durable. Présente en France et en Allemagne, notre entreprise s'appuie sur des valeurs fortes telles que la qualité, l'innovation et le service client. Nous sommes en recherche de...
-
Ingenieur Recherche Bois et Incendie
il y a 6 jours
Champs-sur-Marne, France Cstb Temps pleinDans le cadre de ce stage, le ou la stagiaire participera au développement et à l'optimisation des outils de calcul thermomécanique pour le pôle structure, en collaborant avec les différents membres de l'équipe et en contribuant à la standardisation des méthodes et des procédures. Missions proposées : Mise en place de la méthodologie pour les...
-
Stage Master 2
il y a 6 jours
Gif-sur-Yvette, Île-de-France CEA Temps pleinInformations générales Entité de rattachement Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un...
-
Stage Master 2
il y a 7 jours
Gif-sur-Yvette, Île-de-France CEA Temps pleinInformations générales Entité de rattachement Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un...
-
Stage - Géocodage Complexe À L'aide de ModÈle de Langage
il y a 1 jour
Champs-sur-Marne, France IGN Temps pleinLe géocodage, soit l'attribution de coordonnées géographiques à des descriptions textuelles de lieux, est une tâche d’information retrieval essentielle pour les sciences de l'information géographique. Elle est une étape cruciale dans les chaînes de traitement et d’analyse de nombreux domaines, scientifique ou techniques, de la recherche en...
-
Champs-sur-Marne, France IGN Temps pleinCe stage s’inscrit dans un ensemble de travaux visant à proposer une méthodologie générique et reproductible pour la construction d’une base de connaissances géohistorique des voies et des adresses à partir des documents historiques ou de données publiées sur le Web qui contiennent des informations hétérogènes et fragmentaires. De nombreuses...
-
Champs-sur-Marne, Île-de-France Institut national de l'information géographique et forestière (IGN) Temps pleinL'entraînement de modèles d'apprentissage profond pour l'interprétation d'images aériennes et satellitaires requiert de grandes quantités de données annotées. Toutefois, si d'importants volumes de données d'Observation de la Terre (OT) sont disponibles grâce aux satellites européens Sentinel-2 et aux programmes français d'imagerie SPOT et BDORTHO,...
-
Receptionniste (H/F)
il y a 1 jour
Noyal-sur-Vilaine, France GROUPEMENT D EMPLOYEURS Temps pleinAu sein d'une équipe dynamique d'un hôtel restaurant 3 étoiles,: - L’accueil physique et téléphonique des clients ; - De renseigner la clientèle sur l’environnement proche de l’hôtel, les tarifs pratiqués et sur les différents services proposés par l’établissement ; - L’enregistrement des arrivés et des départs (check-in/check-out)...