STAGE : Data scientist H/F

il y a 2 semaines


BoulogneBillancourt, Île-de-France IRSN Temps plein
du poste

Intitulé du poste

STAGE : Data scientist H/F

Type de contrat

Convention de stage

Catégorie

Cadre ou Catégorie A

Disponibilité du poste

01/04/2026

Site

Fontenay-aux-Roses

Environnement / Organisation / Contexte

Le stage sera encadré par le Bureau du Management des Données de l'Environnement (BMDE) au sein du Service d'Intervention Radiologique et de Surveillance de l'Environnement (SIRSé). Ce service pilote la mission de surveillance radiologique de l'environnement français et intervient dans le domaine de la caractérisation radiologique de sites. Le SIRSé a également en charge le développement et le maintien des moyens mobiles de l'ASNR pour gérer sur le terrain les situations d'urgences radiologiques. Ces activités de terrain générant plusieurs centaines de milliers de mesures chaque année, le BMDE à la charge de collecter et de valoriser les données de l'environnement produites par l'autorité. Il dispose pour cela de l'entrepôt de données SYRACUSE, patrimoine numérique de la surveillance de la radioactivité de l'environnement en France qui contient actuellement plusieurs millions d'enregistrements.

L'objet de ce stage est d'enrichir cet entrepôt de données par l'intégration de données présentes dans des rapports de surveillance publiés mensuellement des années 1960 à la fin des années 1990.

Mission

Sujet De Stage
Conception et prototypage d'un pipeline d'extraction et d'intégration de données issues de rapports PDF historiques de la surveillance environnementale.

Missions
Le stage sera séquencé selon les grandes étapes d'élaboration suivantes :

1 - Analyse d'un échantillon représentatif de rapports PDF (qualité variable) ;

2 - Mise en place une chaîne d'extraction semi-automatique du texte et des tableaux (PDFMiner ou équivalent) ;

3 - Transformation des données selon le modèle de données cible SYRACUSE

4 - Développement d'un pipeline ETL (Python ou équivalent) pour charger les données nettoyées dans le DWH.

5 - Contrôles de la qualité de l'extraction (gestion des doublons...).

En plus des scripts et du pipeline prototype, le stagiaire produira un rapport d'évaluation dans lequel il présentera les performances, identifiera les limites et proposera des pistes d'industrialisation.

Profil recherché

Master 1 ou master 2 ou écoles d'ingénieurs en informatique avec option data/IA

Télétravail

Occasionnel

Diversité

La diversité est une des composantes de la politique RSE, RH et Qualité de Vie au Travail à l'ASNR.
Nous accordons la même considération à toutes les candidatures, sans discrimination, pour inclure tous les talents.
Quelles que soient les différences, nous souhaitons attirer, intégrer et fidéliser nos candidats et nos collaborateurs au sein d'un environnement de travail inclusif.
L'ASNR conduit une politique active depuis de nombreuses années en faveur de l'égalité des chances au travail et l'emploi des personnes handicapées. Si vous êtes en situation de handicap, n'hésitez pas à nous faire part de vos éventuels besoins spécifiques afin que nous puissions les prendre en compte.



  • Boulogne-Billancourt, Île-de-France MP DATA Temps plein

    Nous recrutons : Data Scientist LLM / GCP Confirmé(e)Boulogne-Billancourt | Secteur : IndustrieCDI – Équipe DataNous renforçons notre équipe Data et recherchons un(e)Data Scientist confirmé(e)spécialisé(e) enLLMetGCP. Vous interviendrez sur toutes les étapes clés de nos projets d'Intelligence Artificielle, de l'exploration à la mise en...

  • Data Scientist Marketing

    il y a 3 jours


    Boulogne-Billancourt, Île-de-France MP DATA Temps plein

    Vos missionsVous Intégrerez Nos Équipes Pour Analyser Et Exploiter Les Données Marketing Afin De Maximiser La Valeur Client Et Optimiser Les Campagnes. Vos Responsabilités InclurontDévelopper et déployer des modèles de Machine Learning et d'IA appliqués au marketing : scoring, segmentation, recommandation, churn prediction, attribution, lifetime...

  • STAGE : Data scientist H/F

    il y a 1 semaine


    Boulogne-Billancourt, Île-de-France ASNR Temps plein

    Informations générales Entité de rattachement L'Autorité de sûreté nucléaire et de radioprotection est une autorité administrative indépendante créée par la loi du 21 mai 2024 relative à l'organisation de la gouvernance de la sûreté nucléaire et de la radioprotection pour répondre au défi de la relance de la filière nucléaire.Elle...

  • Data Scientist

    il y a 1 semaine


    Boulogne-Billancourt, Île-de-France Hilti Group Temps plein

    What's the role?As a Data Scientist in Hilti Strategic Marketing's AI Accelerator, you will play a pivotal role in developing impactful AI solutions. You will be responsible for data cleaning, building data science models, evaluating results, and providing actionable insights and improvements. This role requires strong collaboration skills to work...

  • Data Scientist

    il y a 3 jours


    Boulogne-Billancourt, Île-de-France CEGEDIM Temps plein

    À propos de GERS DATAFiliale du Groupe CEGEDIM, GERS DATA est spécialisée dans la collecte, l'agrégation et l'analyse de données dans le secteur de la santé.GERS DATA offre une très large gamme de solutions aux acteurs de l'industrie pharmaceutique (grossistes, groupements, laboratoires, pharmacies). En tant que partenaire de confiance des acteurs de...

  • Data Scientist

    il y a 3 jours


    Boulogne-Billancourt, Île-de-France Cegedim Temps plein

    À propos de GERS DATAFiliale du Groupe CEGEDIM,GERS DATAestspécialisée dans la collecte, l'agrégation et l'analyse de données dans lesecteur de la santé.GERS DATA offre une très large gamme de solutions auxacteurs de l'industrie pharmaceutique (grossistes, groupements, laboratoires,pharmacies). En tant que partenaire de confiance des acteurs de la...

  • Data Scientist Senior

    il y a 3 jours


    Boulogne-Billancourt, Île-de-France CEGEDIM Temps plein

    CDITemps pleinAu moins 5 ans d'expérienceMaster, Bac+5Informatique / Systèmes d'informationContexteFondée en 1969, Cegedim est une entreprise innovante de technologies et de services spécialisée dans la gestion des flux numériques de l'écosystème santé et BtoB, ainsi que dans la conception de logiciels métiers destinés aux professionnels de santé...

  • Data Scientist Courtage

    il y a 1 semaine


    Boulogne-Billancourt, Île-de-France Premium Partners Temps plein

    Présentation de la société :Fondé en 2000, Groupe Premium s'est imposé comme un acteur de référence dans le paysage financier français.Aujourd'hui, le Groupe déploie une expertise à travers ses trois piliers stratégiques : le courtage en assurances, la gestion d'actifs et le conseil en gestion de patrimoine.Le Groupe développe une approche...


  • Boulogne-Billancourt, Île-de-France MP DATA Temps plein

    Qui sommes-nous ?MP Data est une société de conseil à taille humaine spécialisée dans la valorisation de la donnée et l'intelligence artificielle. Nous accompagnons les entreprises, en particulier les acteurs industriels, dans l'exploitation stratégique de leurs données afin de stimuler leur croissance, améliorer leur performance et renforcer leur...


  • Boulogne-Billancourt, Île-de-France Viseo Temps plein

    Rejoins VISEO et découvre un monde de possibilités où nous mettons l'Humain, le Collectif et le Challenge au cœur de tout ce que nous réalisons.  Qui es-tu ?  Etudiant en dernière année d'une formation spécialisée en informatique (université ou école d'ingénieur), tu es à la recherche d'un stage de fin d'études de 6 mois pouvant déboucher...