STAGE : Data scientist H/F
il y a 1 semaine
Intitulé du poste
STAGE : Data scientist H/F
Type de contrat
Convention de stage
Catégorie
Cadre ou Catégorie A
Disponibilité du poste
01/04/2026
Site
Fontenay-aux-Roses
Environnement / Organisation / Contexte
Le stage sera encadré par le Bureau du Management des Données de l'Environnement (BMDE) au sein du Service d'Intervention Radiologique et de Surveillance de l'Environnement (SIRSé). Ce service pilote la mission de surveillance radiologique de l'environnement français et intervient dans le domaine de la caractérisation radiologique de sites. Le SIRSé a également en charge le développement et le maintien des moyens mobiles de l'ASNR pour gérer sur le terrain les situations d'urgences radiologiques. Ces activités de terrain générant plusieurs centaines de milliers de mesures chaque année, le BMDE à la charge de collecter et de valoriser les données de l'environnement produites par l'autorité. Il dispose pour cela de l'entrepôt de données SYRACUSE, patrimoine numérique de la surveillance de la radioactivité de l'environnement en France qui contient actuellement plusieurs millions d'enregistrements.
L'objet de ce stage est d'enrichir cet entrepôt de données par l'intégration de données présentes dans des rapports de surveillance publiés mensuellement des années 1960 à la fin des années 1990.
Mission
Sujet De Stage
Conception et prototypage d'un pipeline d'extraction et d'intégration de données issues de rapports PDF historiques de la surveillance environnementale.
Missions
Le stage sera séquencé selon les grandes étapes d'élaboration suivantes :
1 - Analyse d'un échantillon représentatif de rapports PDF (qualité variable) ;
2 - Mise en place une chaîne d'extraction semi-automatique du texte et des tableaux (PDFMiner ou équivalent) ;
3 - Transformation des données selon le modèle de données cible SYRACUSE
4 - Développement d'un pipeline ETL (Python ou équivalent) pour charger les données nettoyées dans le DWH.
5 - Contrôles de la qualité de l'extraction (gestion des doublons...).
En plus des scripts et du pipeline prototype, le stagiaire produira un rapport d'évaluation dans lequel il présentera les performances, identifiera les limites et proposera des pistes d'industrialisation.
Profil recherché
Master 1 ou master 2 ou écoles d'ingénieurs en informatique avec option data/IA
Télétravail
Occasionnel
Diversité
La diversité est une des composantes de la politique RSE, RH et Qualité de Vie au Travail à l'ASNR.
Nous accordons la même considération à toutes les candidatures, sans discrimination, pour inclure tous les talents.
Quelles que soient les différences, nous souhaitons attirer, intégrer et fidéliser nos candidats et nos collaborateurs au sein d'un environnement de travail inclusif.
L'ASNR conduit une politique active depuis de nombreuses années en faveur de l'égalité des chances au travail et l'emploi des personnes handicapées. Si vous êtes en situation de handicap, n'hésitez pas à nous faire part de vos éventuels besoins spécifiques afin que nous puissions les prendre en compte.
-
Data Scientist
il y a 2 jours
Boulogne-Billancourt, Île-de-France MP DATA Temps pleinNous recherchons un profil Data Scientist Agentic GCP pour renforcer notre équipe Data dans l'industrie. Vous interviendrez sur plusieures étapes des projets IA : sur l'exploration et la valorisation notamment.Vos responsabilités incluront :Analyser, structurer et valoriser des jeux de données internes et externes.Développer et fine tuner des modèles...
-
Data Scientist
il y a 2 semaines
Boulogne-Billancourt, Île-de-France MP DATA Temps pleinNous recherchons un profilData Scientist IAGen 3Dpour renforcer notre équipe Data dans l'industrie. Vous interviendrez sur plusieures étapes des projets IA : sur l'exploration et la valorisation notamment.Vos Responsabilités InclurontAnalyser, structurer et valoriser des jeux de données internes et externes.Développer et fine tuner des modèles de...
-
Data Scientist LLM/ GCP confirmé
il y a 2 semaines
Boulogne-Billancourt, Île-de-France MP DATA Temps pleinNous recrutons : Data Scientist LLM / GCP Confirmé(e)Boulogne-Billancourt | Secteur : IndustrieCDI – Équipe DataNous renforçons notre équipe Data et recherchons un(e)Data Scientist confirmé(e)spécialisé(e) enLLMetGCP. Vous interviendrez sur toutes les étapes clés de nos projets d'Intelligence Artificielle, de l'exploration à la mise en...
-
Data Scientist Marketing
il y a 2 jours
Boulogne-Billancourt, Île-de-France MP DATA Temps pleinVos missionsVous Intégrerez Nos Équipes Pour Analyser Et Exploiter Les Données Marketing Afin De Maximiser La Valeur Client Et Optimiser Les Campagnes. Vos Responsabilités InclurontDévelopper et déployer des modèles de Machine Learning et d'IA appliqués au marketing : scoring, segmentation, recommandation, churn prediction, attribution, lifetime...
-
STAGE : Data scientist H/F
il y a 1 semaine
Boulogne-Billancourt, Île-de-France ASNR Temps pleinInformations générales Entité de rattachement L'Autorité de sûreté nucléaire et de radioprotection est une autorité administrative indépendante créée par la loi du 21 mai 2024 relative à l'organisation de la gouvernance de la sûreté nucléaire et de la radioprotection pour répondre au défi de la relance de la filière nucléaire.Elle...
-
Data Scientist
il y a 1 semaine
Boulogne-Billancourt, Île-de-France Hilti Group Temps pleinWhat's the role?As a Data Scientist in Hilti Strategic Marketing's AI Accelerator, you will play a pivotal role in developing impactful AI solutions. You will be responsible for data cleaning, building data science models, evaluating results, and providing actionable insights and improvements. This role requires strong collaboration skills to work...
-
Data Scientist
il y a 5 jours
Boulogne-Billancourt, Île-de-France Hilti France Temps pleinMaster of Science or PhD degree in a quantitative discipline (Computer Science, Mathematics, or related scientific fields)4+ years full time employment as Data Scientist, ML engineer or AI Engineer.Proven hands-on experience in Machine Learning, GenAI, multi-agent frameworks, and writing production pipelines; experience applying recent AI advancement and...
-
Data Scientist
il y a 2 jours
Boulogne-Billancourt, Île-de-France CEGEDIM Temps pleinÀ propos de GERS DATAFiliale du Groupe CEGEDIM, GERS DATA est spécialisée dans la collecte, l'agrégation et l'analyse de données dans le secteur de la santé.GERS DATA offre une très large gamme de solutions aux acteurs de l'industrie pharmaceutique (grossistes, groupements, laboratoires, pharmacies). En tant que partenaire de confiance des acteurs de...
-
Data Scientist
il y a 2 jours
Boulogne-Billancourt, Île-de-France Cegedim Temps pleinÀ propos de GERS DATAFiliale du Groupe CEGEDIM,GERS DATAestspécialisée dans la collecte, l'agrégation et l'analyse de données dans lesecteur de la santé.GERS DATA offre une très large gamme de solutions auxacteurs de l'industrie pharmaceutique (grossistes, groupements, laboratoires,pharmacies). En tant que partenaire de confiance des acteurs de la...
-
Data Scientist Senior
il y a 2 jours
Boulogne-Billancourt, Île-de-France CEGEDIM Temps pleinCDITemps pleinAu moins 5 ans d'expérienceMaster, Bac+5Informatique / Systèmes d'informationContexteFondée en 1969, Cegedim est une entreprise innovante de technologies et de services spécialisée dans la gestion des flux numériques de l'écosystème santé et BtoB, ainsi que dans la conception de logiciels métiers destinés aux professionnels de santé...