Ingénieur Data
il y a 2 semaines
Description A propos de la structure UMS 47 France Cohortes L’UMS France Cohortes accompagne les cohortes en offrant des services sur les aspects réglementaires, de système d’information, d'outils de production, diffusion et exploitation des données. Les cohortes épidémiologiques et cliniques sont des enquêtes longitudinales visant à identifier les facteurs de survenue ou d’évolution des maladies. Dans une démarche de science ouverte, les données collectées doivent respecter les principes FAIR (Faciles à trouver, Accessibles, Interopérables, Réutilisables) et être documentées pour informer les utilisateurs, tout en préservant l’intégrité scientifique des études. Cela s’inscrit dans des projets français et européens de catalogage des données de recherche en santé. Le standard général retenu par France Cohortes pour la documentation des données de cohorte est DDI-Lifecycle, car particulièrement adapté aux données d’enquêtes complexes. Mission principale Vous aurez pour rôle principal de centraliser et structurer au format DDI-L les méta-données produites par les cohortes existantes en suivant des standards et des formats variés. Pour les cohortes déjà existantes, vous participerez à la standardisation de la documentation existante. Il faudra pour cela proposer et mettre en œuvre une stratégie accessible à des utilisateurs experts des cohortes mais non spécialistes des standards de méta-données. Pour les cohortes en construction, des solutions permettant de documenter au plus tôt les données au fil de leur production devront être proposées. Vous devrez également veiller à ce que l’entrepôt de méta-données puisse être moissonné ou utilisé par des outils tiers de visualisation ou de catalogage centralisé. Votre mission s’exerce, sous la responsabilité du directeur d’unité, en lien étroit avec les équipes techniques et fonctionnelles et l’équipe en charge du portail de documentation des données de recherche en santé humaine. Activités principales Analyser le format de la documentation existante, définir la stratégie de migration, et accompagner les équipes dans sa mise en œuvre, Utiliser ou adapter les outils d’intégration de méta-données dans l’entrepôt de méta-données à l’aide des API existantes, Veiller à la qualité des méta-données hébergées dans l’entrepôt et à ce que leur réutilisation soit possible, Animer des ateliers avec les cohortes participantes et accompagner l'appropriation de nouvelles pratiques et de nouveaux outils, Participer à l’élaboration de recommandations sur les outils et les standards de documentation des données au sein des groupes d’experts français, européens et internationa Profil recherché Niveau de diplôme et formation(s) Titre ou diplôme classé au moins au niveau 7 Master ou école d’ingénieur en informatique, science des données, statistique, ou documentation Connaissances Maîtrise des formats et schémas XML et Json Maîtrise des langages Python, R Maîtrise des API Maîtrise de XSLT appréciée Connaissances des principes FAIR data Connaissance des standards RDF et DDI appréciée (sinon formation à prévoir) Savoir-faire Coordination de projet et management transversal d’un réseau de compétences Rédaction de documentation technique et méthodologique (rapport, article) Capacité à travailler en anglais (niveau B2 CECRL souhaité) Aptitudes Aisance relationnelle, sens de la communication et de la pédagogie Capacités d’organisation, de planification et de rigueur Capacité à fédérer et à convaincre Capacité d’adaptation, de curiosité et d’apprentissage Expériences souhaitées une expérience dans le domaine de la gestion et de la documentation de données serait appréciée. Spécificités et environnement du poste relations externes fréquentes et nombreuses (établissements de recherche, porteurs de projets, experts métier) #J-18808-Ljbffr
-
Ingénieur LLM/GenAI — Industrialisation
il y a 2 semaines
Paris, France MP DATA Temps pleinUne société spécialisée en Data & IA recherche un Ingénieur LLM pour industrialiser les POC GenAI et déployer des solutions robustes. Vous serez chargé de développer des systèmes RAG, optimiser les pipelines LLM et collaborer avec des équipes Data. Une bonne connaissance des modèles LLM et des compétences en Python, MLOps, ainsi qu'une formation...
-
Ingénieur LLM/NLP confirmé – Industrialisation GenAI
il y a 2 semaines
Paris, France MP DATA Temps pleinUne entreprise spécialisée en Data & IA recherche un Ingénieur LLM pour industrialiser les POC GenAI et déployer des solutions robustes. Le candidat idéal a un diplôme d'Ingénieur Grande École et des compétences en Python, modèles LLM, MLOps et cloud. Il travaillera en étroite collaboration avec les équipes Data Science et IT pour optimiser des...
-
Data Ingénieur
il y a 1 semaine
Paris, Île-de-France Collective Temps pleinBudget: 550Descriptif du posteNotre stack technique est principalement constitué de Python, Spark, SQL pour les traitements de données, Airflow pour l'orchestration et Cloud Storage et Delta lake pour le stockage. La stack inclut aussi les services BigQuery, Dataproc, PubSub et Cloud Storage de la Google Cloud Platform et Terraform et Terragrunt pour la...
-
Data Engineer
il y a 1 semaine
Paris, France Data Performance Temps pleinLe Data Engineer doit: - Être orienté vers la résolution de problèmes et avoir un forte capacité d'analyse - Etre autonome et rigoureux dans sa manière d'aborder les défis techniques - Conseiller sur l'architecture des flux de données de bout en bout - Collaborer avec les différentes parties prenantes (product owners, solution owners, data solution...
-
Data Ingénieur
il y a 2 semaines
Paris, Île-de-France Collective Temps pleinBudget: 550Définition du besoinLa Direction Technique du Numérique d'une grande organisation médias mène des projets transverses en étroite collaboration avec les autres directions, notamment la direction Data. La Direction Data, au sein de la Direction du Numérique, a été créée avec la volonté de faire de la Data un levier de croissance des...
-
Directeur de projets IT
il y a 2 semaines
Paris, France MP DATA Temps pleinMP DATA recrute un Directeur de projets IT / data (H/F)Dans un contexte de forte croissance, nous recherchons notre Directeur des projets afin de structurer et piloter nos solutions de services IT / Data (Forfait, Centre de service, TMA,...).Le poste est basé dans un de nos bureaux, soit à Boulogne soit à Toulouse. Vous ferez partie d'une équipe...
-
Ingénieur Data Senior
il y a 2 semaines
Paris, France Adservio Temps pleinAdservio est un cabinet d’expertise en résilience IT, DevOps et Data/IA, qui accompagne les organisations dans la conception et l’industrialisation de plateformes numériques performantes, sécurisées et durables. Contexte du poste Dans le cadre de projets Data structurants (modernisation des plateformes décisionnelles, Data Lakehouse, analytics...
-
Senior Data Engineer | IA
il y a 1 semaine
Paris, France Data Recrutement Temps pleinL’ENTREPRISE : L'IA AU SERVICE DE LA FASHIONTECH Société fondée en 2019 Les bureaux sont situés à Paris dans le Marais Fort impact écologique Une dizaine de collaborateurs font déjà parti de l’aventure Une clientèle internationale et rennomée Solution innovante dans le domaine de la mode qui fournit des analyses de tendances basées sur des...
-
Product Owner Data
il y a 5 jours
Paris, France NM DATA Temps plein**À propos** Afin d’accompagner sa croissance et développer ses expertises, NM Data recrute son/sa futur(e) Product Owner Data** à Paris** ! NM Data est une agence conseil en Data Values Marketing spécialisée en exploitation de bases de données de consommateurs et de sociétés. Notre objectif ? Rentabiliser les entreprises en leur permettant de...
-
Ingénieur Data Senior
il y a 4 semaines
Paris, France Adservio Temps pleinAdservio est un cabinet d’expertise en résilience IT, DevOps et Data/IA, qui accompagne les organisations dans la conception et l’industrialisation de plateformes numériques performantes, sécurisées et durables.Contexte du posteDans le cadre de projets Data structurants (modernisation des plateformes décisionnelles, Data Lakehouse, analytics...