Data Scientist: building and valorizing a large-scale cohort of diabetic patients F/H

il y a 1 semaine


Paris Gobelins, Île-de-France Ap-Hp Temps plein


Informations générales

Entité de rattachement du publieur

L'Assistance publique-Hôpitaux de Paris (AP-HP) est un centre hospitalier universitaire à dimension européenne mondialement reconnu.

Ses 38 hôpitaux accueillent chaque année 10 millions de personnes malades : en consultation, en urgence, lors d'hospitalisations programmées ou en hospitalisation à domicile.

Elle assure un service public de santé pour tous, 24h/24, et c'est pour elle à la fois un devoir et une fierté.

L'AP-HP est le premier employeur d'Ile-de-France : personnes – médecins, chercheurs, paramédicaux, personnels administratifs et ouvriers – y travaillent.

Au cœur de l'Institution, le Siège de l'AP-HP rassemble sous un même périmètre les directions fonctionnelles et les établissements qui lui sont rattachés :

CFDC (Centres de Formation et de Développement des Compétences), ACHAT (Achat Centraux Hôteliers Alimentaires et Techniques),

DRCI (Département de la Recherche Clinique et de l'Innovation) et DSN (Direction des Services numériques).

Avec ses 4000 collaborateurs, le Siège assure un rôle d'expert, de pilote et de coordinateur pour l'ensemble des hôpitaux.

Engagée dans des projets novateurs et stratégiques au service des patients, l'AP-HP recherche aujourd'hui de nouveaux talents pour mener à bien sa mission.

Vous êtes l'un d'eux ? Venez nous rejoindre

Date de parution

/01/2026

Métier

Autres métiers - Autres métiers


Intitulé du poste

Data Scientist: building and valorizing a large-scale cohort of diabetic patients F/H


Type de contrat

CDD uniquement


Rémunération

40 à 55k€ (selon expérience, profil)


Télétravail

Oui


Présentation du service

Le projet CODIA est un projet interdisciplinaire à l'intersection de la médecine (diabétologie), de la pharmaco-épidémiologie (CEPHEPI, ) et de la science des données (équipe Inria Soda ) afin d'améliorer la prise en charge du diabète via la réutilisation secondaire des données de santé. Nous travaillons plus particulièrement sur l'Entrepôt de Données de Santé (EDS) de l'AP-HP. L'EDS est une base de données qui héberge les dossiers médicaux informatisés de plus de 19 millions de patients suivis dans les 38 hôpitaux de l'AP-HP. Ces données peuvent être structurées (codes diagnostiques de pathologie, traitements administrés, procédures, biologies hospitalières, démographie, etc.) ou non structurées (comptes rendus d'hospitalisation, prescriptions, notes de consultation, etc.). CODIA vise à construire une COhorte de l'ensemble des patients DIAbétiques [1], afin de pouvoir ensuite l'utiliser pour différents projets de recherche, portant par exemple sur le rôle de l'inflammation dans le diabète (https://intercept-) [2], l'apparition et la gestion de complications du diabète, comme le pied diabétique [3], la maladie rénale chronique, et l'évaluation de l'efficacité de traitements en vie réelle. Nous avons maintenant consolidé une base de données de près de patients, ce qui en fait l'une des plus larges cohortes de patients diabétiques d'Europe.


Vos missions

Encadrement

Judith Abécassis, Soda team, Inria Saclay )

Candice Estellat, CEPHEPI, Pitié-Salpêtrière, APHP )

Louis Potier, PUPH, Hôpital Bichat, AP-HP )

En tant que data scientist sur ce projet, vous travaillerez en relation étroite avec les différents acteurs du projet afin de

Cibler les bonnes données, au bon moment : sélectionner et préparer des sous-cohortes adaptées aux enjeux cliniques des projets

Piloter des analyses data innovantes : dans une démarche d'inférence causale, allier biostatistiques, épidémiologie et, quand c'est pertinent, machine learning, avec l'appui des experts du consortium

Faire parler les données cachées : poursuivre l'application de stratégies de traitement automatique des langues pour enrichir et fiabiliser l'information extraite des notes cliniques non structurées

Partager les avancées : contribuer activement à la rédaction d'articles scientifiques afin de diffuser les résultats auprès de communautés variées

Pour maximiser la synergie des expertises du consortium, vous serez basé·e au centre de pharmaco-épidémiologie de la Pitié-Salpêtrière, tout en collaborant activement avec :

● l'équipe Soda à Inria Saclay,

● les data scientists de l'AP-HP sur le campus Picpus (12e).

Ces échanges réguliers en présentiel garantiront l'accès à toutes les compétences clés nécessaires pour mener à bien le projet.


Profil recherché

Le/la candidat-e idéal-e dispose
- d'un M2 en mathématiques, informatique, sciences des données, biostatistiques ou équivalent
- d'une première expérience en data science / machine learning
- de bonnes connaissances en Python, SQL, Spark, des bonnes pratiques de développement, et d'une appétence pour les approches élégantes
- d'une excellente capacité à communiquer, et faire le lien entre les différentes équipes
- d'une bonne organisation, pour mener en parallèle plusieurs projets à des rythmes variés
- un intérêt marqué pour la santé publique

Note importante : nous recrutons des personnes pas des postes
Si après la lecture de cette description de poste, vous pensez que vous n'avez pas tous les prérequis mais qu'elle correspond à là où vous voudriez être dans votre prochaine position, nous vous encourageons à postuler


Horaires de travail

- Forfait jour

Les avantages de l'AP-HP
Schéma Horaire

Jour


Temps de travail

Administratif - Forfait


Localisation du poste

France, Ile-de-France, Paris (75)


Ville

Paris 13


Hôpital et/ou site

Hôpital Pitié-Salpêtrière - Paris 13 (GHU Sorbonne)


Service d'affectation

CEPHEPI



  • Paris, Île-de-France Choisir le Service Public Temps plein

    Informations générales Organisme de rattachement Siège de l'AP-HP   Référence APHP_ Date de début de diffusion /01/2026 Date de parution /01/2026 Domaine / MétierSocial, enfance et famille - Assistante / Assistant socio-éducatif Intitulé du posteData Scientist: building and valorizing a large-scale cohort of diabetic patients F/H...

  • senior data engineer

    il y a 5 jours


    Paris, Île-de-France STATION F Temps plein

    AboutRejoignez Allphins, une start-up insurtech dynamique qui redéfinit la gestion des risques dans l'industrie de la (ré)assurance grâce à une technologie innovante. En tant que Senior Data Engineer, vous aurez l'opportunité de jouer un rôle clé dans notre croissance rapide et notre expansion internationale.Notre parcours a commencé en 2019, au...

  • Research Scientist

    il y a 5 jours


    Paris, Île-de-France Institute of Foundation Models Temps plein

    About the Institute of Foundation Models We are a dedicated research lab for building, understanding, using, and risk-managing foundation models. Our mandate is to advance research, nurture the next generation of AI builders, and drive transformative contributions to a knowledge-driven economy. As part of our team, you'll have the opportunity to work on the...

  • Research Scientist

    il y a 5 jours


    Paris, Île-de-France Institute of Foundation Models Temps plein

    About the Institute of Foundation Models  We are a dedicated research lab for building, understanding, using, and risk-managing foundation models. Our mandate is to advance research, nurture the next generation of AI builders, and drive transformative contributions to a knowledge-driven economy. As part of our team, you'll have the opportunity to work on...

  • Data Scientist

    il y a 2 semaines


    Paris, Île-de-France IQVIA Temps plein

    Data ScientistLocation: Paris, FranceContextThe Data & Tech department of IQVIA France is recruiting a Data Scientist for its Research & Innovation team. The team develops proofs of concept, new products, and improvements to existing solutions to support IQVIA's activities. The team also provides technical expertise, particularly regarding the integration of...


  • Paris, Île-de-France STATION F Temps plein

    AboutGreenly est une entreprise Tech certifiée B-corp fondée en 2019 par Alexis, Matthieu et Arnaud. Elle permet à chaque entreprise de suivre facilement son empreinte carbone, pour participer à la lutte contre le changement climatique. Plus de 2000 entreprises ont déjà fait confiance à Greenly pour réduire efficacement leurs émissions de gaz à...

  • Data Scientist

    il y a 1 semaine


    Paris, Île-de-France White Circle Temps plein

    Wanted: Data Scientist who will help us keep LLMs under control.About usWhite Circle is an AI Safety company building the safety, reliability, and optimization layer for AI systems. At the core of our platform are policies – simple natural-language rules that define what an AI model should and shouldn't do. We automatically test, enforce, and continuously...

  • Data Scientist

    il y a 1 semaine


    Paris, Île-de-France Veepee Temps plein

    Pioneer of online flash sales since 2001 and key player in European e-commerce, Veepee collaborates with over 7,000 brands to offer highly discounted products available for a limited time. Operating across various sectors, including fashion, home, wine, travel or beauty... Veepee achieved a turnover of 3.3 billion euros incl. VAT in 2024 and employs 5,000...


  • Paris, Île-de-France Dataiku Temps plein

    Dataiku is The Universal AI Platform, giving organizations control over their AI talent, processes, and technologies to unleash the creation of analytics, models, and agents. Providing no-, low-, and full-code capabilities, Dataiku meets teams where they are today, allowing them to begin building with AI using their existing skills and knowledge.Dataiku's...

  • Member of technical staff

    il y a 5 jours


    Paris, Île-de-France H Company Temps plein

    About H:H exists to push the boundaries of superintelligence with agentic AI. By automating complex, multi-step tasks typically performed by humans, AI agents will help unlock full human potential.H is hiring the world's best AI talent, seeking those who are dedicated as much to building safely and responsibly as to advancing disruptive agentic capabilities....