Data Engineer

il y a 5 jours


BoulogneBillancourt, France Cegedim Temps plein

Clinityx est un bureau d’études faisant partie du groupe Cegedim, qui réalise des études épidémiologiques à partir de données de santé issues de registres ou du Système National de Données de Santé (SNDS), pour le compte des laboratoires pharmaceutiques ou des sociétés savantes.

Clinityx a développé une expertise forte sur la gestion des données du SNDS. Nous disposons aujourd’hui d’un entrepôt de données de santé unique en son genre, comportant une volumétrie importante, de l‘ordre de 30 To. Nous cherchons aujourd’hui à renforcer l’équipe sur les capacités de traitement de cette forte volumétrie.

Nous travaillons dans un environnement cloud HDS (hébergeur de données de santé), sur des cluster Kubernetes. La stack technologique repose principalement sur l’utilisation de clusters Spark (Scala) pour l’analyse distribuée des données, avec du stockage objet de type S3.

**Mission**:
Les data engineers fournissent un travail crucial chez Clinityx, en étroite collaboration avec les data scientistes d’une part, et avec les épidémiologistes d’autre part. Ces interactions sont indispensables à la définition des besoins des équipes en vue de construire les outils utilisés en interne.
La personne nous rejoignant pour le poste de D_ata engineer_:

- Participera à la conception et à l'implémentation de pipelines de données, en vue de la préparation d’un datalake structuré pour les data scientists
- Assurera le développement, l’intégration, la qualité et la disponibilité de ces pipelines
- Participera aux développements d’outils fortement réutilisables afin d’automatiser et industrialiser la production d’analyses clés
- Travaillera en étroite collaboration avec les équipes de data science et d’épidémiologie pour comprendre et répondre à leurs besoins en matière de données.

**Bénéfices**:

- Télé-travail hybride : 2 jours de TT / 2 jours sur site (Boulogne)
- 13 jours de RTT et 25 jours de congés annuels
- Mutuelle groupe très avantageuse
- Avantages du CSE (billetterie, chèques vacances )
- Carte tickets restaurant
- Participation.
- Ingénieur intéressé par les données à forte volumétrie
- Bonne connaissance du framework Spark et du langage Scala (ou Java, ou Python/PySpark
- Expérience de 2 à 5 ans dans un poste similaire
- La connaissance des environnements de données de santé est un plus.


  • Data Engineer

    il y a 2 semaines


    Boulogne-Billancourt, France Mp Data Temps plein

    MP DATA, société spécialisée dans l’acquisition, le traitement et la valorisation des données, accompagne ses clients, majoritairement industriels, dans le management de leur performance et l’exploitation de leurs données depuis 2015. Les collaborateurs, tous issus de grandes écoles, incarnent au quotidien les valeurs d’Excellence,...

  • Lead Data Engineer

    il y a 2 semaines


    Rue du Dôme, Boulogne-Billancourt, France Mp Data Temps plein

    MPdata accompagne ses clients dans la conception, la mise en production et l'industrialisation de solutions data à forte valeur ajoutée. Nous intervenons sur des environnements modernes (Databricks, Spark, cloud public) pour garantir performance, robustesse et évolutivité.Dans le cadre de notre croissance, nous recherchons un Lead Data Engineer capable...

  • Data Scientist

    il y a 2 semaines


    Boulogne-Billancourt, France MP DATA Temps plein

    Passionné(e) par **les mobilités vertes** ? Rejoins notre Équipe d'experts dans la **data/l'IA appliquée aux domaine des transports écologiques** (plus d'une vingtaine de cas d'usages !). **MP DATA**, c'est une équipe de **70 experts** **Data (Data Scientists, Data Engineers, Data Architects, ML Engineers) **qui accompagne les plus grands groupes...

  • Data Scientist

    il y a 3 jours


    Boulogne-Billancourt, Île-de-France MP DATA Temps plein

    Nous recherchons un profilData Scientist IAGen 3Dpour renforcer notre équipe Data dans l'industrie. Vous interviendrez sur plusieures étapes des projets IA : sur l'exploration et la valorisation notamment.Vos Responsabilités InclurontAnalyser, structurer et valoriser des jeux de données internes et externes.Développer et fine tuner des modèles de...


  • Boulogne-Billancourt, Île-de-France MP DATA Temps plein

    Nous recrutons : Data Scientist LLM / GCP Confirmé(e)Boulogne-Billancourt | Secteur : IndustrieCDI – Équipe DataNous renforçons notre équipe Data et recherchons un(e)Data Scientist confirmé(e)spécialisé(e) enLLMetGCP. Vous interviendrez sur toutes les étapes clés de nos projets d'Intelligence Artificielle, de l'exploration à la mise en...

  • AI Data Engineer

    il y a 1 semaine


    Boulogne-Billancourt, Île-de-France Hilti Group Temps plein

    What's the role?We are looking for an AI Data Engineer to join Marketing & Sales Data Infrastructure team.In this role, you'll be working on use case driven by the AI Accelerator team.In the age of Generative AI, Agentic AI, and Model Context Protocols (MCP), the Data Engineer plays a pivotal role in enabling intelligent systems to reason, act, and adapt...

  • Data Engineer

    il y a 1 semaine


    Boulogne-Billancourt, Île-de-France Viseo Temps plein

    Rejoignez VISEO et vivez une aventure humaine, collective et stimulante Chez VISEO, nous plaçons l'Humain, le Collectif et le Challenge au cœur de notre ADN. Et si votre prochaine aventure professionnelle commençait ici ?Qui êtes-vous ?Si pour vous être Data Engineer Cloud Azure Confirmé F/H, c'est :Rejoindre une communauté d'experts passionnés par...

  • Data Engineer H/F

    il y a 1 jour


    Boulogne-Billancourt, France SIBYLONE Temps plein

    Dans le cadre du développement de notre activité Data, nous recherchons plusieurs Data Engineer. Le Data Engineer participe à la conception, la construction, le déploiement et le maintien en production d'architectures Big Data, ces dernières ayant pour objectif de permettre tant l'évolution que l'optimisation du système d'information décisionnel...

  • Data Engineer

    il y a 2 semaines


    Boulogne-Billancourt, Île-de-France Choisir le Service Public Temps plein

    Informations générales Organisme de rattachement Groupement interministériel de contrôle (GIC)   Référence Date de début de diffusion /01/2026 Date de parution /01/2026 Localisation Paris Intitulé long de l'offre DATA ENGINEER/ DATA OPS Date limite de candidature28/02/2026 Nature du contratCDD de 3 ans VersantFonction Publique de...

  • Data Engineer Nifi

    il y a 3 jours


    Boulogne-Billancourt, France LINCOLN Temps plein

    Description de l'entreprise Rejoindre LINCOLN, c’est rejoindre un cabinet de conseil reconnu pour son **expertise data depuis plus de 30 ans**, en proposant des prestations d’expertise, de conseil et d’accompagnement en Modern BI, Big Data et Science de la donnée. - Vous progresserez au sein d’une équipe de **380 experts de l’ingénierie**: -...