Senior Data Engineer

il y a 2 heures


LevalloisPerret, Île-de-France Doctolib Temps plein
What you'll do

At Doctolib, we're on a mission to transform healthcare through the power of AI. As a Senior Data Engineer, you'll play a key role in building and optimizing the data foundations within the AI Team to deliver safe, scalable, and impactful models.

You will join a dedicated team working on data infrastructure for LLM, VLM and RAG-based systems, powering our new AI Medical Companion.

Your work will ensure that our engineers and data scientists can train, evaluate, and deploy AI models efficiently on high-quality, well-structured, and compliant data.

Your responsibilities include but are not limited to:

  • Ensure high standards of data quality for AI model inputs.
  • Design, build, and maintain scalable data pipelines on Google Cloud Platform (GCP) for AI and machine learning use cases.
  • Implement data ingestion and transformation frameworks that power Retrieval systems and training datasets for LLMs and multimodal models.
  • Architect and manage NoSQL and Vector Databases to store and retrieve embeddings, documents, and model inputs efficiently.
  • Collaborate with ML and platform teams to define data schemas, partitioning strategies, and governance rules that ensure privacy, scalability, and reliability.
  • Integrate unstructured and structured data sources (text, speech,image, documents, metadata) into unified data models ready for AI consumption.
  • Optimize performance and cost of data pipelines using GCP native services (BigQuery, Dataflow, Pub/Sub, Cloud Storage, Vertex AI).
  • Contribute to data quality and lineage frameworks, ensuring AI models are trained on validated, auditable, and compliant datasets.
  • Continuously evaluate and improve our data stack to accelerate AI experimentation and deployment.
Who you are

You could be our next teammate if you have:

  • Master's or Ph.D. degree in Computer Science, Data Engineering, or a related field.
  • 5+ years of experience in Data Engineering, ideally supporting AI or ML workloads.
  • Strong experience with the GCP data ecosystem
  • Proficiency in Python and SQL, with experience in data pipeline orchestration (e.g., Airflow, Dagster, Cloud Composer).
  • Deep understanding of NoSQL systems (e.g., MongoDB) and vector databases (e.g., FAISS, Vector Search).
  • Experience designing data architectures for RAG, embeddings, or model training pipelines.
  • Knowledge of data governance, security, and compliance for sensitive or regulated data.
  • Familiarity with W&B / MLflow / Braintrust / DVC for experiment tracking and dataset versioning (extract snapshots, change tracking, reproducibility).
  • Familiarity with (Docker, Kubernetes) and CI/CD for data workflows.containerized environments
  • A collaborative mindset and passion for building the data foundations of next-generation AI systems.
What we offer
  • Free comprehensive health insurance for you and your children
  • Parent Care Program: additional leave on top of the legal parental leave
  • Free mental health and coaching services through our partner
  • For caregivers and workers with disabilities, a package including an adaptation of the remote policy, extra days off for medical reasons, and psychological support
  • Work from EU countries and the UK for up to 10 days per year, thanks to our flexibility days policy
  • Work Council subsidy to refund part of a sport club membership or a creative class
  • Up to 14 days of RTT
  • Lunch voucher with Swile card
The interview process
  • Recruiter Interview
  • Feature Building Interview
  • System Design Interview
  • Behavioral Interview
  • At least one reference check
Job details
  • Permanent position
  • Full-time
  • Paris, France
  • Hyrbid mode: 2 days remote per week
  • Start date: as soon as possible

If you would like to find out more about tech life at Doctolib, feel free to read our latest Medium blog articles

At Doctolib, we are committed to improving access to healthcare for everyone. This translates into our recruitment process. We evaluate candidates based solely on qualifications and motivation, without any form of discrimination.

The more diverse ideas are heard, the more our product will truly improve healthcare for all. You are welcome to apply to Doctolib, regardless of your gender, religion, age, sexual orientation, ethnicity, disability.

To ensure equal opportunities, we invite you to exclude personal information (e.g. pictures, age) from your applications. If you require any accommodation, please let us know for support during the hiring process.

Join us in building the healthcare we all dream of

All information provided is processed by Doctolib for application management. For data processing details, click here. Please contact for inquiries or to exercise your rights.


  • Tech Lead Data Engineer H/F

    il y a 2 heures


    Levallois-Perret, Île-de-France Free-Work Temps plein

    Nous recherchons un(e) Tech Lead Data Engineer capable de trouver des solutions innovantes et robustes à l'ensemble des problématiques Data.Vous aurez la charge de :Assurer la mise en œuvre de l'accès, du référencement et de la qualité de la donnéeAssurer l'industrialisation, la supervision et l'intégration des solutionsRédiger les normes de...

  • data engineer aws

    il y a 2 heures


    Levallois-Perret, Île-de-France Micropole Temps plein

    Rejoignez Micropole et devenez un #InnovativePeople MissionVous êtes convaincus que l'optimisation dupatrimoine data des entreprisesest la clé de leur performance ? Vous voulezaider les entreprisesà devenir plusagiles, et à améliorer leur niveau de performancegrâce à lapuissance du Cloud ?Vous voulez rendre les entreprisesdata intelligenteset...


  • Levallois-Perret, Île-de-France Devoteam Temps plein 42 000 € - 49 000 €

    Description de l'entreprise Le Data Engineering est essentiel pour façonner l'avenir de l'analyse de données. En construisant et en optimisant les pipelines de données, les data engineers permettent aux entreprises d'exploiter pleinement leur potentiel analytique. Leur rôle crucial dans la collecte, le stockage et le traitement des données garantit une...

  • Data Engineer

    il y a 2 heures


    Levallois-Perret, Île-de-France Devoteam Temps plein

    Description de l'entreprise Devoteam Data Driven est l'équipe spécialiste de la Data du Groupe Devoteam. Nous sommes 300 en France et notre ambition est d'accompagner les organisations qui ont décidé de placer les données au cœur de leur stratégie, les aidant à transformer la valeur de leurs données en succès durable. Description du poste Expert...

  • Data Engineer

    il y a 2 heures


    Levallois-Perret, Île-de-France SQLI Temps plein

    Company Description SQLI, leader européen de l'expérience client et de la transformation digitale, aide les grandes marques internationales à créer de la valeur grâce à l'innovation digitale. De la stratégie au déploiement des actifs technologiques de nos clients, nous imaginons et construisons des architectures robustes et performantes ainsi que des...

  • Modern data Stack

    il y a 2 heures


    Levallois-Perret, Île-de-France Devoteam Temps plein

    Rejoignez DevoteamSnowflakePartner, et Devenez un Expert de la Modern Data Stack Devoteam lance sa toute nouvelle entité dédiée à l'intégration de Snowflake chez ses clients, et nous recherchons les meilleurs talents pour la construire avec nous.Pourquoi cette opportunité est "The Place To Be" pour vous :Une expertise pointue et dédiée : En...

  • Stage AI engineer

    il y a 2 heures


    Levallois-Perret, Île-de-France Devoteam | Microsoft Partner Temps plein

    Présentation de la tribe Data & IA de Devoteam M CloudChezDevoteam M Cloud, la tribe Data & AI réunit les expertisesData Engineering,Data AnalysisetAI Engineeringpour porter les projets les plus innovants du cloud Microsoft. Experte des briquesAzure, Microsoft Fabric, Azure OpenAIetMicrosoft Foundry, l'équipe conçoit et industrialise des...

  • Senior Consultant

    il y a 2 heures


    Levallois-Perret, Île-de-France Devoteam Digital Impulse Temps plein

    Devoteam Digital Impulse est l'entité Consulting du Groupe Devoteam. Depuis 30 ans, nous accompagnons nos clients dans leur transformation digitale, de la stratégie à l'exécution, grâce à nos expertises et notre empreinte technologique auprès des hyperscalers.Nous sommes des Thinkers et des Doers audacieux, prêts à impulser le changement, à travers...

  • Data Analyst

    il y a 2 heures


    Levallois-Perret, Île-de-France Fondation Santé Service Temps plein

    Descriptif de l'entreprise Fondation reconnue d'utilité publique, Santé Service est le premier acteur européen de l'hospitalisation à domicile (HAD).Elle gère également des services de soins infirmiers à domicile (SSIAD), de la prestation de santé à domicile (PSAD) ainsi qu'un organisme de Formation, des activités de Conseil et un Institut de...

  • Manager Data Gouvernance

    il y a 2 heures


    Levallois-Perret, Île-de-France Forvis Mazars en France Temps plein

    Votre posteForvis Mazars est un groupe international d'audit, de fiscalité et de conseil. Avec + de collaborateurs présents dans une centaine de pays, nous faisons partie du Top 10 des cabinets mondiaux. Nous faisons des métiers sérieux... sans se prendre au sérieux. Faire partie de nos équipes, c'est avant tout assumer sa singularité et oser partager...