Lead Data Engineer
il y a 4 jours
Reconnue comme l'une des start-ups les plus innovantes dans l'écosystème de la e-santé, Bioserenity développe des dispositifs médicaux connectés, des solutions de coordination des soins et des algorithmes d'IA de pointe. Rejoindre Bioserenity, c'est contribuer à des projets à fort impact, à l'intersection des défis médicaux et des technologies innovantes.
Notre équipe Data Science (plus de 15 membres) développe des algorithmes IA de diagnostic pour la neurologie et la médecine du sommeil. Au sein de cette équipe, vous travaillerez sur un pipeline de dispositifs médicaux marqués CE, faisant le lien entre la recherche et les applications cliniques concrètes.
MissionsEn tant que Lead Technique vous collaborerez quotidiennement avec un data ingénieur, des data scientists et des équipes interfonctionnelles (Dev/Ops, IoT…). Votre mission principale : créer, maintenir et optimiser une plateforme de stockage de données qui alimente nos initiatives en matière d'IA.
Gestion et optimisation de la plateforme de données- Normaliser et structurer les données : homogénéiser les formats, concevoir des ontologies et appliquer les meilleures pratiques afin de garantir la qualité et la cohérence des données.
- Amélioration continue de la plateforme : mettre l'accent sur la sécurité, l'évolutivité, l'optimisation des coûts et les tableaux de bord (surveillance, traçabilité).
- Gestion des versions des données : mettre en place des systèmes permettant de suivre l'évolution des ensembles de données et d'assurer une traçabilité complète (essentiel pour la conformité des dispositifs médicaux).
- Conception et maintenance de pipelines ETL automatisés pour l'ingestion, le nettoyage et la transformation des données de santé.
- Respect strict des normes RGPD, anonymisation et pseudonymisation des données sensibles, documentation exhaustive des processus.
- Collaboration avec les équipes métiers pour intégrer de nouvelles sources de données et répondre aux besoins évolutifs.
- Création et gestion de datasets versionnés pour permettre des expérimentations reproductibles.
- Assurer un transfert rapide et sécurisé des jeux de données massifs, avec un focus sur la performance et la fiabilité.
- Adaptation de la plateforme aux besoins des data scientists : formatage, structuration, enrichissement des métadonnées, et support technique pour faciliter leurs travaux d'analyse et de modélisation.
- Maintenance et amélioration des pipelines CI/CD pour garantir des déploiements fluides et sécurisés.
- Déployer des outils de surveillance (tableaux de bord, alertes) pour garantir la stabilité de l'ETL.
- Industrialiser les déploiements des infrastructures data et des outils associés
- Conseil technique : assurer la cohérence entre les différents modules du projet et fournir un accompagnement technique aux collaborateurs plus juniors (révision du code, meilleures pratiques, conseils en matière d'architecture).
L'équipe Data gère les projets de manière end-to-end (besoins utilisateur, architecture, développement, QA, sécurité, déploiement, ops) avec une liberté technologique pour adapter les solutions.
Compétences et expérience
Expertise technique- Programmation : Python (niveau avancé), Git/GitLab CI.
- Cloud et Big Data : AWS (API Gateway, Cognito, Lambda, S3, SageMaker, Glue, Athena, ECS), Delta Lake, Databricks.
- Orchestration : Airflow, Terraform.
- Bases de données : MongoDB ; expérience avec des solutions de stockage à grande échelle.
- Standards du web : API REST, protocoles HTTP/ HTTPS.
- Rigueur scientifique et esprit orienté vers la résolution de problèmes.
- Capacité à combler les écarts entre la science des données, le développement/les opérations et les ingénieurs logiciels.
- Capacité à créer une documentation technique claire et conforme aux normes.
- Plus de 7 ans d'expérience en tant qu'ingénieur de données, dont plus de 2 ans en tant que responsable technique/senior.
- Connaissance des enjeux de cybersécurité et de conformité (essentielle pour les données médicales).
- Maîtrise de l'anglais technique (l'équipe et les parties prenantes sont internationales).
- MLOps: Expérience pratique de la gestion du cycle de vie complet du ML, y compris l'orchestration, le déploiement et la surveillance des pipelines.
- Connaissance des certifications CE/FDA pour les logiciels/algorithmes.
- Données de santé: expérience pratique des signaux électrophysiologiques (EEG, ECG, EMG) ou des données cliniques.
- Infrastructure : Linux, conteneurisation (Docker, ECR).
- Impact : Travaillez sur des technologies médicales qui changent la vie et ont des résultats directs sur les patients.
- Innovation : façonner l'avenir de la neurologie et du diagnostic du sommeil grâce à l'IA.
- Croissance : Prendre des décisions techniques clés au sein d'une entreprise de 200+ collaborateurs, alliant agilité startup et expertise sectorielle.
- Stack technique : Outils modernes (voir ci-dessus) avec une flexibilité pour proposer de nouvelles solutions.
Bioserenity is recognized as one of the most innovative startups in the digital health ecosystem, developing connected medical devices, care coordination solutions, and cutting-edge AI algorithms. Joining Bioserenity means contributing to high-impact projects at the intersection of medical challenges and advanced technology.
Our Data Science team (15+ members) drives product development by designing diagnostic algorithms (signal processing, deep learning) for neurology and sleep medicine. As part of this team, you'll work on a CE-marked medical device pipeline, bridging research and real-world clinical applications.
Key responsabilitiesAs Lead Data Engineer, you'll collaborate daily with a Data Engineer, Data Scientists, and cross-functional teams (Dev/Ops, IoT, Hardware). Your core mission: build, maintain, and optimize a data lake platform that powers our AI initiatives.
Data platform management & optimization- Standardize and structure data: homogenize formats, design ontologies, and enforce best practices to ensure data quality and consistency.
- Continuous platform improvement: Focus on security, scalability, cost optimization, and metadata/dashboarding (monitoring, traceability).
- Data versioning: Implement systems to track dataset evolution and ensure full traceability (critical for medical device compliance).
- Design and maintain automated ETL pipelines for ingestion, cleaning, and transformation of healthcare data (EEG, clinical records, etc.).
- Ensure strict GDPR compliance: anonymize/pseudonymize sensitive data and document all processes.
- Partner with business teams to integrate new data sources and adapt to evolving needs.
- Create and manage versioned datasets to support reproducible experiments.
- Optimize large-scale data transfers (performance, reliability) for ML modeling.
- Adapt the platform to Data Scientists' needs: formatting, metadata enrichment, and technical support.
- Maintain and enhance CI/CD pipelines for seamless, secure deployments.
- Deploy monitoring tools (dashboards, alerts) to ensure ETL stability.
- Industrialize data platform deployments and associated tools.
- Technical guidance: ensure coherence across project modules and provide technical mentorship to junior engineers (code reviews, best practices, architectural guidance).
Our projects are end-to-end owned (user needs architecture deployment ops), with open technological choices to fit evolving challenges.
Skills & ExperienceTechnical Expertise:
- Programming: Python (advanced), Git/GitLab CI.
- Cloud & Big Data: AWS (API Gateway, Cognito, Lambda, S3, SageMaker, Glue, Athena, ECS), Delta Lake, Databricks.
- Orchestration: Airflow, Terraform.
- Databases: MongoDB; experience with large-scale storage solutions.
- Web Standards: REST APIs, HTTP.
- Scientific rigor and problem-solving mindset.
- Bridge gaps between Data Science, Dev/Ops, and software engineers.
- Ability to create clear, compliance-ready technical documentation.
- 7+ years as a Data Engineer, including 2+ years as a Senior/Tech Lead.
- Cybersecurity awareness (critical for medical data).
- Fluent technical English (team and stakeholders are international).
- MLOps: Hands-on experience with end-to-end ML lifecycle management, including pipeline orchestration, deployment, monitoring.
- Regulatory Knowledge: Familiarity with CE/FDA certification for software/algorithms.
- Healthcare Data: Hands-on experience with electrophysiological signals (EEG, ECG, EMG) or clinical data.
- Infrastructure: Linux, containerization (Docker, ECR).
- Impact: Work on life-changing medical technologies with direct patient outcomes.
- Innovation: Shape the future of neurology and sleep diagnostics with AI.
- Growth: Lead technical decisions in a multidisciplinary, 200+ person company with a startup mindset.
- Tech Stack: Modern tools (see above) with flexibility to propose new solutions.
-
Lead Data Engineer
il y a 2 semaines
Paris, Île-de-France Collective Temps pleinTu es passionné(e) par les données et tu aimes concevoir des architectures scalables et performantes ? Piloter des équipes techniques et transformer des données brutes en insights stratégiques t'enthousiasme ?Rejoins skiils en tant que Lead Data Engineer et prends la responsabilité des projets data les plus ambitieux dans le secteur Retail Tes...
-
tech lead data engineer
il y a 2 semaines
Paris, Île-de-France UCASE CONSULTING Temps pleindu posteDans le cadre d?un projet stratégique à forte visibilité pour l?un de nos clients grands comptes, nous recherchons un Tech Lead Data Engineer Senior.Vous interviendrez au sein d?une équipe Data dynamique afin d?accompagner, challenger et faire monter en compétences les Data Engineers, tout en garantissant la qualité et la performance des...
-
Data Engineer
il y a 3 jours
Paris, Île-de-France MP DATA Temps pleinEn tant que Data Engineer Senior, vous jouerez un rôle clé dans la construction, l'optimisation et la fiabilisation de nos pipelines de données à grande échelle, au cœur de notre plateforme analytique. Votre expertise sur Databricks et l'environnement Spark sera essentielle pour garantir des traitements performants, sécurisés et scalables.Vos...
-
Lead Data Engineer
il y a 1 semaine
Paris, Île-de-France Theodo Temps pleinL'histoire du groupe Theodo et son succès Le groupe Theodo accompagne depuis 2009 les entreprises innovantes dans la conception, le développement et le déploiement de produits digitaux ingénieux, en tirant parti du meilleur de la technologie et de l'approche Lean. Theodo connait une croissance exceptionnelle depuis 15 ans : nos équipes rassemblent plus...
-
Lead Python Backend Engineer
il y a 2 jours
Paris, Île-de-France Data Theorem Temps pleinData Theorem is an exciting company focused on creating a more secure world for data. Rooted in a strong engineer first culture, every employee has an impact on product and direction. We are searching for exceptional talent pursuing an opportunity to grow and take ownership of the projects that resonate most with them.As a Lead Python Backend Engineer, you...
-
Data Engineer Expérimenté
il y a 2 jours
Paris, Île-de-France Mp Data Temps pleinNous recherchons un(e) Data Engineer expérimenté(e) pour intervenir sur la mise en production, la fiabilisation et l'évolution d'une plateforme data moderne basée sur AWS, Spark et Dataiku.Vous participerez activement à la construction et l'optimisation des environnements de traitement de données à grande échelle, en lien étroit avec les équipes...
-
Lead Data Engineer
il y a 4 jours
Paris, Île-de-France Coders Connect Temps pleinCoders Connect is proud to be partnering with Sanofi to support the growth of their AI Workflow Engineering team, a cutting-edge group leading global initiatives in intelligent automation and GenAI deployment.Based in Paris, this role offers the chance to work on a truly unique project, deploying AI agents at scale across an international enterprise.As a...
-
Lead Data Engineer
il y a 3 jours
Paris, Île-de-France Lucky Cart Temps pleinÀ propos de Lucky cartLucky Cart est une MarTech française installée au cœur du 2ème arrondissement de Paris.Sa mission : Powering Smart Commerce. Comment ? En combinant le potentiel des données de transaction first-party avec la puissance du e-retail media.Lucky Cart utilise la data science et ses algorithmes propriétaires de machine learning pour...
-
Lead Data Engineer
il y a 3 jours
Paris, Île-de-France Sas Lucky Cart Temps pleinDescription de l'offre d'emploi À propos de Lucky cartLucky Cart est une MarTech française installée au cœur du 2ème arrondissement de Paris.Sa mission : Powering Smart Commerce. Comment ? En combinant le potentiel des données de transaction first-party avec la puissance du e-retail media.Lucky Cart utilise la data science et ses algorithmes...
-
Data Engineer Expérimenté
il y a 3 jours
Paris, Île-de-France MP DATA Temps pleinNous recherchons un(e)Data Engineer expérimenté(e)pour intervenir sur lamise en production, la fiabilisation et l'évolutiond'une plateforme data moderne basée surAWS, Spark et Dataiku.Vous participerez activement à laconstruction et l'optimisationdes environnements de traitement de données à grande échelle, en lien étroit avec les équipes Data...