Senior Data Engineer

Il y a 2 mois


Greater Paris Metropolitan Region, FR Yseop Temps plein

Yseop is recognized as the world-leading AI software company and pioneer in Generative AI. Yseop is the leader in Generative AI for regulated industries, changing the way content automation solutions are delivered with a human-centric, AI platform. Yseop is reimagining the future of scientific writing to get medicine into the hands of those who need it faster.

With a suite of industry-specific applications and cutting-edge hybrid Natural Language Generation (NLG) technology that blends symbolic, machine learning, and LLM techniques, Yseop ensures that even the most demanding content automation tasks are met with ease, scalability and application security across the entire enterprise


At Yseop, our mission is to support companies through this digital transformation. We believe that our cutting-edge artificial intelligence technology allows businesses to increase the efficiency of their operations and shift employee time spent on tedious tasks to more value-added and creative work.

So join Yseop and be part of an amazing adventure that is only at its beginning


Our corporate values drive our daily job:


  • Team : We care about each other, inspire each other and encourage strong team spirit
  • Trust: Trust is foundational. It empowers our employees and customer relationships.
  • Innovation: We love to innovate in ways that delight our customers
  • Customer Centric: We exceed customer expectations and aspire to create true partnerships.
  • Fast: We practice agility, prioritize simplicity and we are proactive


We are building a diverse and inclusive team - and we need your help

So join us to build tomorrow, today,


We are seeking a skilled Cloud-based Data Engineer to design, develop, and enhance data ingestion, annotation, and service pipelines in a cloud environment, primarily on AWS. This role involves building and maintaining robust infrastructures capable of managing and processing large-scale data sets (ranging from tens to thousands of gigabytes) in the cloud, supporting data annotation, analysis, and enabling semi-supervised annotation and active learning. Experience with large-scale databases, distributed data systems, and cloud-native architectures will be essential.


Your mission


Key Responsibilities


Architect and Develop Cloud Infrastructure: Design, build, and maintain scalable, cloud-native data infrastructures using AWS to handle large datasets. This includes ensuring data pipelines can handle increasing volumes while maintaining high performance.

Data Ingestion and Processing Pipelines: Create and optimize pipelines for efficient ingestion, transformation, and storage of structured, semi-structured, and unstructured data. This includes integrating AWS services and distributed data frameworks to automate data workflows and optimize pipelines for performance, accuracy, and robustness. Additionally, it involves implementing CI/CD pipelines for data versioning.

Performance Optimization and Monitoring: Continuously monitor the performance of data processing along with model serving systems, identifying areas for optimization in terms of runtime, accuracy, and scalability. Use AWS tools to provide real-time monitoring, alerts, and proactive system improvements.

Data Security and Compliance: Ensure that data pipelines and models adhere to the highest security standards, including implementing best practices for encryption, access controls, and monitoring against unauthorized access or data injection risks.


Core Mission


Collaborative Teamwork: Work collaboratively with cross-functional teams (R&D engineers, linguists, machine learning engineers, and software developers) to ensure the data infrastructure supports a diverse range of models and workflows. Facilitate smooth collaboration through well-documented, reproducible processes.

Support Data Annotation and Active Learning: Implement tools and systems to support data annotation, semi-supervised learning, and active learning workflows, ensuring scalability and user-friendly access to large datasets. Works closely with R&D engineers to support the end-to-end lifecycle of machine learning models, from data versioning and model experimentation to model serving.

Support Scalable and Secure Model Deployment: Work closely with MLOPs engineers to ensure that models are deployed securely and efficiently in production environments. Models should scale seamlessly as new data and additional classes or features are introduced.



Your profile


You will be successful if you are


Proficient in Python for building cloud-native data pipelines and workflows. Familiarity with Java or Scala.

Cloud Technologies (AWS): Proficiency in core AWS services such as S3, EC2, Lambda, and RDS. Experience with data processing tools like AWS Glue and EMR, as well as orchestration with Kubernetes, containerization with Docker, and Infrastructure as Code tooling.

Data Engineering: Expertise in building cloud-native data pipelines, with a strong understanding of ETL/ELT processes and distributed data systems. Proficiency in data tools (Data streaming, SQL and NoSQL databases, etc.). Knowledge of some ML orchestration and reporting tools (MLflow, etc.) is a plus.

Database Management: Hands-on experience with AWS-managed databases and NoSQL/graph databases for handling diverse data structures. Understanding or hands-on experience with vector databases or vector search is a plus.

Security and Performance: Strong understanding of AWS security best practices and performance optimization techniques to ensure scalable, high-performance systems.

In summary, we are looking for a cloud-based data engineering expert with extensive AWS experience, who can build scalable data and ML pipelines, optimize performance, and ensure security across a robust, cloud-native infrastructure.


Benefits to join Yseop?


  • A very strong company culture
  • Hybrid work policy
  • 1 day per year offered to do volunteer work in an association
  • Birthday Off and Mental Health Day
  • An on- boarding tailored made to simplify your integration and meet all the teams
  • Team Building every quarter



Yseop is an equal opportunity employer. We believe diversity is a strength and fosters innovation. We are committed to enabling everyone to feel included and valued at the workplace. All qualified applicants will receive consideration for employment without regard to age, color, family, gender identity, marital status, national origin, physical or mental disability, sex (including pregnancy), sexual orientation, social origin, or any other characteristic protected by applicable laws.


  • Data Engineer

    il y a 3 semaines


    Greater Paris Metropolitan Region, FR Devoteam Data Driven Temps plein

    Devoteam Data Driven recherche un(e) Data Engineer talentueux(se) pour rejoindre notre équipe dynamique et contribuer à des projets data innovants.Présentation de Devoteam GroupeDevoteam est un leader du conseil en stratégie digitale, plateformes technologiques et cybersécurité. Présent dans 25 pays en Europe et au Moyen-Orient, le groupe compte plus...

  • Data Visualization Engineer

    il y a 3 semaines


    Greater Paris Metropolitan Region, FR Devoteam Data Driven Temps plein

    Devoteam Data Driven recherche des talents passionnés pour rejoindre notre équipe Modern Analytics et contribuer à la démocratisation de l'analyse de données au sein des organisations de nos clients.Présentation de Devoteam GroupeDevoteam est un leader du conseil en stratégie digitale, plateformes technologiques et cybersécurité. Présent dans...

  • Data & AI engineer

    il y a 3 semaines


    Greater Paris Metropolitan Region, FR Harnham Temps plein

    DATA & AI ENGINEERPARIS (75) - REMOTEUP TO 65K€ FIXEPython - SQL - LLM - DockerL'ENTREPRISEUne entreprise qui développe un logiciel pour l'opinion massif recherche un(e) Data & AI Engineer expérimenté(e) et surtout motivé(e) à rejoindre son équipe data et IA ! L'entreprise mets au coeur de son offre l'IA et souhaite agrandir son...

  • Senior Data Engineer

    Il y a 5 mois


    Greater Paris Metropolitan Region, FR InVivo Digital Factory Temps plein

    InVivo Digital Factory est le pôle digital du groupe InVivo, 1er groupe coopératif agricole français. Sa mission depuis 2018 : piloter et exécuter la transformation digitale du groupe et de l’ensemble de ses métiers BtoB et BtoC stratégiques (Agriculture, Vin, Retail / Jardinerie et distribution alimentaire et Malterie).Parmi ces grands projets de...


  • Greater Paris Metropolitan Region, FR Elevate | Agence Data & Technologies Marketing Temps plein

    Dans le cadre de la forte croissance d’Elevate, nous recherchons un.e Consultant.e Product Owner Data Senior afin de renforcer l’équipe et d’accompagner nos clients sur des problématiques techniques et business liées à la data.Après formation interne à notre méthodologie et à notre offre, vous aurez l’occasion de prendre la tête d’équipes...

  • Data Analyst engineer

    il y a 3 semaines


    Greater Paris Metropolitan Region, FR Devoteam Data Driven Temps plein

    Devoteam Data Driven recherche des talents passionnés pour rejoindre notre équipe Modern Analytics et contribuer à la démocratisation de l'analyse de données au sein des organisations de nos clients.Présentation de Devoteam GroupeDevoteam est un leader du conseil en stratégie digitale, plateformes technologiques et cybersécurité. Présent dans...

  • Data Engineer Azure

    Il y a 3 mois


    Greater Paris Metropolitan Region, FR Visian Temps plein

    Visian, Société de conseil spécialisée en innovation, design produit, gestion de projet IT et développement Data, recherche un Data Engineer pour un de ses clients dans le domaine du transport.Missions :Mener les projets d’intégration (temps réel) et data (big data & insights)Comprendre, analyser et proposer des solutions techniques répondant aux...

  • Analytics Engineer

    il y a 3 semaines


    Greater Paris Metropolitan Region, FR Devoteam Data Driven Temps plein

    Devoteam Data Driven recherche des talents passionnés pour rejoindre notre équipe Modern Analytics et contribuer à la démocratisation de l'analyse de données au sein des organisations de nos clients.Présentation de Devoteam GroupeDevoteam est un leader du conseil en stratégie digitale, plateformes technologiques et cybersécurité. Présent dans...

  • Business Manager Data

    il y a 3 semaines


    Greater Paris Metropolitan Region, FR Elevate | Agence Data & Technologies Marketing Temps plein

    Nous recherchons un.e Business Manager Data & Tech ✨Dans le cadre de la forte croissance d’Elevate et de notre practice Data & Tech, nous cherchons un.e Business Manager afin d’accompagner nos clients sur des problématiques techniques et business liées à la data.Opérant pour des comptes internationaux et de secteurs très variés (automobile,...


  • Greater Paris Metropolitan Region, FR Mobiskill | WEFY Group Temps plein

    L'entreprise :Il s'agît d'un moteur de recherche français qui met l’accent sur la confidentialité des utilisateurs et la protection de leurs données personnelles en garantissant une navigation respectueuse de la vie privée.Ils sont à la recherche d'un profil en R&D très sénior pour venir travailler sur des sujets de NLP, ranking et...

  • Data Engineer Confirmé.e

    il y a 3 semaines


    Greater Paris Metropolitan Region, FR SoyHuCe|a JAKALA company Temps plein

    SoyHuCe - Le centre d’excellence opérationnel en Data / IA et Web de JAKALANos équipes combinent les expertises nécessaires à la création de solution data clé-en-main : collecte, traitement, analyse, algorithmie, exploitation, intégration et UX/UI.Elles répondent ainsi à des cas d’usage variés, dans de multiples secteurs : retail, énergie,...

  • Data Engineer H/F

    il y a 3 semaines


    Greater Paris Metropolitan Region, FR Exakis Nelite Temps plein

    Exakis Nelite, entité du groupe Magellan Partners, est le premier partenaire pure-player Microsoft indépendant en France avec l’ambition de devenir le premier partenaire Européen et en Afrique Francophone avec sa forte présence au Maroc.Nés du rapprochement de 2 leaders spécialistes de l’intégration des solutions Microsoft, nous allions expertise...

  • Senior Solidity Engineer

    il y a 2 semaines


    Greater Paris Metropolitan Region, FR Amicus Temps plein

    Senior Solidity Engineer - Up to $700K total compensationWe have partnered with a rapidly growing Layer 1 blockchain start-up who are seeking a Senior Solidity Engineer to take ownership of their core smart contract software for integrating and interacting with their network.Key Responsibilities:Write smart contracts for rollup EVMS.Design and build the L1...

  • Senior Data Manager

    il y a 3 semaines


    Greater Paris Metropolitan Region, FR AXA Group Operations Temps plein

    Within GO Organization, Processes and Data, Chief Data Officer for Group Operations is in charge of driving internal AXA GO Data & AI transformation.The focus of this job position to support Data & AI governance and data management activities across AXA GO Business Data Domains as well as delivering data contributions to transformation projects involving...

  • Data Engineer H/F

    Il y a 5 mois


    Greater Paris Metropolitan Region, FR Wewyse Temps plein

    Wewyse est un cabinet de conseil spécialisé en Data et en Intelligence Artificielle. C'est aussi et surtout une communauté de passionnés partageant l'ambition de grandir ensemble et d'ouvrir le champ des possibles dans leurs domaines.Si vous pensez que la Data et l'Intelligence Artificielle ont beaucoup à offrir au monde de demain, et si...


  • Greater Paris Metropolitan Region, FR Eulidia Temps plein

    Vous êtes passionné/e par la data et prêt/e pour une nouvelle aventure dans une entreprise 100% data-driven ? Rejoignez Eulidia et embarquez dans une équipe de choc où l’excellence, le sens du service et la pluridisciplinarité sont les maitres mots! Nous recrutons : Data EngineerVos missions, si vous les acceptez :Construire des pipelines de données...

  • Data Engineer confirmé

    Il y a 3 mois


    Greater Paris Metropolitan Region, FR Beelix Temps plein

    Qui sommes-nous ?Depuis 2016, nous accompagnons nos clients sur des problématiques de Product Management, Data et Design Thinking.Beelix contribue aux grandes avancées dans les secteurs suivants : Automobile⚡ EnergieMédias & TélécomsLuxe & Retail✈️Banque, Finance & AssuranceDéfenseAujourd’hui, Beelix compte plus de 200 collaborateurs motivés...

  • Business analyst engineer

    il y a 3 semaines


    Greater Paris Metropolitan Region, FR Devoteam Data Driven Temps plein

    Devoteam Data Driven recherche des talents passionnés pour rejoindre notre équipe Modern Analytics et contribuer à la démocratisation de l'analyse de données au sein des organisations de nos clients.Présentation de Devoteam GroupeDevoteam est un leader du conseil en stratégie digitale, plateformes technologiques et cybersécurité. Présent dans...

  • DevOps Engineer AWS Senior

    il y a 3 semaines


    Greater Paris Metropolitan Region, FR SoyHuCe|a JAKALA company Temps plein

    SoyHuCe - Le centre d’excellence opérationnel en Data / IA et Web de JAKALANos équipes combinent les expertises nécessaires à la création de solution data clé-en-main : collecte, traitement, analyse, algorithmie, exploitation, intégration et UX/UI.Elles répondent ainsi à des cas d’usage variés, dans de multiples secteurs : retail, énergie,...


  • Greater Paris Metropolitan Region, FR Worldline Temps plein

    Senior DPO (F/M)[Paris – La Defense] This is WorldlineWe are the innovators at the heart of the payment technology sector, shaping how the world conducts transactions. The solutions our team implements today are the outcomes of the growth of millions of businesses of tomorrow, ranging from your local coffee shop to startups and international banks, from...