Big Data Developer

il y a 2 jours


Toulouse, Occitanie, France BWI Temps plein

Big Data Engineer

Company Description

BWI (Blue Water Intelligence), founded in June 2022 in Toulouse, France, specializes in monitoring global inland surface water reserves. By combining in-situ data, spaceborne observations, and machine learning, BWI enhances hydrological and hydrodynamical models to deliver data and insights to its clients. As a provider of scalable, subscription-based services, BWI focuses on improving hydrological forecasts to address climate change-induced water stress and improve water management.

BWI is at the forefront of cutting-edge hydrological research and innovation. We combine advanced mathematics, physics, and computational expertise to address complex challenges in hydrology, environmental science, and water resource management. We are seeking a dynamic and highly skilled Big Data Engineer to join our team, bridging the gap between science and software development.

Role Description

Location:
Paris or Toulouse (primarily onsite) — Professional English —
5+ years exp. minimum for application to be considered.

The Big Data Engineer will be responsible for building and operating data ingestion and processing pipelines for terabytes of weather and hydrological data, ensuring scalable, reproducible, and production‑grade delivery of model inputs and outputs.

Core responsibilities

  • Implement ingestion (batch/streaming), ELT/ETL steps, and data publishing workflows.
  • Handle scientific formats (netCDF, GRIB2) and columnar storage (Parquet); optimize I/O and algorithms.
  • Design storage with eventual‑consistency patterns (atomic publishes, manifests, versioned paths) and a metadata catalog.
  • Partition and parallelize workloads for distributed compute; compact small files and tune for cost/performance.
  • Build and run containerized services and orchestrated workflows; ensure observability, retries, idempotency, and runbooks.
  • Collaborate with scientists to define data models and validation rules.

Top paradigms & architectural patterns required

  • ELT-first with ETL where needed; streaming/micro-batch for low-latency sources.
  • Data lake + metadata catalogue (object storage), data model design for cataloguing.
  • Partitioned columnar storage & distributed data-parallel processing.
  • Idempotent, restartable workflows with orchestration.
  • Versioned datasets, atomic publish patterns, and catalogue as source of truth.
  • Observability-driven ops and infra-as-code.

Essential tools & technologies

  • Python (xarray, netCDF4, pyarrow), PySpark or Dask.
  • S3-compatible object storage; Parquet format.
  • PostgreSQL / PostGIS.
  • Kubernetes + Docker for deployment.
  • AWS (S3, EKS, EC2) or equivalent cloud; Terraform for IaC.

Must-haves

  • 3+ years of relevant experience building/operating large data pipelines, out of 5 minimum years of computer science-related experience in general (ideally as a full-stack/back-end/web software engineer).
  • Strong software engineering in Python with testing and CI/CD.
  • Practical experience with partitioning and parallelism.
  • Computer science education.
  • Understanding of architectural patterns in storing & processing large volumes of data.
  • Humility & eagerness to accept both: full hands-on coding position or technical leadership depending on circumstances.
  • Clear communication, teamwork, and analytical problem-solving.
  • Proficient in UNIX/Linux environments.

Nice-to-haves

  • Hydrology, meteorology, remote-sensing, or space-ground-segment experience.
  • STAC, GeoTIFF, PostGIS, Numba/Cython performance tuning.
  • Understanding of low-level subjects (memory management, HTTP, S3 implementation).
  • Willingness to develop managerial skills.

  • ingé. Big Data

    il y a 2 jours


    Toulouse, Occitanie, France W EXECUTIVE FRANCE SAS Temps plein

    Bonjour, je recherche pour l'un de mes clients un(e) ingé. BIG DATA. Skills : Big Data - Red Hat Linux - anglaisMission : gérer et maintenir les plateformes de données massivesoptimiser les performances des systèmes de donnéesassurer la qualité et la sécurité des donnéescollaborer avec les équipes de développement pour intégrer les solutions...

  • Ingénieur Big Data

    il y a 5 jours


    Toulouse, Occitanie, France Experis France Temps plein

    Présentation de l'entreprise :L'Humain, l'Expertise et l'Innovation, voilà ce qui caractérise l'ADN d'Experis France, ESN de ManpowerGroup reconnue Top Employer 2025. Présente dans 28 pays avec 3800 Talents en France, Experis se positionne comme un acteur incontournable et innovant sur le marché des ESN. Nous proposons une offre intégrée alliant...

  • Business Manager Data

    il y a 2 jours


    Toulouse, Occitanie, France TRIMANE | Expert BI et Big Data Temps plein

    Fondée en 2005, TRIMANE est un cabinet de conseil et une société de service spécialisée en Data Intelligence (Data & IA), notre mission est de créer de la valeur à partir des données disponibles dans les entreprises, en s'appuyant sur des approches algorithmiques innovantes, des méthodologies spécifiques et de nombreuses technologies.En tant que...

  • Data Engineer

    il y a 1 semaine


    Toulouse, Occitanie, France Craftman data Temps plein

    Nous recherchons un Data Engineer expérimenté (+4 ans) pour renforcer une équipe d?analyse marché dédiée aux données de réservation, partenaires et concurrence. La mission consiste à produire et optimiser des dashboards PowerBI (datasets, modélisation, visualisation), industrialiser les pipelines data et contribuer à l?exploitation analytique de...


  • Toulouse, Occitanie, France CONCRETIO SERVICES Temps plein

    VOS RESPONSABLES PRINCIPALES :RUN & Administration avancéeMaintenir les plateformes Hadoop, Kafka, Elastic, NiFi?Assurer le support N2/N3 et participer aux astreintes.Gérer les incidents majeurs, le troubleshooting, les actions correctives.Intervenir en HNO en cas de besoin (24/7 en rotation).Performance & optimisationDiagnostiquer les lenteurs (HDFS,...

  • Tech Lead Big Data F/H

    Il y a 22 minutes


    Toulouse, Occitanie, France Sécurité sociale Temps plein

    Tech Lead Big Data F/HPublié aujourd'hui • Date limite de candidature 31/12/2025CDIToulousede € à € par anNIVEAU VATélétravail possibleNVHADD113148URSSAF CAISSE NATIONALEAvec vous, agir pour une protection sociale durable et solidaireTravailler au sein du réseau des URSSAF, c'est faire partie d'un collectif qui s'engage où chacun met ses...

  • Data Engineer Confirmé

    il y a 2 semaines


    Toulouse, Occitanie, France CoperBee Temps plein

    du posteCoperBee, Join the digital hiveBienvenue dans notre univers IT où l'innovation est notre moteur quotidien, la convivialité est notre langage commun, et où ensemble, nous façonnons l'avenir technologique pour offrir une expérience exceptionnelle à nos clients. Rejoins une équipe où chaque idée compte et où l'humain est au cœur de notre...

  • Data Engineer GCP

    il y a 2 jours


    Toulouse, Occitanie, France DGTL Performance Temps plein

    DGTL / Signe + est le facilitateur pour tous les acteurs qui recherchent des ressources ou des missions DATA.Spécialiste du marché Data et BI, nous intervenons dans toute la France comme à l'étranger ; en sous-traitance, pré-embauche, recrutement, portage commercial, portage salarial, etc.Depuis 2018, nous accompagnons nos clients avec proximité, juste...

  • Data engineer H/F

    il y a 4 heures


    Toulouse, Occitanie, France Kicklox Temps plein

    L'offreSecteursAutomobile, Aéronautique, Spatial, Défense & Sécurité, Ferroviaire, Télécommunications, Energie, Services & Systèmes d'Informations, Chimie / Pétrochimie, Digital & E-Commerce, Naval, Machines & Industrie Lourde, Pharmaceutique / Biotechnologie, Banque & Assurance, BTPDescription De L'offreNous recrutons pour l'un de nos clients un...

  • Lead Data Engineer

    il y a 2 jours


    Toulouse, Occitanie, France Ippon Technologies Temps plein

    Qui sommes-nous ? Ippon, c'est l'énergie du collectif au service de la technologie Nous sommes un cabinet de conseil et d'expertise technique. Nos équipes ont pour leitmotive de transformer des idées innovantes en solutions logicielles de haute qualité avec un focus particulier sur la valeur apportée aux utilisateurs. Située en centre ville, notre...