Big Data Developer
il y a 2 jours
Big Data Engineer
Company Description
BWI (Blue Water Intelligence), founded in June 2022 in Toulouse, France, specializes in monitoring global inland surface water reserves. By combining in-situ data, spaceborne observations, and machine learning, BWI enhances hydrological and hydrodynamical models to deliver data and insights to its clients. As a provider of scalable, subscription-based services, BWI focuses on improving hydrological forecasts to address climate change-induced water stress and improve water management.
BWI is at the forefront of cutting-edge hydrological research and innovation. We combine advanced mathematics, physics, and computational expertise to address complex challenges in hydrology, environmental science, and water resource management. We are seeking a dynamic and highly skilled Big Data Engineer to join our team, bridging the gap between science and software development.
Role Description
Location:
Paris or Toulouse (primarily onsite) — Professional English —
5+ years exp. minimum for application to be considered.
The Big Data Engineer will be responsible for building and operating data ingestion and processing pipelines for terabytes of weather and hydrological data, ensuring scalable, reproducible, and production‑grade delivery of model inputs and outputs.
Core responsibilities
- Implement ingestion (batch/streaming), ELT/ETL steps, and data publishing workflows.
- Handle scientific formats (netCDF, GRIB2) and columnar storage (Parquet); optimize I/O and algorithms.
- Design storage with eventual‑consistency patterns (atomic publishes, manifests, versioned paths) and a metadata catalog.
- Partition and parallelize workloads for distributed compute; compact small files and tune for cost/performance.
- Build and run containerized services and orchestrated workflows; ensure observability, retries, idempotency, and runbooks.
- Collaborate with scientists to define data models and validation rules.
Top paradigms & architectural patterns required
- ELT-first with ETL where needed; streaming/micro-batch for low-latency sources.
- Data lake + metadata catalogue (object storage), data model design for cataloguing.
- Partitioned columnar storage & distributed data-parallel processing.
- Idempotent, restartable workflows with orchestration.
- Versioned datasets, atomic publish patterns, and catalogue as source of truth.
- Observability-driven ops and infra-as-code.
Essential tools & technologies
- Python (xarray, netCDF4, pyarrow), PySpark or Dask.
- S3-compatible object storage; Parquet format.
- PostgreSQL / PostGIS.
- Kubernetes + Docker for deployment.
- AWS (S3, EKS, EC2) or equivalent cloud; Terraform for IaC.
Must-haves
- 3+ years of relevant experience building/operating large data pipelines, out of 5 minimum years of computer science-related experience in general (ideally as a full-stack/back-end/web software engineer).
- Strong software engineering in Python with testing and CI/CD.
- Practical experience with partitioning and parallelism.
- Computer science education.
- Understanding of architectural patterns in storing & processing large volumes of data.
- Humility & eagerness to accept both: full hands-on coding position or technical leadership depending on circumstances.
- Clear communication, teamwork, and analytical problem-solving.
- Proficient in UNIX/Linux environments.
Nice-to-haves
- Hydrology, meteorology, remote-sensing, or space-ground-segment experience.
- STAC, GeoTIFF, PostGIS, Numba/Cython performance tuning.
- Understanding of low-level subjects (memory management, HTTP, S3 implementation).
- Willingness to develop managerial skills.
-
ingé. Big Data
il y a 2 jours
Toulouse, Occitanie, France W EXECUTIVE FRANCE SAS Temps pleinBonjour, je recherche pour l'un de mes clients un(e) ingé. BIG DATA. Skills : Big Data - Red Hat Linux - anglaisMission : gérer et maintenir les plateformes de données massivesoptimiser les performances des systèmes de donnéesassurer la qualité et la sécurité des donnéescollaborer avec les équipes de développement pour intégrer les solutions...
-
Ingénieur Big Data
il y a 5 jours
Toulouse, Occitanie, France Experis France Temps pleinPrésentation de l'entreprise :L'Humain, l'Expertise et l'Innovation, voilà ce qui caractérise l'ADN d'Experis France, ESN de ManpowerGroup reconnue Top Employer 2025. Présente dans 28 pays avec 3800 Talents en France, Experis se positionne comme un acteur incontournable et innovant sur le marché des ESN. Nous proposons une offre intégrée alliant...
-
Business Manager Data
il y a 2 jours
Toulouse, Occitanie, France TRIMANE | Expert BI et Big Data Temps pleinFondée en 2005, TRIMANE est un cabinet de conseil et une société de service spécialisée en Data Intelligence (Data & IA), notre mission est de créer de la valeur à partir des données disponibles dans les entreprises, en s'appuyant sur des approches algorithmiques innovantes, des méthodologies spécifiques et de nombreuses technologies.En tant que...
-
Data Engineer
il y a 1 semaine
Toulouse, Occitanie, France Craftman data Temps pleinNous recherchons un Data Engineer expérimenté (+4 ans) pour renforcer une équipe d?analyse marché dédiée aux données de réservation, partenaires et concurrence. La mission consiste à produire et optimiser des dashboards PowerBI (datasets, modélisation, visualisation), industrialiser les pipelines data et contribuer à l?exploitation analytique de...
-
Ingénieur Big Data Système XaaS –
il y a 2 jours
Toulouse, Occitanie, France CONCRETIO SERVICES Temps pleinVOS RESPONSABLES PRINCIPALES :RUN & Administration avancéeMaintenir les plateformes Hadoop, Kafka, Elastic, NiFi?Assurer le support N2/N3 et participer aux astreintes.Gérer les incidents majeurs, le troubleshooting, les actions correctives.Intervenir en HNO en cas de besoin (24/7 en rotation).Performance & optimisationDiagnostiquer les lenteurs (HDFS,...
-
Tech Lead Big Data F/H
Il y a 22 minutes
Toulouse, Occitanie, France Sécurité sociale Temps pleinTech Lead Big Data F/HPublié aujourd'hui • Date limite de candidature 31/12/2025CDIToulousede € à € par anNIVEAU VATélétravail possibleNVHADD113148URSSAF CAISSE NATIONALEAvec vous, agir pour une protection sociale durable et solidaireTravailler au sein du réseau des URSSAF, c'est faire partie d'un collectif qui s'engage où chacun met ses...
-
Data Engineer Confirmé
il y a 2 semaines
Toulouse, Occitanie, France CoperBee Temps pleindu posteCoperBee, Join the digital hiveBienvenue dans notre univers IT où l'innovation est notre moteur quotidien, la convivialité est notre langage commun, et où ensemble, nous façonnons l'avenir technologique pour offrir une expérience exceptionnelle à nos clients. Rejoins une équipe où chaque idée compte et où l'humain est au cœur de notre...
-
Data Engineer GCP
il y a 2 jours
Toulouse, Occitanie, France DGTL Performance Temps pleinDGTL / Signe + est le facilitateur pour tous les acteurs qui recherchent des ressources ou des missions DATA.Spécialiste du marché Data et BI, nous intervenons dans toute la France comme à l'étranger ; en sous-traitance, pré-embauche, recrutement, portage commercial, portage salarial, etc.Depuis 2018, nous accompagnons nos clients avec proximité, juste...
-
Data engineer H/F
il y a 4 heures
Toulouse, Occitanie, France Kicklox Temps pleinL'offreSecteursAutomobile, Aéronautique, Spatial, Défense & Sécurité, Ferroviaire, Télécommunications, Energie, Services & Systèmes d'Informations, Chimie / Pétrochimie, Digital & E-Commerce, Naval, Machines & Industrie Lourde, Pharmaceutique / Biotechnologie, Banque & Assurance, BTPDescription De L'offreNous recrutons pour l'un de nos clients un...
-
Lead Data Engineer
il y a 2 jours
Toulouse, Occitanie, France Ippon Technologies Temps pleinQui sommes-nous ? Ippon, c'est l'énergie du collectif au service de la technologie Nous sommes un cabinet de conseil et d'expertise technique. Nos équipes ont pour leitmotive de transformer des idées innovantes en solutions logicielles de haute qualité avec un focus particulier sur la valeur apportée aux utilisateurs. Située en centre ville, notre...