Concepteur Développeur Big Data

il y a 2 jours


Paris, Île-de-France DGTL Performance Temps plein

DGTL / Signe + est le facilitateur pour tous les acteurs qui recherchent des ressources ou des missions DATA.

Spécialiste du marché Data et BI, nous intervenons dans toute la France comme à l'étranger ; en sous-traitance, pré-embauche, recrutement, portage commercial, portage salarial, etc.

Depuis 2018, nous accompagnons nos clients avec proximité, juste prix et préoccupation éthique de tous les instants.

POSTE / MISSIONS
Analyse Des Besoins Et Des Cas D'usages
Participer aux réunions de lancement de projet pour comprendre les objectifs business organisés par les solutions manager RH et Finance

Analyser et formaliser les besoins fonctionnels et techniques en collaboration avec les architectes et les chefs de projet

Rédiger les spécifications techniques liées à la solution à implémenter.

Conception et développement des pipelines de données :

Concevoir des solutions de traitement de données en utilisant les technologies adaptées : Apache Spark, Hadoop, Databricks et Snowflake.

Implémenter des pipelines ETL/ELT performants et évolutifs pour le traitement et le stockage des données.

Intégrer les sources de données, les API, et autres systèmes externes.

Garantir la qualité des données à travers des mécanismes de validation et de contrôle de qualité.

Déploiement Et Configuration Des Environnements De Traitement
Configurer et déployer les environnements nécessaires sur des infrastructures cloud (AWS, Azure, GCP) ou sur des clusters Hadoop/Spark.

Utiliser Databricks pour optimiser les workflows et automatiser les processus de traitement des données.

Gérer les accès aux systèmes et assurer la sécurité des données traitées.

Optimisation Des Performances
Analyser les performances des solutions développées et proposer des axes d'optimisation.

Ajuster les configurations des clusters et des environnements (ex. ajustement des ressources pour Spark).

Appliquer les bonnes pratiques de partitionnement, de parallélisme et de gestion des ressources pour améliorer les temps de réponse.

Assurance Qualité Et Tests
Mettre en place des tests unitaires et des tests d'intégration pour garantir la qualité des pipelines de données.

Assurer un suivi des erreurs et des alertes sur les traitements de données.

Réaliser des revues de code régulières et veiller à la documentation des développements.

Maintenance Évolutive Et Support
Assurer la maintenance des solutions en production et intervenir pour résoudre les incidents de données.

Implémenter les évolutions demandées par les utilisateurs ou en fonction des nouvelles technologies disponibles.

Assurer une veille technologique pour adapter les solutions aux nouvelles versions des outils utilisés.

Documentation

Spécifications techniques : Un document détaillant la conception technique des pipelines de données et des processus d'intégration, incluant des diagrammes d'architecture et des flux de données.

Code source et scripts : Le code source des solutions développées dans les technologies utilisées (Spark, Hadoop, Databricks, Snowflake…

Scripts de configuration et d'automatisation des tâches de traitement (déploiement, intégration, tests).

Tests et validation : Une couverture de tests (unitaires et d'intégration) permettant de valider la qualité du code et le bon fonctionnement des cas d'usages.

Un rapport de tests avec les résultats des différents tests effectués sur les pipelines de données.

Documentation technique et d'exploitation : Documentation détaillée sur le fonctionnement des solutions déployées, incluant des procédures de mise à jour et de maintenance. Manuel utilisateur ou guide d'exploitation des pipelines, décrivant les interfaces de données et les processus métiers.

Rapport de performance : Un rapport d'analyse des performances des pipelines de données, avec des recommandations d'optimisation, des temps de traitement avant et après optimisation, etc.

Suivi des incidents et des corrections : Un suivi détaillé des incidents rencontrés en production, des actions correctives mises en place, et des évolutions apportées.

Livraison et mise en production : Livraison des solutions de données testées, validées et prêtes à être mises en production.

Mise en place d'un plan de déploiement avec une procédure de rollback en cas de problème

PROFIL RECHERCHÉ
Compétences Requises
Big data,

Hadoop database,

Spark ,

Python,

PostGreSQL,databricks

AVANTAGES
selon profil


  • Ingénieur Big Data

    il y a 6 jours


    Paris, Île-de-France Free-Work Temps plein

    Redlab cherche pour le compte d'un client grand compte , un ingénieur big Data /bases de donnéesExpert des architectures data : bases de données SQL & NoSQL, Big Data, pipelines, gouvernance, performance, sécurité.Missions clésAdministrer et optimiser bases SQL & NoSQL.Concevoir pipelines ETL/ELT sur données hétérogènes.Travailler sur Hadoop,...

  • Big data

    il y a 3 jours


    Paris, Île-de-France Hanson Regan Limited Temps plein

    Hanson Regan is looking for a Big data / Scala / Spark engineer for a 6 month renewable contract in remote with some travel to BelgiumAdvanced Data & Application LifecycleData Engineering Principles (Datalake, Lakehouse, SCD Types 1 & 2, PIT, ...),Application design, development, testing & deployment, Requirement AnalysisAdvanced Data Processing &...

  • Architecte Big Data

    il y a 3 jours


    Paris, Île-de-France Easel Tech Temps plein

    Easel-Tech se positionne à l'intersection du conseil stratégique et de l'expertise technique, qui se traduit aussi comme étant un trait d'union entre Métiers & DSI, avec une volonté forte d'accompagner nos clients dans leurs enjeux les plus complexes et les plus structurants.Chez Easel-Tech, on croit qu'un.e consultant.e engagé.e, c'est d'abord un.e...

  • Consultant Big Data

    il y a 3 jours


    Paris, Île-de-France Davidson consulting Temps plein

    Rejoindre Davidson, ce n'est pas seulement intégrer un groupe de 3000 consultants dans 6 pays et 2 continents, c'est intégrer LA société qui a été élue par ses salariés Great Place To Work France et Europe pendant 4 ans mais aussi une des plus grandes B Corp de France, nommée Best of the World dans la catégorie "collaborateurs" en Les "B Corp"...

  • Architecte Big Data H/F

    il y a 2 semaines


    Paris, Île-de-France Kicklox Temps plein

    L'offreSecteursAutomobile, Aéronautique, Spatial, Défense & Sécurité, Ferroviaire, Télécommunications, Energie, Services & Systèmes d'Informations, Chimie / Pétrochimie, Digital & E-Commerce, Naval, Machines & Industrie Lourde, Pharmaceutique / Biotechnologie, Banque & Assurance, BTPDescription De L'offreNous recrutons pour l'un de nos clients un...

  • Ingénieur.e Big Data

    il y a 1 semaine


    Paris, Île-de-France INOCO Temps plein

    Et si vous rejoigniez INOCO, une société de conseil tech qui vous connaît, vous valorise et vous donne les moyens d'évoluer selon vos ambitions ? En tant que consultant.e, vous interviendrez chez nos clients – grands comptes comme start-ups – pour créer et pérenniser leurs produits tech De façon agile & engagéeEn parallèle, en interne, vous...

  • Développeur Talend Bigdata

    il y a 2 semaines


    Paris, Île-de-France Numerys Temps plein

    Numerys recrute pour le compte de l'un de ses clients un Développeur Talend BigData.Mobilité: Paris / Remote (Hybride)Taux journalier: / Jour (ƒ Exp)Expérience: +2 ansDate dé début: ASAPPermis de travail: France / EuropéenCompétences exigées:TALEND : confirméBIG DATA : confirméSNOWFLAKE : confirméHADOOP : confirméDescriptif de la mission:Nous...

  • Big Data Engineer

    il y a 1 semaine


    Paris, Île-de-France Sopra Steria Temps plein

    Description de l'entreprise Sopra Steria, acteur majeur de la Tech en Europe, avec collaborateurs dans près de 30 pays, est reconnu pour ses activités de conseil, de services et solutions numériques. Il aide ses clients à mener leur transformation digitale et à obtenir des bénéfices concrets et durables. Le Groupe apporte une réponse globale aux...

  • Big Data Engineer

    il y a 1 semaine


    Paris, Île-de-France Sopra Steria Temps plein

    Description De L'entrepriseSopra Steria, acteur majeur de la Tech en Europe, avec collaborateurs dans près de 30 pays, est reconnu pour ses activités de conseil, de services et solutions numériques. Il aide ses clients à mener leur transformation digitale et à obtenir des bénéfices concrets et durables. Le Groupe apporte une réponse globale aux...

  • Big Data Solutions Architect

    il y a 2 semaines


    Paris, Île-de-France Databricks Temps plein

    CSQ227R46As a Big Data Solutions Architect (Resident Solutions Architect) in our Professional Services team you will work with clients on short to medium term customer engagements on their big data challenges using the Databricks platform. You will provide data engineering, data science, and cloud technology projects which require integrating with client...