Data Engineer IA

il y a 1 semaine


Caen, France La Sécurité sociale Temps plein

Votre rôle : En tant que Data Ingénieur orienté IA, vous serez un acteur clé de la mise en place des fondations techniques, des pipelines de données et de modèles, et de la préparation à l'industrialisation des expérimentations IA/Data menées par la Fabrique. Pour y parvenir, voici les missions qui vous seront confiées : * Ingénierie des données & préparation IA * Concevoir et automatiser des pipelines d'ingestion, transformation et feature engineering (API, fichiers, BDD, non structurées). * Garantir qualité, fraîcheur, traçabilité et versioning des datasets d'entraînement/validation. * Mettre à disposition des environnements d'expérimentation et des jeux de données prêts à l'emploi. * Intégration IA & MLOps * Co-industrialiser avec les DS : entraînement, déploiement, CI/CD, monitoring des modèles. * Exposer des API / microservices d'accès aux données et modèles (conteneurisation, orchestrateurs). * Implémenter des workflows IA générative / RAG (bases vectorielles, données internes), avec optimisation perf/coûts. * Innovation & expérimentation * Contribuer aux POC/POV/MVP et préparer leur passage en production. * Évaluer/prototyper de nouvelles technos Data/IA (vector DB, orchestrateurs ML, frameworks open-source) et partager les retours de tests. * Assurer une veille structurée sur outils et architectures émergentes. * Collaboration transverse & gouvernance * Travailler au sein de squads multi-compétences avec Data Scientists, Tech Leads, Architectes, Métiers et autres pôles de la Fabrique. * Documenter architectures, flux et jeux de données pour faciliter réutilisation et pérennisation. * Contribuer à l'industrialisation des solutions validées avec les équipes DSI.De formation bac+4/5 (école d'ingénieur ou master) avec une spécialisation en informatique, data engineering, IA ou systèmes distribués, vous justifiez d'une expérience de 4 à 6 ans en ingénierie des données, idéalement dans un contexte mêlant data et intelligence artificielle. Une expérience en projets d'expérimentation, POC, MVP ou RAG/IA générative est fortement appréciée. Compétences * Langages & développement * Python (indispensable), SQL, Scala/Java. * Traitement & orchestration des données * ETL/ELT, batch & streaming. * Airflow/Prefect, dbt pour la transformation. * Spark/Kafka pour le calcul distribué et l'ingestion temps réel. * Stockage & gestion des données * Data Lake / Data Warehouse. * Formats & tables : Parquet, Delta Lake. * Catalog/métadonnées pour le lignage et la découverte. * Cloud & plateforme * Azure / AWS / GCP (services data & IA managés). * MLOps & intégration IA * MLflow (expérimentation, modèles), CI/CD, monitoring des modèles. * Docker / Kubernetes (packaging, déploiement). * IA générative / RAG : bases vectorielles (FAISS, Milvus, Pinecone), frameworks (LangChain, Hugging Face, Transformers). * Data Visualization * Outils/bibliothèques de visualisation et storytelling orienté décision. * Bonnes pratiques & gouvernance * Git (versioning), documentation, sécurité, gouvernance des données. * Compétences comportementales * Esprit analytique et rigoureux, orienté qualité des données. * Curiosité et appétence forte pour l'intelligence artificielle et ses applications. * Capacité à travailler en équipe et à collaborer avec des profils variés. * Autonomie, adaptabilité et proactivité. * Goût pour l'expérimentation, l'innovation et la recherche de solutions pragmatiques.Avec vous, agir pour une protection sociale durable et solidaire Travailler au sein du réseau des URSSAF, c'est faire partie d'un collectif qui s'engage où chacun met ses compétences au service de nombreux projets pour assurer une protection sociale durable et solidaire. Depuis plus de 60 ans, le réseau des Urssaf est un acteur essentiel de la solidarité nationale. Chaque jour, nous pilotons la collecte, puis la redistribution des cotisations et contributions pour assurer le financement des prestations de santé, retraite, famille, chômage dont bénéficient des millions de Français. Cette mission fait de nous un pilier de la Sécurité sociale. Rattachée à la DSI, la Fabrique Innovation Digitale a pour mission de stimuler, expérimenter et accélérer les initiatives d'innovation à composante numérique au service des métiers, et d'en faciliter l'industrialisation en lien étroit avec l'ensemble des parties prenantes de la DSI. Dans ce cadre, le Pôle Data & IA développe des expérimentations et prototypes autour de la valorisation de la donnée, de l'intelligence artificielle et de l'IA générative, en explorant notamment des approches MLOps, RAG (Retrieval-Augmented Generation) et IA distribuée. Il contribue à la transformation numérique et à la création de valeur pour les métiers à travers une approche pragmatique, expérimentale et orientée résultat.


  • Data Eng Gcp Caen

    il y a 2 semaines


    Caen, France REDLAB Temps plein

    Dans le cadre du développement de nos activités Data & Cloud auprès d?un grand compte, nous recherchons un Data Engineer expérimenté sur l?écosystème GCP pour rejoindre une équipe projet dynamique basée à Caen( de préférence un profil habitant Caen et ses alentours (3jours sur site /2jours TT.) Vous interviendrez au c?ur d?un environnement...

  • Analytics Engineer

    il y a 4 semaines


    Caen, France JAKALA Temps plein

    JAKALA est une société leader européenne dans les métiers du conseil de la transformation data, IA et stratégies marketing.Fondée en Italie en 2000 par Matteo de Brabant, JAKALA se positionne dès ses débuts comme pionnière en combinant marketing et technologie pour révolutionner les domaines de l’engagement, de la fidélisation et des incentives...

  • Analytics Engineer

    il y a 1 semaine


    Caen, France JAKALA Temps plein

    JAKALA est une société leader européenne dans les métiers du conseil de la transformation data, IA et stratégies marketing.Fondée en Italie en 2000 par Matteo de Brabant, JAKALA se positionne dès ses débuts comme pionnière en combinant marketing et technologie pour révolutionner les domaines de l'engagement, de la fidélisation et des incentives...

  • Data Engineer

    il y a 6 jours


    Rue Saint-Gabriel, Caen, France Jakala Temps plein

    Au sein de notre practice Data & AI, tu travailles conjointement avec les Data Scientists, Data Engineers, MLE/MLOps engineer déjà en poste et tu es impliqué.e dans la prise de décisions liée aux solutions Data et à son évolution.A cet effet, tu es en charge de :Contribuer au développement de notre offre Data et à l'industrialisation de plateformes...


  • Caen, France JAKALA Temps plein

    JAKALA est une société leader européenne dans les métiers du conseil de la transformation data, IA et stratégies marketing.Fondée en Italie en 2000 par Matteo de Brabant, JAKALA se positionne dès ses débuts comme pionnière en combinant marketing et technologie pour révolutionner les domaines de l’engagement, de la fidélisation et des incentives...


  • Caen, France JAKALA Temps plein

    JAKALA est une société leader européenne dans les métiers du conseil de la transformation data, IA et stratégies marketing.Fondée en Italie en 2000 par Matteo de Brabant, JAKALA se positionne dès ses débuts comme pionnière en combinant marketing et technologie pour révolutionner les domaines de l'engagement, de la fidélisation et des incentives...

  • Data Engineer GCP

    il y a 7 jours


    Caen, Normandie, France Collective Temps plein

    Objectif : fiabiliser et centraliser la donnée à grande échelle, renforcer la gouvernance et ouvrir la voie à de nouveaux cas d'usages analytiques & prédictifs.Environnement techniqueGCP / BigQuery / Python / ETL-ELTConception et maintenance de pipelinesIndustrialisation des flux DataCollaboration avec les métiers sur la DataVizAccompagnement à la...

  • Data Engineer GCP

    il y a 1 semaine


    Caen, Normandie, France Collective Temps plein

    Objectif : fiabiliser et centraliser la donnée à grande échelle, renforcer la gouvernance et ouvrir la voie à de nouveaux cas d'usages analytiques & prédictifs. Environnement techniqueGCP / BigQuery / Python / ETL-ELTConception et maintenance de pipelinesIndustrialisation des flux DataCollaboration avec les métiers sur la DataVizAccompagnement à la...


  • Caen, Normandie, France Emerit Science Temps plein

    À propos d'Emerit ScienceChez Emerit Science, nous mettons l'intelligence artificielle au service de la recherche scientifique, de l'industrie et des institutions académiques.Notre mission : rendre la connaissance scientifique massive, fiable et exploitable, en concevant des assistants conversationnels spécialisés s'appuyant sur des millions de...


  • Caen, Normandie, France JAKALA Temps plein

    JAKALAest une société leader européenne dans les métiers du conseil de la transformation data, IA et stratégies marketing.Fondée en Italie en 2000 par Matteo de Brabant, JAKALA se positionne dès ses débuts comme pionnière en combinant marketing et technologie pour révolutionner les domaines de l'engagement, de la fidélisation et des incentives...