Ingénieur Infrastructure IA H/F

il y a 2 jours


Paris, Île-de-France ouicoding Temps plein

Vous travaillerez dans le cadre du déploiement et de l'exploitation d'une AI Factory à très grande échelle, reposant sur plusieurs clusters. L'AI Factory s'appuie sur des architectures de stockage haute performance capables d'alimenter efficacement des clusters GPU NVL72, avec des exigences fortes en débit, latence et parallélisme I/O. Vous êtes en charge de l'architecture, de l'optimisation et de l'évolution des infrastructures réseaux, stockage, systèmes et GPU fabrics alimentant des charges IA critiques (training, fine-tuning, inference). L'environnement est international, hautement distribué (Europe, Amérique du Nord, Asie) et orienté performance extrême, faible latence et scalabilité horizontale. Architecture & design de la GPU Fabric : Concevoir et faire évoluer des architectures réseau haut débit, faible latence, adaptées aux NVL72 et aux workloads IA massivement parallèlesDéfinir les topologies réseau (leaf-spine, fat-tree, dragonfly le cas échéant) pour : Interconnexion intra-NVL72, Scale-out multi-racks / multi-clustersSélectionner et valider les technologies : InfiniBand HDR / NDR, Ethernet Spectrum / RoCEv2, Dimensionner les fabrics pour des usages IA à très grande échelle (NCCL-heavy, all-reduce intensif)Identifier et lever les goulots d'étranglement réseau, mémoire et CPU/GPUStockage :-Concevoir des architectures end-to-end data -> réseau -> GPU Veiller à ce que le storage ne soit pas un goulot d'étranglement pour les workloads IA distribuésCollaborer au design et à l'intégration de solutions de storage haute performance : Systèmes de fichiers parallèles (Lustre, GPFS / Spectrum Scale, BeeGFS), Object storage haute performanceParticiper à l'optimisation des I/O data (accès concurrents, cache NVMe, burst buffers)Assurer la cohérence GPU scheduling / accès data dans KubernetesIntégration Kubernetes & workloads IA : Concevoir l'intégration réseau de clusters GPU dans des environnements KubernetesGérer l'exposition et l'isolation des interfaces RDMA : Device Plugin, Network Operator / CNI avancésGarantir le bon fonctionnement des workloads conteneurisés IA : Training distribué, Jobs MPI / NCCL, Pipelines data / GPUProfil candidat: Formation : ingénieur ou équivalent BAC+5.Expérience professionnelle : Minimum 4 ans d'expérience pratique avec les technologies RDMA (GPUDirect, RoCE, InfiniBand) dans des environnements HPC ou IA.Solide expérience en architecture réseau HPC / IA / GPUMaîtrise avancée de : InfiniBand & RoCEv2, RDMA, GPUDirect, NCCL, Architectures GPU scale-up / scale-out, Appétence marquée pour les architectures de stockage haute performance, Bonne compréhension des enjeux de data locality, parallel I/O et débit massif, Capacité à raisonner performance globale : stockage / réseau / GPU / workload IABonne connaissance de : Kubernetes en contexte GPU, Linux bas niveau (NUMA, IRQ, CPU pinning)Capacité à diagnostiquer des problèmes complexes de performance distribuéeLangues : français et anglais courants (écrit et oral).


  • Ingénieur(e) IA

    il y a 6 jours


    Paris, Île-de-France SOFTEAM Expertise Data & IA Temps plein

    Vous souhaitez mettre votre expertise IA au service deprojets Data & IA stratégiquesà grande échelle ?Vous avez envie de rejoindre un leader de l'IA en France, au sein d'une équipe experte et engagée ? SOFTEAM Data(Groupe Docaposte), labelliséHappyIndex AtWork 2024, renforce ses équipes IA & ML Ops Vos responsabilités :En tant qu'Ingénieur(e) IA /...

  • Ingénieur(e) IA

    il y a 2 semaines


    Paris, Île-de-France Sander Temps plein

    Es-tu passionné(e) parla création de l'intelligencederrière la prochaine génération de produits propulsés par l'IA ?Rejoinsune startup innovante spécialisée dans les solutions intelligentespour la gestion énergétique et la smart city, pour concevoir et construire l'infrastructure agentique qui optimise nos systèmes connectés et nos services...

  • ingénieur ia embarqué

    il y a 1 semaine


    Paris, Île-de-France STATION F Temps plein

    À proposÀ propos de KikleoFondée en 2019 par Martin et Vincent pendant leurs études, Kikleo est une start-up innovante engagée dans la réduction du gaspillage alimentaire en France et en Europe. La mission de Kikleo : accompagner les acteurs de la restauration vers une alimentation plus durable, en réduisant le gaspillage alimentaire.Aujourd'hui, plus...

  • ingénieur ia embarquée

    il y a 6 jours


    Paris, Île-de-France STATION F Temps plein

    À proposÀ propos de KikleoFondée en 2019 par Martin et Vincent pendant leurs études, Kikleo est une start-up innovante engagée dans la réduction du gaspillage alimentaire en France et en Europe. La mission de Kikleo : accompagner les acteurs de la restauration vers une alimentation plus durable, en réduisant le gaspillage alimentaire.Aujourd'hui, plus...

  • Ingénieur IA

    il y a 2 semaines


    Paris, Île-de-France Choisir le Service Public Temps plein

    Informations générales Organisme de rattachement Présidence de la République   Référence Date de début de diffusion /01/2026 Date de parution /01/2026 Localisation Paris Intitulé long de l'offre Ingénieur IA - Data Scientist (F/H) VersantFonction Publique de l'Etat CatégorieCatégorie A (cadre) Nature de l'emploiEmploi ouvert aux...


  • Paris, Île-de-France STATION F Temps plein

    À proposStartup française créée en 2015 et pionnière de l'IA,Craft AIs'est fixé pour objectif de sécuriser et de faciliter la mise en production des modèles d'IA. Nous permettons aux entreprises d'expérimenter en conditions opérationnelles et de déployer en un temps record des applications d'IA avec tout l'outillage de la production. De plus, nous...

  • Stagiaire IA INGENIEUR

    il y a 6 jours


    Paris, Île-de-France Crédit Agricole CIB Temps plein

    Stage de fin d'etude de 6 mois.Vous intégrez l'équipe IA de DIA (Data et Intelligence Artificielle) au service de l'ensemble des directions du Groupe Crédit Agricole SA.Vous participez activement à lamodelisation et à l'industrialisationdes cas d'usage IApour lesdirections du Groupeet à la construction des enablers technologiques (pipelines CI/CD,...

  • chef de projet ia

    il y a 19 heures


    Paris, Île-de-France STATION F Temps plein

    À proposObtenez un emploi et une formation en alternance dans l'Intelligence Artificielle Business School dont en alternance en Intelligence Artificielle accompagne les alternants et les entreprises à mieux réussir avec les agents IA et une IA de confianceDécouvrez les agents IA sur Descriptif du posteRejoignez une aventure entrepreneuriale unique au...


  • Paris, Île-de-France Findyourstaff Temps plein

    Sparted est unescale-up SaaS B2B en croissance, spécialisée dans l'innovation pédagogique, lagamification de l'apprentissageet l'ancrage mémoriel. La plateforme accompagne aujourd'huienviron 50 clientset poursuit une croissance maîtrisée.L'équipe IT est actuellement composée de3 développeurs. Dans le cadre d'un projet stratégique majeur, Sparted...


  • Paris, Île-de-France STATION F Temps plein

    À proposObtenez un emploi et une formation en alternance dans l'Intelligence Artificielle Business School dont en alternance en Intelligence Artificielle accompagne les alternants et les entreprises à mieux réussir avec les agents IA et une IA de confianceDécouvrez les agents IA sur Descriptif du posteOffre d'emploi en alternance pour : Compagnie de...