Administrateur Systèmes et réseaux H/F
il y a 2 jours
Vous travaillerez dans le cadre du déploiement et de l'exploitation d'une AI Factory à très grande échelle, reposant sur plusieurs clusters. Vous serez en charge de l'architecture, de l'optimisation et de l'évolution des infrastructures réseaux, systèmes et GPU fabrics alimentant des charges IA critiques (training, fine-tuning, inference).
L'environnement est international, hautement distribué (Europe, Amérique du Nord, Asie) et orienté performance extrême, faible latence et scalabilité horizontale.
Architecture & design de la GPU Fabric :
- Concevoir et faire évoluer des architectures réseau haut débit, faible latence, adaptées aux NVL72 et aux workloads IA massivement parallèles
- Définir les topologies réseau (leaf-spine, fat-tree, dragonfly le cas échéant) pour : Interconnexion intra-NVL72, Scale-out multi-racks / multi-clusters
- Sélectionner et valider les technologies : InfiniBand HDR / NDR, Ethernet Spectrum / RoCEv2, Dimensionner les fabrics pour des usages IA à très grande échelle (NCCL-heavy, all-reduce intensif)
Performance, RDMA & communications GPU :
- Piloter le développement, l'optimisation et le tuning des communications RDMA
- Piles RDMA : libibverbs, rdma-core, NVPeerMemory
- Optimisations GPUDirect / GPUDirect-RDMA
- Garantir des transferts GPU / GPU et GPU / NIC à très haute performance, sans surcharge CPU
- Optimiser les communications collectives : NCCL, MPI / CUDA-aware MPI, Identifier et lever les goulots d'étranglement réseau, mémoire et CPU/GPU.
Intégration Kubernetes & workloads IA :
- Concevoir l'intégration réseau de clusters GPU dans des environnements Kubernetes
- Gérer l'exposition et l'isolation des interfaces RDMA : Device Plugin, Network Operator / CNI avancés
- Garantir le bon fonctionnement des workloads conteneurisés IA : Training distribué, Jobs MPI / NCCL, Pipelines data GPU
Exploitation, observabilité & troubleshooting :
- Mettre en place et exploiter des solutions de monitoring avancé : Latence, bande passante, congestion, erreurs
- Outils : Prometheus, Grafana, NetQ, UFM (ou équivalents)
- Analyser les performances réseau et GPU fabric en production
- Proposer et implémenter : Ajustements MTU, Affinités CPU/GPU, Tuning NIC, switch et firmware
- Assurer le support niveau 2/3 sur incidents critiques
Profil candidat:
- Formation : ingénieur ou équivalent BAC+5.
- Expérience professionnelle : Minimum 4 ans d'expérience pratique avec les technologies (GPUDirect, RoCE, InfiniBand) dans des environnements HPC ou IA.
- Solide expérience en architecture réseau HPC / IA / GPU
- Maîtrise avancée de : InfiniBand & RoCEv2, RDMA, GPUDirect, NCCL, Architectures GPU scale-up / scale-out
- Bonne connaissance de : Kubernetes en contexte GPU, Linux bas niveau (NUMA, IRQ, CPU pinning)
- Capacité à diagnostiquer des problèmes complexes de performance distribuée
- Langues : Français et anglais courants (écrit et oral)
-
Administrateur système réseau/Administratrice système réseau
il y a 7 jours
Paris, Île-de-France NESS TECHNOLOGIES Temps pleinContexte de la missionDans le cadre d'un renfort temporaire, nous recherchons unAdministrateur Systèmes & Réseaux N2pour intervenir principalement sur les environnementssystèmes, avec uneconnaissance des réseauxsuffisante pour assurer le support et l'exploitation (sans rôle d'expert réseau).Missions principalesAdministration systèmes...
-
Administrateur systèmes et réseaux Junior
il y a 1 semaine
Paris, Île-de-France Reevo Spa Temps pleinAdministrateur systèmes et réseaux junior H/FReeVo a pour mission d'accompagner la transformation et la sécurisation des systèmes d'information de l'ensemble de ses clients (grands groupes comme PME).Comment ? D'abord grâce à une très forte spécialisation technique sur les expertises Cybersécurité, Systèmes et Réseaux, Cloud et DevOps /...
-
Administrateur système et réseau H/F
il y a 5 jours
Paris, Île-de-France ITP groupe Temps pleinLe Groupe ITP est une E.S.N atypique, spécialisée, depuis 1995, dans l'infogérance et le déploiement d'infrastructures Informatiques pour les entreprises.De taille humaine, aux pratiques agiles et innovantes, nous promouvons l'intelligence collective, le bien-être de nos équipes et l'esprit d initiative à travers nos Ambitions d Être. Fortement...
-
Administrateur système et réseau H/F
il y a 2 semaines
Paris, Île-de-France NEXTON Temps pleinde l'entrepriseQui sommes-nous ?Rejoindre NEXTON, c'est intégrer une entreprise où convergent l'esprit d'un cabinet de conseil, la créativité d'une agence et la dynamique d'une ESN Grâce à notre expertise, nous accompagnons des clients grands comptes et des pure players tels que SNCF, Orange, et BNP Paribas dans leurs stratégies d'évolution et...
-
Administrateur système et réseau H/F
il y a 2 semaines
Paris, Île-de-France NEXTON Temps pleinDescription de l'entrepriseQui sommes-nous ?Rejoindre NEXTON, c'est intégrer une entreprise où convergent l'esprit d'un cabinet de conseil, la créativité d'une agence et la dynamique d'une ESN Grâce à notre expertise, nous accompagnons des clients grands comptes et des pure players tels que SNCF, Orange, et BNP Paribas dans leurs stratégies...
-
Administrateur(rice) Réseau et Système
il y a 1 semaine
Paris, Île-de-France Davidson consulting Temps pleinRejoindre Davidson, ce n'est pas seulement intégrer un groupe de 3000 consultants dans 6 pays et 2 continents, c'est intégrer LA société qui a été élue par ses salariés Great Place To Work France et Europe pendant 4 ans mais aussi une des plus grandes B Corp de France, nommée Best of the World dans la catégorie "collaborateurs" en Les "B Corp"...
-
Administrateur Systéme Réseau H/F
il y a 7 heures
Paris, Île-de-France Consort Group Temps pleinChaque moment compte. Surtout ceux que vous vivez à fond. Bienvenue chez Consort Group.Consort Group, accompagne depuis plus de 30 ans les entreprises dans la valorisation de leurs données et infrastructures. Elle s'appuie sur deux leaders, Consortis et Consortia, et place l'humain et la responsabilité sociétale au cœur de ses valeurs.C'est votre future...
-
Administrateur Systéme Réseau H/F
il y a 3 heures
Paris, Île-de-France Consort Group Temps plein 42 000 € - 45 000 €Chaque moment compte. Surtout ceux que vous vivez à fond. Bienvenue chez Consort Group.Consort Group, accompagne depuis plus de 30 ans les entreprises dans la valorisation de leurs données et infrastructures. Elle s'appuie sur deux leaders, Consortis et Consortia, et place l'humain et la responsabilité sociétale au cœur de ses valeurs.C'est votre future...
-
Administrateur système et réseau H/F
il y a 5 jours
Paris, Île-de-France metaline Temps pleinMETALINE est une ESN spécialisée dans l'infogérance, les services managés et le Digital Work Place. Fondée avec l'ambition d'accompagner les entreprises dans la gestion et l'optimisation de leurs infrastructures IT, METALINE a su évoluer pour répondre aux enjeux technologiques d'aujourd'hui et de demain. Dans le cadre de notre croissance et pour...
-
ROC / Administrateur Systèmes & Réseaux
il y a 3 jours
Paris, Île-de-France AVA6 Temps pleinTes missions majeures chez AVA6 : Assurer le rôle de ROC : supervision des infrastructures, traitement et pilotage des incidents, coordination et traitement des actions correctives, suivi des engagements de service (SLA)Administrer et maintenir les systèmes et réseaux des clients, à distance et ponctuellement sur site (clients majoritairement situés...