Administrateur Système et Réseau F/H

il y a 2 semaines


SaintCloud, Île-de-France OUTSCALE Temps plein

Nous recrutons
un·e Administrateur système et réseau
afin de renforcer
notre équipe AI Factory d'Outscale.
Outscale est un opérateur souverain et durable de l'Expérience en tant que Service qui offre à ses clients des environnements technologiques de confiance.

Nous offrons des expériences uniques grâce au savoir-faire de nos équipes passionnées, qui se reflète notamment par la création de solutions de Business Expériences, le développement de notre propre orchestrateur Cloud, TINA OS, ou encore l'obtention de la qualification SecNumCloud.

Intégré(e) à l'équipe
AIFactory
d'OUTSCALE
, vous assurez l'exploitation, l'optimisation et l'evolution de la chaîne de stockage qui alimente les usines à GPU (clustersNVIDIA) à l'échelle globale (Europe, Amérique du Nord, Asie).

Vous concevez, déployez et supervisez des solutions de stockage haute performance : stockage objet compatible S3 (exaoctetscale), systèmes de fichiers distribues (Ceph, Lustre, BeeGFS, DAOS) et technologiesRDMA, GPUDirectStorage, SPDK ainsi que les protocoles NVMeoF/InfiniBand.

Votre mission est de garantir la disponibilité, la latence ultrafaible et la sécurite des plateformes de stockage, tout en offrant une observabilité complète (métriques, tableaux de bord) et en assurant la continuité de service pour les charges de travail IA a tres forte intensité de données.

Vos missions
Conception & déploiement de fabrics haut débit
:

  • Architecture InfiniBand HDR/NDR et Ethernet Spectrum (RoCEv2)
  • Dimensionnement pour un service IA à tres grande échelle

Développement & optimisation des communications RDMA

  • Implémentation de piles RDMA (libibverbs, NVPeerMemory)
  • Optimisation GPUDirect/GPUDirectRDMA pour un transfert de données ultra rapide sans surcharge CPU

Intégration RDMA / Kubernetes

  • Utilisation du device plugin NVIDIA pour l'exposition des interfaces RDMA aux pods
  • Garantir le bon fonctionnement des workloads conteneurises (MPI, NCCL)

Collaboration avec les équipes d'infrastructure

  • Accélération des pipelines de données et des communications collectives (NCCL, MPI, CUDAAware MPI)
  • Partage de bonnes pratiques et recettes d'optimisation

Détection et remontée des goulots de performance

  • Analyse de la latence et de la bande passante avec Prometheus, Grafana, NetQ, UFM
  • Propositions d'ajustements (MTU, affinage CPUGPU, tuning du firmware)

Gestion d'incident / Ticketing Niveau2
:

  • Prise en charge des tickets

Documentation

  • Rédaction de procédures, schémas d'infrastructure
  • Mise à jour du wiki Confluence et du CMDB (NetBox)

Veille technologique

  • Suivi des évolutions NVIDIA, Mellanox, standards RDMA, Kubernetes
  • Proof of concept sur les nouvelles générations de NIC (RoCEv2, InfiniBand EnhancedSpeed)

Stack technique

  • GPUNVIDIA & cartes réseau Mellanox (InfiniBand, RoCE)
  • Protocoles RDMA: GPUDirectRDMA, RoCEv2
  • Programmation basniveau C/C++ ou Rust
  • Maîtrise de la pile NVIDIA: pilotes Mellanox, libibverbs, NVPeerMemory

Compétences complémentaires (au moins 2 parmi les suivantes) :

  • Kubernetes (deviceplugin, SRIOV, CNI)
  • MPI & NCCL (CUDAAware)
  • Automatisation – Ansible, Terraform, Python/Bash, Git/GitLabCI
  • Administration Linux (kernel tuning, netfilter)
  • Outils de supervision – Prometheus, Grafana, UFM, NetQ, Zabbix, NetBox

Votre profil

  • Diplômé(e) en ingénierie informatique, vous possédez une expérience professionnelle minimum post-diplôme de 2 ans avec les technologies NVIDIA RDMA (GPUDirect, RoCE, InfiniBand) dans des environnements HPC ou IA.
  • Vous appréciez travailler en équipe et possédez un bon relationnel.
  • Rigoureux, autonome et réactif, vous êtes naturellement force de proposition.

Nous rejoindre c'est aussi
Intégrer une entreprise scientifique au cœur de l'innovation technologique, portée par une forte croissance depuis plus de 40 ans

Principaux avantages et bénéfices :

  • Environnement multiculturel
  • Cadre de travail convivial axé sur le bien-être et la santé
  • Engagement en faveur de la diversité et de l'inclusion
  • Politique dynamique de développement de carrière : plan de formation, mobilités internes, etc.

Inclusion statement

As a game-changer in sustainable technology and innovation, Dassault Systèmes is striving to build more inclusive and diverse teams across the globe. We believe that our people are our number one asset and we want all employees to feel empowered to bring their whole selves to work every day. It is our goal that our people feel a sense of pride and a passion for belonging. As a company leading change, it's our responsibility to foster opportunities for all people to participate in a harmonized Workforce of the Future.


  • Administrateur Systèmes

    il y a 2 semaines


    Saint-Cloud, Île-de-France f0-456c-4cfd-a290-021f838314c4 Temps plein

    Filiale du Groupe CNP Assurances, Filassistance met en œuvre des prestations d'assistance au service de ses assurés en difficultés. Ces garanties sont intégrées dans les contrats d'assureurs, courtiers et mutuelles partenaires : Filassistance fonctionne en B to B to C. Filassistance est un assisteur multi-spécialiste qui intervient aussi bien en...


  • Saint-Cloud, Île-de-France Centre Hospitalier Des Quatre Villes Temps plein

    Le poste Le CH4V est depuis le 1er juillet 2016 l'établissement support du GHT des Hauts-de-Seine, comprenant quatre autres établissements : le Centre hospitalier Rives de Seine (Neuilly, Courbevoie, Puteaux), l'hôpital Stell à Rueil-Malmaison, la Fondation Roguet à Clichy, le Centre de gérontologie « Les Abondances » à Boulogne-Billancourt.Dans le...


  • Saint-Laurent-Blangy, Hauts-de-France Decima Temps plein

    Rejoins notre équipe Si tu aimes résoudre des problèmes complexes, sécuriser des infrastructures et garantir des connexions fiables, ce poste est fait pour toi Sous la responsabilité du Responsable Informatique, l'administrateur réseaux assure la gestion, la sécurité et l'évolution des infrastructures réseau de l'entreprise. Grâce à son...

  • Administrateur Réseaux H

    il y a 2 semaines


    Saint-Nazaire, Pays de la Loire, France CONSORT Group Temps plein

    Consort Group, accompagne depuis plus de 30 ans les entreprises dans la valorisation de leurs données et infrastructures. Elle s'appuie sur deux leaders, Consortis et Consortia, et place l'humain et la responsabilité sociétale au cœur de ses valeurs.Les équipes de Consortis, sont au cœur des enjeux actuels de Cybersécurité, Virtualisation & Cloud,...


  • Saint-Herblain, Pays de la Loire, France Dynamips Temps plein

    Le groupe Dynamips Depuis 30 ans, Dynamips propose son expertise en services IT et solutions cloud pour les TPE, PME et Collectivités Locales du Grand Ouest.  Notre mission ?  Faciliter l'intégration des nouvelles technologies pour nos clients. Notre secret ?  Un engagement fort envers notre territoire et nos équipes  Nos valeurs ? Confiance -...


  • Saint-Sébastien-sur-Loire, Pays de la Loire, France ARPÈGE Temps plein

    L'entrepriseEditeur de solutions logicielles, spécialisé sur le marché des collectivités territoriales, Arpège crée, commercialise et héberge une suite de solutions interconnectées. L'entreprise offre une expérience citoyenne unique à travers l'optimisation des processus métiers, la qualité de la relation citoyenne et un accompagnement client...


  • Saint-Sébastien-sur-Loire, Pays de la Loire, France ARPÈGE SAS Temps plein

    L'entrepriseEditeur de solutions logicielles, spécialisé sur le marché des collectivités territoriales, Arpège crée, commercialise et héberge une suite de solutions interconnectées. L'entreprise offre une expérience citoyenne unique à travers l'optimisation des processus métiers, la qualité de la relation citoyenne et un accompagnement client...


  • Saint-Denis, Île-de-France EFS Temps plein

    Présentation Entité de rattachement L'Etablissement français du sang (EFS), chargé du service public transfusionnel et de la satisfaction des besoins en produits sanguins labiles, est un acteur essentiel de notre système de santé, garant du cadre éthique du don en France. La sécurité sanitaire et la préservation de l'autosuffisance quantitative...

  • Administrateur Réseaux H/F

    il y a 2 semaines


    Saint-Nazaire, Pays de la Loire, France CONSORT Group Temps plein

    Chaque moment compte. Surtout ceux que vous vivez à fond. Bienvenue chez Consort Group.Consort Group, accompagne depuis plus de 30 ans les entreprises dans la valorisation de leurs données et infrastructures. Elle s'appuie sur deux leaders, Consortis et Consortia, et place l'humain et la responsabilité sociétale au cœur de ses valeurs.C'est votre future...


  • Saint-Sébastien-sur-Loire, Pays de la Loire, France ARPEGE Temps plein

    Mise à jour le 03/11/2025Type de contrat :CDITemps de travail :Temps pleinLieuSaint-Sébastien-sur-LoireSalaire32000 EUR (€ EUR (€) / anL'entrepriseEditeur de solutions logicielles, spécialisé sur le marché des collectivités territoriales, Arpège crée, commercialise et héberge une suite de solutions interconnectées. L'entreprise offre une...