Site Reliability Engineer

il y a 5 jours


Paris, Île-de-France OVHcloud Temps plein

Site Reliability Engineer - Network Observability H/F/N

Au sein de votre équipe #OneTeam

  • Vous rejoindrez l'équipe Network Observability, en charge de la conception des produits d'observability pour une infrastructure composée de plus de serveurs, 5 millions d'adresses IP publiques et équipements réseau ; le maintien en condition opérationnel et l'amélioration continue de ces produits est central.
  • En tant que Site Reliability Engineer chez Network Observability, votre rôle est de maintenir, améliorer et concevoir les solutions logicielles qui permettent de suivre et d'analyser les performances de l'infrastructure réseau OVHcloud. Vous serez moteur dans la modernisation des outils internes de monitoring et la création de nouveaux produits innovants répondant aux besoins des équipes réseau.

Vos principales responsabilités

  • Moderniser les outils internes de supervision et de monitoring.
  • Participer aux rotations d'astreintes.
  • Assurer la haute disponibilité, la fiabilité et la sécurité de nos outils d'observabilité réseaux.
  • Contribuer à la culture DevOps au sein de l'équipe et partager les bonnes pratiques.
  • Gérer les projets LEAN (amélioration continue) pour améliorer la qualité de service et l'efficacité/résilience de l'infrastructure.

Votre futur impact

Participé à l'amélioration de la qualité de service (QoS) des infrastructures réseau OVHcloud.

•    Découvert et maitrisé les outils internes et les différentes stacks techniques utilisés dans le périmètre de l'équipe

•    Participé à des améliorations concrètes sur la résilience et la haute disponibilité des produits

Dans 1 ans vous aurez :

•    Une maitrise totale du périmètre Network Observability

•    Contribué à définir la feuille de route de l'amélioration continue des années futures

•    Amélioré concrètement la qualité de service et l'automatisation des produits

_

Compétences requises :

  • Vous avez une précédent expérience en administration ou ingénierie système.
  • Vous maitrisez les outils comme : Kubernetes / Docker et la philosophie Cloud Native.
  • Vous avez une expérience sur des sujets de CI/CD.
  • Vous connaissez au moins un de ces outils de déploiements: Ansible, Terraform, Puppet, Chef...
  • Vous maitrisez un ou plusieurs langages de scripting (Python, Golang...).
  • Vous avez de solides connaissances des outils de supervision et d'observabilité (Prometheus / Grafana).

C'est un +

  • Vous avez déjà occupé un rôle d'ingénieur réseaux.
  • Appétence pour l'IA.


  • Site Reliability Engineer

    il y a 7 jours


    Paris, Île-de-France Blackfluo Temps plein

    Job DescriptionLocation: Full remote, EU timezone (CET +/- 2 hours)Start Date: As soon as possibleLanguages: English requiredWe are looking for a skilled Site Reliability Engineer (SRE) with deep expertise in AWS to help us scale and secure our infrastructure. As an SRE, you will be instrumental in ensuring the reliability, performance, and scalability of...


  • Paris, Île-de-France Swile Temps plein

    At Swile, we believe that good products can help reduce friction in daily professional life and boost employee satisfaction. Today, we provide innovative solutions in various areas such as Fintech, Travel, HR, and Employee Benefits to more than 5.5 million users in 85,000 companies in France and Brazil. Your role as a Senior Site Reliability Engineer (SRE)...

  • Site Reliability Engineer

    il y a 5 jours


    Paris, Île-de-France Mistral Ai Temps plein

    About Mistral At Mistral AI, we believe in the power of AI to simplify tasks, save time, and enhance learning and creativity. Our technology is designed to integrate seamlessly into daily working life. We democratize AI through high-performance, optimized, open-source and cutting-edge models, products and solutions. Our comprehensive AI platform is designed...

  • Site Reliability Engineer

    il y a 2 semaines


    Paris, Île-de-France Criteo Temps plein

    What You'll Do:About the TeamThe Platform Core group at Criteo is composed of seven agile, human-sized teams providing the foundational platform and systems powering all Criteo products.Within this group, the Analytics Infrastructure team builds and operates the distributed, multi-datacenter analytic data stores and platforms enabling interactive querying,...

  • Site Reliability Engineer

    il y a 2 semaines


    Paris, Île-de-France Welcome to the Jungle France Temps plein

    As our Site Reliability Engineer you are responsible forimplementing and maintaining scalable infrastructure and systems that ensure the reliability,performance, and security of our production environments.This hands-on position bridges the gap between development and operations, applying software engineering principles to infrastructure and operational...

  • site reliability engineer

    il y a 7 jours


    Paris, Île-de-France STATION F Temps plein

    AboutAt Welcome to the Jungle, we believe working is good. But thriving with the right people is better. We provide a suite of tools, content, and experiences that make recruitment more transparent, authentic, and human.We help companies build their recruitment strategy by sharing their story through employer branding, enabling them to attract, engage, and...


  • Paris, Île-de-France Mistral AI Temps plein

    About Mistral  At Mistral AI, we believe in the power of AI to simplify tasks, save time, and enhance learning and creativity. Our technology is designed to integrate seamlessly into daily working life. We democratize AI through high-performance, optimized, open-source and cutting-edge models, products and solutions. Our comprehensive AI platform is...

  • Site Reliability Engineer

    il y a 7 jours


    Paris, Île-de-France Criteo Temps plein

    What You'll Do:At Criteo, our Platform Core group builds the foundational services that power our global advertising platform. We design and operate scalable, resilient systems that support real-time decision-making and data processing at massive scale.As we expand our capabilities in high-performance inference and distributed computing, we're forming a new...


  • Paris, Île-de-France Mistral Ai Temps plein

    About Mistral At Mistral AI, we believe in the power of AI to simplify tasks, save time, and enhance learning and creativity. Our technology is designed to integrate seamlessly into daily working life. We democratize AI through high-performance, optimized, open-source and cutting-edge models, products and solutions. Our comprehensive AI platform is designed...

  • Site Reliability Engineer

    il y a 7 jours


    Paris, Île-de-France AKUR8 Temps plein

    Akur8 is a young, dynamic, fast growing Insurtech scale-up that is transforming insurance pricing and reserving with transparent machine learning.Our SaaS platform leverages the power of transparent machine learning and predictive analytics to inject game-changing speed, performance and reliability into insurers' pricing and reserving processes.Powered by...