System Reliability Engineer

il y a 4 jours


Lille, France Scaleway Temps plein

**Rejoignez Scaleway pour construire le Cloud souverain **

Basés à **Paris, Lille, Toulouse, Bordeaux et Lyon**, nous concevons et exploitons un **écosystème cloud souverain et responsable**, utilisé quotidiennement par nos propres équipes et adopté par **25 000 clients**_(Photoroom, Mistral, H, Ministère de l'éducation nationale, Paris 8 Universités, Dysflexis, Lacroix, Little Big Connection, Mon Petit Placement, Radio France, Hachette Livres) _pour:
Une **expérience fluide et intuitive**

Une **redondance multi-AZ** garantissant haute disponibilité et résilience

Des **datacenters neutres en carbone**

Des outils natifs pour **architectures multi-cloud**

Nos solutions couvrent **le bare metal, la conteneurisation et les architectures serverless**, offrant une alternative européenne performante.

**Rejoignez une équipe de près de 600 passionnés**, issus d’horizons variés, dans un environnement stimulant, innovant et collaboratif En tant que **Reliability Engineer (SRE)**, vous jouerez un rôle clé pour assurer la robustesse et la performance de nos services.

Rattaché(e) à un **Lead SRE (Engineering Manager)**, vous contribuerez à:

- Améliorer en continu la fiabilité et l’évolutivité de nos plateformes.
- Automatiser l’infrastructure pour optimiser les déploiements et réduire l’intervention humaine.
- Collaborer avec les équipes Dev, Produit et Ops pour garantir des services performants et résilients.

Vous intégrerez également la **SRE Guild**, un collectif dédié aux meilleures pratiques et à l’innovation technique.

**Vos missions**

**Automatisation & Outils**
- Développer des **outils et frameworks** pour fluidifier les déploiements et la gestion des infrastructures.
- Automatiser les tâches répétitives pour améliorer l’efficacité et la fiabilité.

**Monitoring & Alerting**
- Mettre en place des **indicateurs clés (SLO, KPI)** pour suivre la performance des services.
- Optimiser les systèmes de **monitoring et alerting** afin de minimiser la fatigue d’alerte.

**Gestion des incidents**
- Identifier, diagnostiquer et **résoudre rapidement** les incidents en production.
- Analyser les causes profondes et **implémenter des mesures préventives**.

**Ingénierie de la fiabilité**
- Appliquer les **meilleures pratiques** (tolérance aux pannes, load balancing, redondance) pour renforcer la résilience des systèmes.
- Optimiser l’utilisation des ressources pour **réduire la consommation énergétique** et améliorer les performances.

**Collaboration & Partage**
- Travailler en synergie avec les équipes Dev & Produit pour intégrer la fiabilité dès la conception.
- Participer aux **revues d’architecture** et partager les bonnes pratiques SRE.**Stack Technique**

**Langages** : Python, Go, Rust

**Infra & DevOps** : GitLab, Linux, Kubernetes, Container images

**Base de données** : PostgreSQL

**Monitoring** : OpenMetrics, OpenTelemetry

**Stockage** : S3, CephFS, ZFS**Profil recherché**

**Indispensable**
- Expérience en **Infrastructure as Code (IaC)** et **CI/CD**.
- Maîtrise des outils de **monitoring et logging**.
- Bonne connaissance des **systèmes Linux** et du **troubleshooting** en production.
- Capacité à travailler en anglais et en équipe.

**Un plus**
- Expérience en **développement (Go, Rust)**.
- Sens du **developer experience** et appétence pour le coaching.
- Expérience en **stockage distribué** (S3, CephFS, ZFS).**Pourquoi rejoindre Scaleway ?**

✔ **Une scale-up française ambitieuse**, soutenue par un grand groupe.

✔ **Un environnement technique de pointe** avec des défis passionnants.

✔ **Une culture de l’innovation et du partage**, où l’expertise et la créativité s’expriment pleinement.

✔ **Un engagement fort pour un cloud plus responsable**, avec des datacenters éco-conçus.

**Prêt(e) à relever le défi ? Rejoignez-nous dès maintenant **Le process de recrutement**

1️⃣ **Call de découverte avec un recruteur**(30 min)

2️⃣ **Entretien**(1h) - Échange avec le Head of SRE sur vos compétences techniques et votre approche du rôle

3️⃣ **Entretien avec les managers** (1h) - En visio ou en présentiel pour approfondir votre expérience et votre fit avec l’équipe

4️⃣ **Entretien RH & visite** - Rencontre avec l’équipe RH, découverte de nos locaux et moment d’échange avec vos futurs collègues

Si vous ne vous voyez pas cocher toutes les cases, n'hésitez pas à postuler tout de même. Ne vous limitez pas à une description de poste - on ne sait jamais

Scaleway \u007C Scaleway Blog\u007C Scaleway sur X



  • Lille, France Groupe iliad Temps plein

    Scaleway, la filiale cloud du groupe Iliad, recrute un Site Reliability Engineer à Lille. Dans un environnement dynamique et international, vous serez responsable d'assurer la fiabilité des produits, en collaborant avec différentes équipes et en utilisant des outils de monitoring et d'automatisation pour optimiser les systèmes. Une passion pour...


  • Lille, France Scaleway Temps plein

    Join to apply for the Site Reliability Engineer - SRE Paris role at Scaleway1 week ago Be among the first 25 applicantsJoin to apply for the Site Reliability Engineer - SRE Paris role at ScalewayGet AI-powered advice on this job and more exclusive features.Fondée en 1999, Scaleway est la filiale cloud du groupe Iliad, l’un des leaders des...


  • Lille, France Scaleway Temps plein

    Site Reliability Engineer - SRE ToulouseJoin to apply for the Site Reliability Engineer - SRE Toulouse role at Scaleway.Founded in 1999, Scaleway is the cloud subsidiary of Iliad, a leading telecommunications group in Europe. Our mission is to foster a more responsible digital industry by helping developers and businesses create, deploy, and adapt...


  • Lille, France Insitoo Temps plein

    Basée à Lille, Lyon, Nantes, Grenoble et Bruxelles, Insitoo Freelances est une société du groupe Insitoo, spécialisée dans le placement et le sourcing des Freelances IT et Métier. Depuis 2007, Insitoo Freelances a su s’imposer comme une référence en matière de freelancing par son expertise dans l’IT et ses valeurs de transparence et de...


  • Lille, France Collective.work Temps plein

    Site Reliability Engineer - SRE Toulouse Budget: A definir Tu rejoins l’équipe Opérations, qui veille chaque jour au bon fonctionnement de la plateforme de notre client. Tes missions Garantir la fiabilité, performance et scalabilité des systèmes. Assurer le traitement et le suivi des tickets clients (incidents, alertes, demandes d’assistance) avec...

  • Senior Site Reliability

    il y a 1 jour


    Lille, France Canonical Temps plein

    Senior Site Reliability / Gitops Engineer Apply for the Senior Site Reliability / Gitops Engineer role at Canonical. Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI,...


  • Lille, France Canonical Temps plein

    Join to apply for the Senior Site Reliability Engineer role at Canonical Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is very widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation and IoT. Our...


  • Lille, France Scaleway Temps plein

    NOTRE ADN 🌍 Rejoignez Scaleway pour construire le Cloud souverain européen ! Fondée en 1999, Scaleway est la filiale cloud du groupe Iliad, l’un des leaders européens des télécommunications. Notre mission ? Mettre en oeuvre une industrie numérique plus responsable en aidant les développeurs et les entreprises à créer, déployer et adapter leurs...


  • Lille, France Canonical Temps plein

    4 days ago Be among the first 25 applicants We are hiring a Site Reliability Engineer Our goal is to perfect enterprise infrastructure DevOps practices, raising the bar on what's possible with automation by embracing a model‑driven approach, whether on‑premise or on public clouds. We run hundreds of private cloud, Kubernetes clusters, and applications...

  • SRE Storage Engineer

    il y a 1 jour


    Lille, France Scaleway Temps plein

    Une entreprise technologique en pleine croissance à Lille recherche un Site Reliability Engineer pour assurer la robustesse et la performance de ses services. Vous contribuerez à améliorer la fiabilité, automatiser l'infrastructure, et collaborer avec des équipes variées. Pour réussir, une expérience en Infrastructure as Code, des compétences en...