Site Reliability Engineer

il y a 24 heures

Paris Lille Bordeaux Toulouse, France Scaleway Temps plein

NOTRE ADN
Rejoignez Scaleway pour construire le Cloud souverain européen
Fondée en 1999, Scaleway est la filiale cloud du groupe Iliad, l'un des leaders européens des télécommunications. Notre mission ? Mettre en oeuvre une industrie numérique plus responsable en aidant les développeurs et les entreprises à créer, déployer et adapter leurs applications sur n'importe quelle infrastructure.
Basés à Paris, Lille, Toulouse, Bordeaux et Lyon, nous concevons et exploitons un écosystème cloud souverain utilisé quotidiennement par nos propres équipes et adopté par 25 000 clients (Photoroom, Mistral, H, Ministère de l'éducation nationale, Paris 8 Universités, Dysflexis, Lacroix, Little Big Connection, Mon Petit Placement, Radio France, Hachette Livres) pour :
Une expérience fluide et intuitive Une redondance multi-AZ garantissant haute disponibilité et résilience Des datacenters neutres en carbone Des outils natifs pour architectures multi-cloud
Nos solutions couvrent tous les besoins, du bare metal à la conteneurisation en passant par les architectures serverless, offrant une alternative européenne performante pour tous types de clients et use cases.
Rejoignez une équipe de près de 600 passionnés, issus d'horizons variés, dans un environnement technologique, innovant et collaboratif
LE POSTE
En tant que Site Reliability Engineer (SRE), vous jouerez un rôle clé pour assurer la robustesse et la performance de nos services.
Rattaché(e) à un Lead SRE (Engineering Manager), vous contribuerez à : - Améliorer en continu la fiabilité et l'évolutivité de nos plateformes. - Automatiser l'infrastructure pour optimiser les déploiements et réduire l'intervention humaine. - Collaborer avec les équipes Dev, Produit et Ops pour garantir des services performants et résilients.
Vous intégrerez également la SRE Guild, un collectif dédié aux meilleures pratiques et à l'innovation technique.
Vos missions
Automatisation & Outils - Développer des outils et frameworks pour fluidifier les déploiements et la gestion des infrastructures. - Automatiser les tâches répétitives pour améliorer l'efficacité et la fiabilité.
Monitoring & Alerting - Mettre en place des indicateurs clés (SLO, KPI) pour suivre la performance des services. - Optimiser les systèmes de monitoring et alerting afin de minimiser la fatigue d'alerte.
Gestion des incidents - Identifier, diagnostiquer et résoudre rapidement les incidents en production. - Analyser les causes profondes et implémenter des mesures préventives.
Ingénierie de la fiabilité - Appliquer les meilleures pratiques (tolérance aux pannes, load balancing, redondance) pour renforcer la résilience des systèmes. - Optimiser l'utilisation des ressources pour réduire la consommation énergétique et améliorer les performances.
Collaboration & Partage - Travailler en synergie avec les équipes Dev & Produit pour intégrer la fiabilité dès la conception. - Participer aux revues d'architecture et partager les bonnes pratiques SRE.
VOTRE PROFIL
Stack Technique
Langages : Python, Go, Rust Infra & DevOps : GitLab, Linux, Kubernetes, Container images Base de données : PostgreSQL Monitoring : OpenMetrics, OpenTelemetry Stockage : S3, CephFS, ZFS

Profil recherché
Indispensable - Expérience en Infrastructure as Code (IaC) et CI/CD. - Maîtrise des outils de monitoring et logging. - Bonne connaissance des systèmes Linux et du troubleshooting en production. - Capacité à travailler en anglais et en équipe.
Un plus - Expérience en développement (Go, Rust). - Sens du developer experience et appétence pour le coaching. - Expérience en stockage distribué (S3, CephFS, ZFS).
LES COULISSES
Le process de recrutement
Call de découverte avec un recruteur (30 min) Entretien (1h) – Échange avec le Head of SRE sur vos compétences techniques et votre approche du rôle Entretien avec les managers (1h) – En visio ou en présentiel pour approfondir votre expérience et votre fit avec l'équipe Entretien RH & visite – Rencontre avec l'équipe RH, découverte de nos locaux et moment d'échange avec vos futurs collègues

Pourquoi rejoindre Scaleway ? Une scale-up française ambitieuse, soutenue par un grand groupe. Un environnement technique de pointe avec des défis passionnants. Une culture de l'innovation et du partage, où l'expertise et la créativité s'expriment pleinement. Un engagement fort pour un cloud plus responsable, avec des datacenters éco-conçus.
Prêt(e) à relever le défi ? Rejoignez-nous dès maintenant Si vous ne vous voyez pas cocher toutes les cases, n'hésitez pas à postuler tout de même. Ne vous limitez pas à une description de poste - on ne sait jamais
Scaleway | Scaleway Blog| Scaleway sur X

Site Reliability Engineer

il y a 2 semaines

Paris, France Welcome to the Jungle France Temps plein

Site Reliability Engineer Join to apply for the Site Reliability Engineer role at Welcome to the Jungle France As our Site Reliability Engineer you are responsible for implementing and maintaining scalable infrastructure and systems that ensure the reliability, performance, and security of our production environments. This hands‑on position bridges the gap...
Site Reliability Engineer

il y a 2 semaines

Toulouse, France Loft Orbital Temps plein

About the Role: Orbitworks is revolutionizing access to space by building reliable, shareable satellites that drastically reduce the time and complexity traditionally required to get to orbit. We operate satellites, fly customer payloads, and handle entire missions from end-to-end. Orbitworks is a joint venture between Marlan Space (UAE-based) and Loft...
Site Reliability Engineer

il y a 1 jour

Paris, Île-de-France Mistral Ai Temps plein

About Mistral At Mistral AI, we believe in the power of AI to simplify tasks, save time, and enhance learning and creativity. Our technology is designed to integrate seamlessly into daily working life. We democratize AI through high-performance, optimized, open-source and cutting-edge models, products and solutions. Our comprehensive AI platform is designed...
Site Reliability Engineer — Observability

il y a 6 jours

Paris, France Groupe iliad Temps plein

Une société de technologies recherche un Site Reliability Engineer pour renforcer la fiabilité de ses services cloud. Vous aurez l'opportunité de travailler sur des systèmes complexes, avec des responsabilités d'astreinte et de collaboration avec différentes équipes. Le poste nécessite des compétences en développement (Go, Python ou Rust) et une...
Sre - Site Reliability Engineer (H/F)

il y a 7 jours

Lille, France Insitoo Temps plein

Basée à Lille, Lyon, Nantes, Grenoble et Bruxelles, Insitoo Freelances est une société du groupe Insitoo, spécialisée dans le placement et le sourcing des Freelances IT et Métier. Depuis 2007, Insitoo Freelances a su s’imposer comme une référence en matière de freelancing par son expertise dans l’IT et ses valeurs de transparence et de...
Site Reliability Engineer

il y a 2 semaines

Paris / Lille / Toulouse / Bordeaux / Lyon, France Scaleway Temps plein

OUR STORY: Join Scaleway and shape the sovereign cloud of tomorrow Since 1999, we have been designing secure, sustainable infrastructures aimed at supporting the most ambitious companies. Historically known for our dedicated servers (Dedibox), we made a strategic shift to cloud computing in 2015. Staying true to our principles of simplicity, flexibility,...
Site Reliability Engineer

il y a 5 jours

Paris, France OVHcloud Temps plein

CDI - IT, Technologie & Produit - PARIS, FR, 75017CESSON-SEVIGNE, FR, 35510NANTES, FR, 44000BREST, FR, 29200 - Hybride PROCESS DE RECRUTEMENT **1. Échange dans les 2 à 4 semaines avec notre hiring officer**:Arthur **2. Entretien avec le manager**:Raphael **3. Rencontre possible avec l'équipe ou un pair** REJOINDRE L’AVENTURE OVHcloud OVHcloud...
Site Reliability Engineer

il y a 7 jours

Paris, Île-de-France Criteo Temps plein

What You'll Do:About the TeamThe Platform Core group at Criteo is composed of seven agile, human-sized teams providing the foundational platform and systems powering all Criteo products.Within this group, the Analytics Infrastructure team builds and operates the distributed, multi-datacenter analytic data stores and platforms enabling interactive querying,...
Site Reliability Engineer II

il y a 2 semaines

Paris, Île-de-France Doctolib Temps plein

What We DoDoctolib's Engineering environment is rich and we are building innovative products and features aiming each day to ease doctors' and patient life. We are looking for aSite Reliability Engineer IIto keep Doctolib production systems running smoothly. You will also be a key-player to support the exponential growth of Doctolib services.What You Will...
Site Reliability Engineer II

il y a 7 jours

Paris, Île-de-France Doctolib Temps plein

What we do Doctolib's Engineering environment is rich and we are building innovative products and features aiming each day to ease doctors' and patient life. We are looking for a Site Reliability Engineer II to keep Doctolib production systems running smoothly. You will also be a key-player to support the exponential growth of Doctolib services. ...

Amériques

Europe

Asie / Océanie

Afrique

Site Reliability Engineer