Site Reliability Engineering
il y a 2 semaines
ContexteNous sommes à la recherche d’un SRE pour renforcer l’équipe technique de notre client et accompagner la montée en puissance de sa plateforme e-commerce.Ce rôle stratégique implique une vision globale de l’architecture, une forte sensibilité sécurité, ainsi qu’une capacité à intervenir rapidement et efficacement sur les incidents tout en améliorant la résilienceMission en full télétravail (depuis la France)Mission longue, contrats de 6 mois renouvelablesDébut de mission : ASAPFreelance uniquement, pas d’ESNMissions principalesGestion de la fiabilité et réponse à incident :• Suivre les budgets d’erreur et arbitrer avec les équipes produit : pas de nouvelles features si la fiabilité est en danger.• Être en première ligne sur les incidents• Coordonner la réponse (diagnostic, communication, mitigation).• Rédiger et animer les post-mortems, identifier les causes racines et mettre en place des correctifs systémiques.Capacité, Performance et Sécurité :• Planifier la capacité (scaling horizontal/vertical).• Effectuer des tests de charge, de résilience et du chaos engineering.• Anticiper les goulets d’étranglement.• Optimiser les coûts de l’infrastructure• Veiller à ce que l’infrastructure respecte les standards en matière de sécuritéBuild :• Éliminer les tâches récurrentes par des scripts, pipelines, auto-healing.• Construire des mécanismes de déploiement et de rollback sécurisés et fiables.• Optimiser le Disaster Recovery Plan en collaboration avec l’équipe platform engineeringObservabilité & excellence opérationnelle :• Maintenir et améliorer la stack d’observability basée sur OTEL et Elastic.• Développer de nouvelles metrics et renforcer l’observabilité globale.• Améliorer les temps de détection (MTTD) et de résolution (MTTR).• Garantir que les déploiements respectent les standards de fiabilité.• Mise en place de process de déploiement fiables (blue/green, canary releases, progressive delivery).Culture & pratiques :• Former les devs à la responsabilité de la production, tout en restant gardien de la fiabilité.• Instaurer une approche “reliability-first” dans la roadmap.• Former et accompagner les équipes internes dans la prise en main des outils.• Rédaction et mise à jour de la documentation relative à l’infrastructure, aux processus et aux meilleures pratiques pour faciliter le partage des connaissances et l’intégration des nouveaux membres de l’équipe.Profil recherché :Techniques :• Maîtrise des environnements Cloudflare, Elastic, CI/CD (Github ou équivalent), Terraform ou autre IaC.• Solides compétences en sécurité applicative.• Bonnes bases en observabilité, monitoring et métriques.• Expérience sur stack JSTransverses :• Capacité à documenter et formaliser (ADR, guidelines)• Pédagogie et accompagnement des équipes• Capacité d’analyse et de debugging dans une architecture distribuée• Langages & environnements appréciés : TypeScript, Nuxt, C#, Azure, GCP, Elastic, outils CI/CD, solutions de monitoring.• Expérience au sein d’un univers e-commerce et/ou retail #J-18808-Ljbffr
-
Site Reliability Engineer
il y a 2 semaines
Rue Saint-Fiacre, Paris, France the Jungle Temps pleinAs our Site Reliability Engineer you are responsible for implementing and maintaining scalable infrastructure and systems that ensure the reliability, performance, and security of our production environments. This hands-on position bridges the gap between development and operations, applying software engineering principles to infrastructure and operational...
-
Reliability Engineer
il y a 2 jours
France Sibelco Asia Pte Ltd Temps pleinReliability Engineer page is loaded## Reliability Engineerlocations: Nemourstime type: Full timeposted on: Posted Yesterdayjob requisition id: J014388Reliability Engineer**Location:**Nemours**At Sibelco, we advance life through materials.** For over 150 years, we’ve been a trusted leader in sourcing, transforming, and distributing specialty...
-
Site Reliability Engineer
il y a 4 jours
Rue Isabelle Eberhardt Montpellier, France, France Sweep Temps pleinSweep is hiring a Site Reliability Engineer (SRE), to join our SRE & infrastructure team and help us ensure the reliability, scalability, and performance of our systems. This role is ideal for someone with solid DevOps background, expertise in AWS and high-traffic systems, and a commitment to fostering a collaborative, inclusive environment within our SRE...
-
Senior Site Reliability Engineer
il y a 2 semaines
France Overstory Temps pleinThe climate crisis is the defining challenge of our time—but it’s also the greatest opportunity for innovation, and a challenge we’re proud to take on. At Overstory, we’re harnessing cutting‑edge technology to enable a resilient electrical grid that keeps communities thriving as our world changes. The grid is the backbone of life as we know it. It...
-
Site Reliability Engineer
il y a 1 semaine
Rue des Minimes, Grenoble, France Pleenk Temps pleinNous recherchons un Site Reliability Engineer expérimenté, capable de garantir la disponibilité, la performance et la résilience de la plateforme.Votre rôle est d'appliquer une approche ingénierie à l'exploitation : automatiser au maximum, réduire le toil, améliorer la fiabilité du système et accompagner les équipes produit dans un delivery sûr...
-
Remote Site Reliability Engineer — Cloud Infra
il y a 2 semaines
France Overstory Temps pleinA mission-driven technology company based in France seeks a Site Reliability Engineer to enhance GCP infrastructure and DevOps practices. The role involves designing cloud systems, building automation tools, and championing observability within the organization. Ideal candidates have strong cloud management skills and a proactive, collaborative mindset....
-
Site Reliability Engineer
il y a 2 semaines
B Rue Roquépine, Paris, France Scaleway Temps pleinOUR STORY: Join Scaleway and shape the sovereign cloud of tomorrow Since 1999, we have been designing secure, sustainable infrastructures aimed at supporting the most ambitious companies.Historically known for our dedicated servers (Dedibox), we made a strategic shift to cloud computing in 2015. Staying true to our principles of simplicity, flexibility, and...
-
Head of Engineering
il y a 2 semaines
Rue d'Uzès, Paris, France Azmed Temps pleinRole OverviewYou will guide a team of engineers across Software Engineering, Web Development, DevOps, and MLOps, and work closely with Product, QA, and the CTO to build the future of our Raysuite applications, an AI-powered software that detects pathologies on X-Rays and CT Scanners for hospitals and clinics worldwide.Key ResponsibilitiesLead and mentor the...
-
Site Reliability Engineer III
il y a 4 jours
France (Rue de Javel) LexisNexis Temps pleinLexisNexis Legal & Professional, which serves customers in more than 150 countries with 11,800 employees worldwide, is part of RELX, a global provider of information
-
PaaS - Senior Platform Engineer
il y a 2 semaines
France Capijob Temps pleinOverviewSenior Platform Engineer at Smals. You will join the Platform team and be responsible for installing infrastructure services, developing and deploying technologies with Kubernetes and OpenShift, and ensuring the reliability, performance and availability of infrastructures for users and developers. You will contribute to lifecycle management and Site...