Senior Site Reliability Engineer
il y a 12 heures
L'équipe SR Hornetsecurity gère une
infrastructure critique métier
, hautement sollicitée et opérant sous de fortes exigences de disponibilité et de performance.
Nous avons plus de 4000 servers, dont plus de 300 noeuds Kubernetes . Nous traitons plus de 200 millions d'emails analysés et plus de 100 millions de sites web scannés par jour. Nous stockons plusieurs centaines de peta-octets de données. Le tout dans un environnement fonctionnant en 24x7 et utilisé par des clients situés partout dans le monde.
En tant que
Senior SRE
, tu es responsable de la fiabilité, de la performance et de l'évolutivité des produits.
Tu joues un rôle central entre les
équipes produits
, les
équipes métiers
et l'infrastructure, garantissant que les solutions techniques répondent pleinement aux besoins fonctionnels, opérationnels et utilisateurs.
Ce rôle requiert une
excellente maîtrise Linux
et une véritable capacité à
prendre des décisions techniques
, proposer des améliorations et piloter la vie du produit côté infrastructure.
Missions
Collaboration produit & équipes
- Être le
référent SRE
pour une ou plusieurs équipes produit et aux comités de coordination technique. - Traduire les besoins de fiabilité et de performance en
fonctionnalités produit concrètes
. - Travailler directement avec les équipes métiers pour assurer la cohérence entre besoins fonctionnels et implémentations techniques.
- Être force d'évangélisation sur les bonnes pratiques SRE (performance, résilience, automatisation).
Fiabilité & performance
- Définir, suivre et optimiser
SLIs / SLOs / SLAs
. - Analyser les incidents (root cause analysis), mener les
post-mortems
et stimuler l'amélioration continue. - Identifier proactivement les risques de fiabilité avant toute mise en production.
- Proposer et valider des évolutions d'architecture permettant de supporter une
forte volumétrie d'utilisateurs et de serveurs
(groupe Proofpoint).
Observabilité & monitoring
- Concevoir la stratégie de monitoring adaptée à chaque produit.
- Implémenter métriques, logs et traces en collaboration avec les développeurs.
- Construire des dashboards et alertes pertinents.
- Garantir une visibilité complète de la santé des services.
Automatisation & amélioration continue
- Documenter les architectures, runbooks et procédures et maintenir une documentation technique à jour
- Automatiser les processus et aider à améliorer et faire évoluer les produits et outils nécessaires à l'activité
Profil
Capable de prendre des décisions, avec
5 à 10 ans d'expérience
en administration Linux et environnements d'infrastructure, tu sais
porter techniquement une partie de la plateforme
, identifier les problèmes et proposer des solutions dans un contexte
dynamique, multi-technologies et à forte volumétrie
.
Sur le plan humain, tu fais preuve de
rigueur
, de
curiosité
, d'
esprit d'équipe
et d'une bonne
aisance relationnelle
.
Tu communiques clairement, fais preuve d'
adaptabilité
, de
polyvalence
, de
résistance au stress
et tu apportes naturellement des idées nouvelles.
- La maîtrise du
français et de l'anglais
est essentielle ainsi que celle de Linux. - Nous te formons sur nos outils internes et les processus spécifiques au groupe.
Toute connaissance complémentaire dans les domaines suivants constitue un véritable atout :
- Infrastructure & Plateformes : virtualisation, fournisseurs privés, Kubernetes, CI/CD
- Observabilité & Fiabilité : monitoring, outils d'observabilité, ELK / Elastic Stack, solutions de sauvegarde et de continuité d'activité
- Automatisation : Puppet, Ansible, scripting et workflows d'automatisation
Bénéfices
- Statut:
Cadre - Régime horaire
: forfait heure - Congés
: 5 semaines de congés légaux + 8 à 12 jours (selon les années) de RTT par année complète d'exercice - Tickets restaurant
: valeur du ticket 10€ (dont 5.92€ de participation par Hornetsecurity) - Prise en charge à 100 % des frais de
transport en commun - Prévoyance & Mutuelle santé
(Axa) - Avantages liés au sport et au bien-être (subvention)
- Crêche interentreprise
- Programme d'échange international
Rejoindre Hornetsecurity, c'est :
- Profiter d'un moment clé de notre croissance, avec de nombreuses opportunités à saisir.
- Évoluer dans un environnement d'apprentissage rapide, au sein d'une équipe soudée.
- Faire partie d'une entreprise internationale où l'état d'esprit cosmopolite et multiculturel est omniprésent.
-
Senior Reliability Engineer
il y a 4 jours
Greater Grenoble Metropolitan Area, France CT19 Temps pleinCT19 has exclusively partnered with a fast-growing energy storage start-up operating at the intersection of advanced engineering, clean energy, and industrial innovation.With operations spanning advanced R&D and high-volume industrial production, the company addresses applications in sustainable mobility, supporting the global transition to low-carbon energy...
-
Senior Site Reliability Engineer
il y a 1 semaine
Lille, France Canonical Temps pleinJoin to apply for the Senior Site Reliability Engineer role at Canonical Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is very widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation and IoT. Our...
-
Senior Site Reliability
il y a 1 semaine
Lille, France Canonical Temps pleinSenior Site Reliability / Gitops Engineer Apply for the Senior Site Reliability / Gitops Engineer role at Canonical. Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI,...
-
Site Reliability Engineer
il y a 2 semaines
Greater Toulouse Metropolitan Area, France OVHcloud Temps pleinPoste basé à Toulouse, Bordeaux, Brest, Nantes, Paris ou Lyon.#OVHcloudVous voulez contribuer à des projets uniques pour construire ensemble le cloud libre ? Allons-yChez OVHcloud, nous sommes animés par la même volonté, celle de construire l'avenir ensemble pour défendre la liberté d'innover.Avec plus d'1,6 millions de clients dans le Monde,...
-
Site Reliability Engineer
il y a 1 semaine
Lille, France Scaleway Temps pleinJoin to apply for the Site Reliability Engineer - SRE Paris role at Scaleway1 week ago Be among the first 25 applicantsJoin to apply for the Site Reliability Engineer - SRE Paris role at ScalewayGet AI-powered advice on this job and more exclusive features.Fondée en 1999, Scaleway est la filiale cloud du groupe Iliad, l’un des leaders des...
-
Site Reliability Engineer
il y a 2 semaines
Greater Toulouse Metropolitan Area, France OVHcloud Temps pleinPoste basé à Toulouse, Bordeaux, Brest, Nantes, Paris ou Lyon.#OVHcloudVous voulez contribuer à des projets uniques pour construire ensemble le cloud libre ? Allons-y!Chez OVHcloud, nous sommes animés par la même volonté, celle de construire l’avenir ensemble pour défendre la liberté d’innover.Avec plus d'1,6 millions de clients dans le Monde,...
-
Site Reliability Engineer
il y a 1 semaine
Lille, France Scaleway Temps pleinSite Reliability Engineer - SRE ToulouseJoin to apply for the Site Reliability Engineer - SRE Toulouse role at Scaleway.Founded in 1999, Scaleway is the cloud subsidiary of Iliad, a leading telecommunications group in Europe. Our mission is to foster a more responsible digital industry by helping developers and businesses create, deploy, and adapt...
-
Site Reliability Engineer — Build Resilient Cloud Systems
il y a 1 semaine
Lille, France Groupe iliad Temps pleinScaleway, la filiale cloud du groupe Iliad, recrute un Site Reliability Engineer à Lille. Dans un environnement dynamique et international, vous serez responsable d'assurer la fiabilité des produits, en collaborant avec différentes équipes et en utilisant des outils de monitoring et d'automatisation pour optimiser les systèmes. Une passion pour...
-
Site reliability Engineer
il y a 1 semaine
Lille, France Collective.work Temps pleinSite Reliability Engineer - SRE Toulouse Budget: A definir Tu rejoins l’équipe Opérations, qui veille chaque jour au bon fonctionnement de la plateforme de notre client. Tes missions Garantir la fiabilité, performance et scalabilité des systèmes. Assurer le traitement et le suivi des tickets clients (incidents, alertes, demandes d’assistance) avec...
-
Site Reliability Engineer
il y a 4 jours
Lille, Hauts-de-France Scaleway Temps pleinOUR STORY: Join Scaleway and shape the sovereign cloud of tomorrow Since 1999, we have been designing secure, sustainable infrastructures aimed at supporting the most ambitious companies.Historically known for our dedicated servers (Dedibox), we made a strategic shift to cloud computing in 2015. Staying true to our principles of simplicity, flexibility, and...