Site Reliability Engineer

il y a 4 semaines


PARIS, Ile-de-France Memo Bank Temps plein
Nous recrutons une personne en alternance au poste de Site Reliability Engineer (SRE) en alternance pour nous aider à assurer la fiabilité, la sécurité, et la performance de nos environnements. Cette personne aidera aussi nos équipes techniques à livrer leurs développements dans les meilleures conditions possibles.

Nous construisons depuis sept ans une banque pour les entreprises européennes. De l'ingénierie, aux règles métier, en passant par le design, beaucoup de choses restent à inventer.
À propos du posteLe rôle
Nous souhaitons accompagner une quatrième personne dans notre équipe SRE. Cette équipe a un rôle central au sein de Memo Bank : elle participe à la conception de nos produits bancaires, construit l'environnement de développement utilisé par nos équipes techniques, veille à ce que les services utilisés par nos clients restent disponibles, et met en place des scénarios de poursuite de l'activité dans le cas où l'un de nos centres de données deviendrait hors d'usage.

En plus de veiller à la bonne disponibilité de nos services, vous devrez assurer la sécurité et la performance de nos différentes applications, tout en les adaptant pour les rendre compatibles avec le développement de nos futurs produits bancaires. Nous déployons essentiellement nos applications sur AWS et GCP, mais il est important pour nous de ne pas nous lier trop fortement à un cloud provider et d'avoir un usage modéré des services managés. Cela demande parfois d'approfondir notre expertise sur certaines briques techniques, mais cela rend notre travail d'autant plus intéressant.

Memo Bank va avoir de plus en plus de clients et de trafic. Nous accompagnons donc les équipes de développement pour assurer la montée en charge des applications en participant aux choix d'architecture, en déployant des outils de monitoring et d'analyse (par exemple Prometheus, Grafana ou Tempo) et en gardant un oeil sur l'utilisation de nos ressources en production.

Pour finir, nous nous efforçons d'automatiser régulièrement le toil, c'est-à-dire les tâches manuelles, répétitives et à faible valeur ajoutée. Cela nous permet d'avoir un bon équilibre entre le run et le build pour développer par exemple nos propres outils quand c'est nécessaire. Pour donner une idée des projets que nous développons, nous proposons aux développeurs un outil pour le déploiement de nos releases et nous avons nos propres outils pour vérifier l'intégrité de nos nombreux backups.

Ce rôle consiste donc à participer à la maintenance et l'évolution de notre infrastructure technique (conçue à partir d'une page blanche en 2017) et déployée entièrement par le biais d'outils d'automatisation (Infrastructure as code). Voyez ça comme la construction de rails devant un train en marche - mais en moins risqué pour vos doigts.
L'équipe
Vous travaillerez au quotidien avec Matthieu, Guillaume et Maxime, en plus d'éventuels projets transverses qui vous amèneront à communiquer avec l'ensemble des collaborateurs. Une réunion d'équipe a lieu tous les lundis matin afin de faire le point sur les travaux en cours, demander conseil, et mettre à jour les priorités si besoin.

Nous construisons nos produits et notre organisation dans le calme, dans un environnement propice à la concentration. Par exemple, nous désignons chaque semaine une personne chargée de répondre prioritairement aux questions adressées à l'équipe SRE, afin de minimiser les interruptions pour les autres membres de l'équipe.

Vous pourrez donner votre avis sur de nombreux sujets en utilisant nos canaux de discussion dévolus à la collaboration : Confluence, pour les discussions asynchrones, fouillées, documentées ; Slack, pour les discussions brèves, rapides, informelles ; et GitLab, pour les discussions techniques liées à du code source lors de revues de code.

Pour vous donner une meilleure idée des sujets sur lesquels travaillent nos équipes techniques, voici quelques liens vers des articles et des présentations :
SRE at Memo Bank - Guillaume Arnaud
Building a reliable Core Banking System - Jérémie Martinez
Choosing an architecture - Joan Zapata ;
La communication dans une architecture orientée services - Joan Zapata ;
How we implemented a state machine framework - Joan Zapata ;
How we ensure eventual consistency in a distributed system - Joan Zapata

Les responsabilités
Dans les grandes lignes, vous aurez pour mission de :
Automatiser l'intégration et le déploiement en continu sur notre environnement cloud (AWS et GCP), à l'aide d'outils d'infrastructure as code tels que GitLab CI, Ansible, Terraform, et Spinnaker ;
Mesurer le bon fonctionnement de notre plateforme via la mise en place et l'exploitation d'indicateurs, d'alertes, et de tableaux de bord ;
-
Développer des outils et des applications permettant d'améliorer la mise en production par notre équipe technique ;
  • Site Reliability Engineer Flex

    il y a 4 semaines


    PARIS, 75000, Ile-de-France Free Temps plein

    About the jobScaleway is looking for a Site Reliability Engineer to join our IaaS/BMaaS SRE team.Reporting to our Engineering Manager Emerick Mounoury, you will BE responsible to ensure we can reliably deliver virtual machines and bare metal servers to our users around the world. We expect you to have a strong background in Python development and system...

  • Site Reliability Engineer

    il y a 4 semaines


    PARIS, 75000, Ile-de-France Iliad Temps plein

    Le posteFondée en 1999, Scaleway est la filiale cloud du groupe Iliad, l'un des leaders des télécommunications en Europe. Notre mission est de favoriser une industrie numérique plus responsable en aidant les développeurs et les entreprises à créer, déployer et adapter des applications à n'importe quelle infrastructure.Depuis nos bureaux...


  • PARIS, 75000, Ile-de-France AB Tasty Temps plein

    We are in search of a seasoned Lead Site Reliability Engineer (SRE) to steer our SRE team.This pivotal role involves leading the technical development and strategic implementation of our monitoring stack, SLI/SLO initiatives in collaboration with the product team, and enhancing the reliability and performance of our services.The ideal candidate will BE...

  • Site Reliability Engineer H/F

    il y a 4 semaines


    PARIS, 75000, Ile-de-France Ledger Temps plein

    Primary responsibilities :- Reporting to our SRE Manager, you will BE a member of Ledger's SRE team driving technology's transformation by launching new platforms, building tools, automating away complex issues, and integrating with the latest technology.- Site Reliability Engineers leverage their experience as software and systems engineers to...

  • Site Reliability Engineer H/F

    il y a 4 semaines


    PARIS, 75000, Ile-de-France Algolia Temps plein

    If you're a problem solver, able to think outside the box and eager to nurture others and learn from them, then this is your challenge !The TeamThe Infrastructure as a Service (IaaS) team aims at upholding the reliability and scalability we expect from Algolia's infrastructure for its critical systems and products. Our focus is on enabling teams...


  • PARIS, 75000, Ile-de-France Iliad Temps plein

    Le posteFondée en 1999, Scaleway est la filiale cloud du groupe Iliad, l'un des leaders des télécommunications en Europe. Notre mission est de favoriser une industrie numérique plus responsable en aidant les développeurs et les entreprises à créer, déployer et adapter des applications à n'importe quelle infrastructure.Depuis nos bureaux...


  • PARIS, 75000, Ile-de-France Ledger Temps plein

    Primary responsibilities :- Reporting to our SRE Manager, you will BE a member of Ledger's SRE team driving technology's transformation by launching new platforms, building tools, automating away complex issues, and integrating with the latest technology.- Site Reliability Engineers leverage their experience as software and systems engineers to...


  • PARIS, 75000, Ile-de-France Algolia Temps plein

    If you're a problem solver, able to think outside the box and eager to nurture others and learn from them, then this is your challenge !The TeamThe Platform as a Service (PaaS) team is dedicated to empowering development teams by creating toolchains, guidelines, and standards. Our focus is on enabling seamless automation and CI/CD, comprehensive...


  • Paris, Île-de-France Ibanfirst Sa Temps plein

    Site Reliability Engineer Collaborate with fellow Site Reliability Engineers, Incident Manager, and Software Engineers to troubleshoot incidents and implement measures to enhance our services continuously. Bonus Points: Experience with technologies such as Go, Java, PHP, ReactJS, and Python. Infrastructure: Working knowledge of Proxmox VE, Linux...


  • PARIS, 75000, Ile-de-France Scaleway Temps plein

    About the JobThe Object Storage team is a cornerstone of Scaleway. Our mission is to provide S3-compatible Object Storage to our clients but also to all the other Scaleway Elements products that rely on IT (Instances, Databases, Registry, and more). In a challenging environment, we (and hopefully you soon) manage hundreds of Object Storage servers across...

  • Site Reliability Engineer H/F

    il y a 4 semaines


    PARIS, 75000, Ile-de-France Ornikar Temps plein

    Et cette année 2024 sera riche en projets :- Création d'environnements éphémères pour nos équipes de développement.- Sécurité au sens large- Réduction et protection de surface d'exposition- Process et outillage à mettre en place (Trivy, Falco, ASM, CSM, etc.)- Migration de bases de données de MySQL vers PostgreSQL.- Stratégie...

  • Site Reliability Engineer

    il y a 4 semaines


    PARIS, 75000, Ile-de-France Scaleway Temps plein

    About the jobScaleway is looking for a Site Reliability Engineer to join our teams.Reporting to a Lead SRE, you will BE responsible to ensure we can reliably serve our products for users around the world. We expect you to have a strong background in development and system administration. Our systems evolve constantly and the tools needed to observe and act...


  • PARIS, 75000, Ile-de-France Algolia Temps plein

    As Manager Site Reliability Engineer in the Production Engineering team of Algolia, you will lead the Fleet team of Site Reliability Engineers responsible for the provisioning and the global reliability of the Search Products at scale.Your team will focus on creating pragmatic solutions to optimize the Search Products availability and costs at scale,...


  • Paris, Île-de-France Aurélie Bagot ( Consultante recrutement indépendante) Temps plein

    Je recherche pour un client start-up en plein essort un **Lead Site Reliability Engineer **dont les principales missions seront de:- Concevoir les architectures de qualité pour nos clients- Accompagner les juniors SRE dans leur quotidien et les faire monter en compétences- Garantir le delivery : avoir un plan pour réussir le projetVoici quelques exemples...

  • Site Reliability Engineer

    il y a 3 semaines


    Paris, Île-de-France Criteo Temps plein

    What You'll Do:Our Network Edge team plays a pivotal role by establishing essential connectivity among our data centers and Internet/Cloud providers. We engineer and manage the backbone network that guarantees smooth data transmission, enabling our platform to thrive globally.Responsibilities: Contribute to enhancing the reliability, performance, and...


  • Paris, Île-de-France Criteo Temps plein

    What You'll Do:Our Network Edge team plays a pivotal role by establishing essential connectivity among our data centers and Internet/Cloud providers. We engineer and manage the backbone network that guarantees smooth data transmission, enabling our platform to thrive globally.Responsibilities: Contribute to enhancing the reliability, performance, and...

  • Site Reliability Engineer

    il y a 1 semaine


    Paris, Île-de-France Symaps Temps plein

    The company is fully remote-enabled, allowing the 160 "BotBusters" spread around the world (and they are actively recruiting) Made up of six subteams (Dashboard, Engine, Infrastructure, Integrations, Threat Research & Security), the DataDome tech team is spread across Europe and the US. We are present in more than 25 data centers around the world, deployed...


  • Paris, Île-de-France Adobe Temps plein

    Join Adobe Stock Team as a Site Reliability Engineer (SRE)At Adobe, we are on a mission to revolutionize digital experiences. We equip individuals and businesses with the tools needed to create exceptional digital experiences, whether you are a budding artist or a global brand. Our focus is on enabling people to produce stunning images, videos, and apps,...

  • Site Reliability Engineer

    il y a 1 semaine


    Paris, Île-de-France DataDome Temps plein

    Made up of six subteams (Dashboard, Engine, Infrastructure, Integrations, Threat Research & Security), the DataDome tech team is spread across Europe and the US. We handle over 2 000 billion events per day giving responses within 3ms (99p). We are present in more than 25 data centers around the world, deployed using Docker. We deploy on AWS, Scaleway,...


  • PARIS, 75000, Ile-de-France DataDome Temps plein

    We deploy on AWS, Scaleway, Vultr, and GCP, using Docker, Ansible and Terraform, and monitor with Grafana and Prometheus. We handle an average of 10 billion requests per day and manage more than 350 TB of data per month.When IT comes to our stack, we run real-time detection layer in Java, low latency Stream Engine running on Flink in Scala, ElasticSearch for...