Ingénieur SRE
il y a 2 semaines
Contexte :
L?entreprise, acteur international de référence dans les technologies spatiales, la data-science et les solutions d?observation de la Terre, opère des services critiques présents dans plus de 30 pays. Avec plus de 1000 collaborateurs, elle conçoit et exploite des systèmes complexes combinant infrastructures on-premise, cloud, logiciels et chaînes de traitement data.
Au sein de la Direction des Systèmes d?Information (DSI), le département Opérations garantit le maintien en conditions opérationnelles (MCO), la fiabilité, la disponibilité et la performance de l?ensemble des services techniques fournis aux clients finaux.
Pour accompagner la forte croissance et renforcer la résilience des plateformes opérationnelles, l?entreprise recherche un :
Ce rôle est au c?ur des services critiques 24/7. Il combine pratiques SRE, ingénierie d?exploitation, automatisation, système, monitoring et coordination transverse. Vous interviendrez sur des environnements hybrides (cloud + on-premise), à forte exigence de disponibilité et de performance.
Missions :
1. Gestion des incidents :
Piloter les incidents majeurs et coordonner l?ensemble des équipes techniques jusqu?au rétablissement complet du service.
Mener les analyses post-incident, identifier les causes racines, proposer et suivre les actions préventives.
Formaliser et optimiser les processus et procédures opérationnelles.
2. Observabilité et monitoring :
Maintenir et faire évoluer les outils de supervision, d?observabilité et d?alerting.
Développer dashboards, métriques, logs et traces pour une visibilité complète sur l?état de santé des services.
Détecter faiblesses techniques, dépendances critiques et risques opérationnels.
Définir et suivre SLI/SLO avec les équipes produit et les parties prenantes métier.
3. Automatisation et industrialisation :
Automatiser les tâches répétitives pour réduire le toil opérationnel.
Mettre en place et améliorer les pipelines CI/CD et l?Infrastructure as Code.
Collaboration étroite avec les équipes de développement pour intégrer les bonnes pratiques SRE dans le cycle de vie logiciel.
Standardiser configurations, environnements et processus pour améliorer la fiabilité globale.
4. Coordination pluridisciplinaire :
Support niveau 2/3, en lien direct avec les équipes d?exploitation H24.
Coopération avec les équipes IT, les développeurs et les responsables produit pour corriger les incidents et prévenir les récidives.
Contribution au respect des engagements techniques, contractuels et calendaires.
Application des politiques de sécurité et maintien en condition de sécurité (MCS) des systèmes en lien avec la sécurité SSI.
Profil candidat:
Bac+5 en informatique, systèmes ou équivalent.
3 à 5 ans d?expérience en exploitation, ingénierie système ou SRE dans des environnements critiques.
Compétences techniques :
Systèmes & scripting : Linux, Bash, automatisation.
Conteneurs & orchestration : Docker, Kubernetes.
CI/CD & IaC : Git / GitLab, Ansible.
Cloud : connaissances AWS et/ou Azure.
Infrastructure IT : stockage, virtualisation, bases de données, réseaux.
Observabilité & monitoring : Zabbix, Grafana, CloudWatch, Prometheus, ELK / OpenSearch.
Compétences transverses :
Excellente capacité d?analyse en contexte critique.
Rigueur, autonomie, proactivité et sens des responsabilités.
Aisance de communication, travail en équipe, partage de connaissances.
Capacité à coordonner plusieurs acteurs dans des environnements techniques complexes.
-
SRE (Site Reliability Engineer) GCP ou AWS – H/F
il y a 1 semaine
Toulouse, Occitanie, France Talan - France Temps pleinTalanest un groupe international de conseil en transformation et en innovation par la technologie, créé en 2002.Nos consultantes et consultants partagent à travers le monde l'audace d'innover, le goût de l'excellence, et l'envie de relever les défis les plus complexes dans des secteurs variés tels que l'énergie, l'industrie, le transport, la finance,...
-
SRE (Site Reliability Engineer) GCP ou AWS – H/F
il y a 1 semaine
Toulouse, Occitanie, France Talan Temps pleinDescription de l'entrepriseTalan est un groupe international de conseil en transformation et en innovation par la technologie, créé en 2002.Nos consultantes et consultants partagent à travers le monde l'audace d'innover, le goût de l'excellence, et l'envie de relever les défis les plus complexes dans des secteurs variés tels que l'énergie,...
-
Ingénieur Observabilité
il y a 2 semaines
Toulouse, Occitanie, France Devoteam Temps pleinDescription de l'entreprise Devoteam Toulouse, avec ses 200 collaborateurs, est un acteur incontournable de la transformation digitale sur le bassin toulousain. Notre équipe de consultants experts accompagne nos clients dans la réalisation de leurs projets technologiques les plus ambitieux, en s'appuyant sur notre expertise en cloud & devOps,...
-
Ingénieur Observabilité
il y a 2 semaines
Toulouse, Occitanie, France Devoteam Temps pleinDevoteam Toulouse, avec ses 200 collaborateurs, est un acteur incontournable de la transformation digitale sur le bassin toulousain. Notre équipe de consultants experts accompagne nos clients dans la réalisation de leurs projets technologiques les plus ambitieux, en s'appuyant sur notre expertise en cloud & devOps, cybersécurité, gestion de projet et...
-
Ingénieur Observabilité
il y a 5 jours
Toulouse, Occitanie, France Devoteam Temps pleinDescription de l'entreprise Devoteam Toulouse, avec ses 200 collaborateurs, est un acteur incontournable de la transformation digitale sur le bassin toulousain. Notre équipe de consultants experts accompagne nos clients dans la réalisation de leurs projets technologiques les plus ambitieux, en s'appuyant sur notre expertise en cloud & devOps,...
-
Ingénieur système/infrastructure
il y a 2 semaines
Toulouse, Occitanie, France OVHcloud Temps pleinCDIIT, Technologie & ProduitTOULOUSE, FR, 31000NOTRE PARCOURS DE RECRUTEMENT1. Échange avec notre Talent Acquisition Specialist: Magali2. Entretien avec le Manager: Thibault3. Cas pratique (si pertinent)4. Rencontre avec un pair, un membre de l'équipe ou de la direction5. Débriefing ensembleNOS AVANTAGES ET BÉNÉFICES Une politique de télétravail...
-
Ingénieur DevOps/Ingénieure DevOps
il y a 7 jours
Toulouse, Occitanie, France GROUPE LR TECHNOLOGIES Temps pleinEn tant queIngénieur(e) DevOpsau sein deLR Technologies, vous interviendrez au sein de nos clients sur des sujets de sens et de valeurs.Vous serez en charge de :Architecture & plateformesConcevoir, maintenir et faire évoluer des architectures CI/CD robustes et scalables.Gérer des environnements hybrides (Cloud / On-Prem) : AWS, Azure, GCP ou...
-
Ingenieur Devops
il y a 2 semaines
Toulouse, Occitanie, France Inetum Temps pleinDescription de l'entreprise Inetum est un leader européen des services numériques. Pour les entreprises, les acteurs publics et la société dans son ensemble, les consultants et spécialistes du groupe visent chaque jour l'impact digital : des solutions qui contribuent à la performance, à l'innovation et au bien commun. Présent dans 19 pays au plus...
-
Ingénieur Reseaux Et Securite
il y a 4 jours
Toulouse, Occitanie, France Inetum Temps pleinDescription de l'entreprise Inetum est un leader européen des services numériques. Pour les entreprises, les acteurs publics et la société dans son ensemble, les consultants et spécialistes du groupe visent chaque jour l'impact digital : des solutions qui contribuent à la performance, à l'innovation et au bien commun. Présent dans 19 pays au plus...
-
Service Delivery Manager
il y a 2 semaines
Toulouse, Occitanie, France 2ICS Temps pleinContexteDans un environnement industriel en forte croissance, notre client basé à Toulouse recherche un.e Service Delivery Manager (SDM) rattaché.e directement à la Direction de l?Édition Logicielle.Ce rôle est déterminant pour garantir la qualité, la stabilité et l?efficacité du delivery des solutions logicielles, tout en accompagnant...