Observability Expert
il y a 4 jours
I. Contexte :
Notre département IT souhaite mettre en place et animer une Communauté de Pratique dédiée à l'observabilité et à la supervision de nos applications métiers.
En tant qu'expert Observabilité/Supervision, vous serez chargé de définir et mettre en œuvre une stratégie d'observabilité complète (monitoring, logs, alerting, tracing) afin de garantir une visibilité en temps réel sur l'état de santé, les performances et le comportement de nos applications.
Ces solutions permettront une détection proactive des incidents, un diagnostic rapide des problèmes et assureront la disponibilité de nos services critiques.
L'environnement applicatif est hybride, composé de solutions cloud (D365, Power Apps, services Azure, Data product Fabric) et d'applications hébergées on-premise sur serveurs Windows (sites web, serveurs IIS, etc.).
II. Missions :
- Référent technique pour contribuer à la construction et à l'implémentation des composants de supervision et des pipelines d'observabilité
- Fournir une expertise et, si nécessaire, participer à la conception, l'intégration et le déploiement des solutions de supervision (dashboards, collecte de logs, tracing, détection d'anomalies basée sur l'IA, etc.)
- Collaborer avec les équipes de développement, d'exploitation et de sécurité pour intégrer les outils et pratiques d'observabilité dans les pipelines CI/CD
- Apporter son expertise lors des incidents et des analyses de causes racines.
- Identifier les besoins spécifiques de chaque équipe et définir des plans d'accompagnement.
- Développer et maintenir des tableaux de bord et rapports pour visualiser les performances applicatives
- Analyser et interpréter les métriques pour identifier les tendances et détecter les problèmes de manière proactive
- Définir la gouvernance, les règles de fonctionnement et les objectifs de la Communauté.
- Mettre en place des outils collaboratifs (wiki, canaux Teams)
- Organiser et animer des sessions de la communauté
- Favoriser les échanges inter-équipes et le partage de connaissances
- Co-construire des standards techniques et des guidelines avec les équipes
- Rédiger des guides de bonnes pratiques et de la documentation technique
- Assurer une veille active sur les technologies et pratiques d'observabilité
- Évaluer et tester de nouveaux outils du marché
- Proposer des POC et des expérimentations innovantes.
Profil candidat:
III. Compétences techniques attendues :
Expertise des concepts d'observabilité (métriques, logs, traces) :
- Expertise : Azure Monitor, Grafana, App Insight
- Outils et plateformes AI Ops (ex. : Azure AI Monitor, Dynatrace, Davis AI, Moogsoft, New Relic AI, DataDog Watchdog, ou solutions similaires)
- Évaluer, recommander et déployer des fonctionnalités d'observabilité pilotées par l'IA pour améliorer l'efficacité opérationnelle et la gestion proactive des incidents.
- Écosystèmes Power Platform (D365, Power Apps, Flux Power Automate)
- Connaissance des plateformes de données basées sur Microsoft Fabric
- Connaissance des environnements Windows on-premise
- Connaissance d'autres solutions comme Prometheus, OpenTelemetry, ELK Stack est un plus.
Solide expérience des pratiques DevOps et SRE (Site Reliability Engineering) :
- Maîtrise des technologies de conteneurisation (Docker, Kubernetes)
- Connaissance des pipelines CI/CD avec GitHub Actions ou AzD YAML
- Expérience de l'infrastructure as code (Terraform, Ansible)
IV. Soft skills :
- Capacité à fédérer et mobiliser des équipes pluridisciplinaires
- Capacité à animer des groupes de travail et à faciliter des ateliers
- Capacité à vulgariser des concepts techniques complexes
- Autonomie, proactivité et ténacité
- Anglais courant
-
Observability - Dynatrace Expert
il y a 2 semaines
Paris, Île-de-France Kyndryl Temps pleinWho We AreAt Kyndryl, we design, build, manage and modernize the mission-critical technology systems that the world depends on every day. So why work at Kyndryl? We are always moving forward – always pushing ourselves to go further in our efforts to build a more equitable, inclusive world for our employees, our customers and our communities.The RoleWe're...
-
Observability & Alerting Engineer (Grafana)
il y a 2 semaines
Paris, Île-de-France OneSource Consulting Temps pleinTitle : Observability & Alerting Engineer (Grafana)Contract Duration : 3-month contractWorkplace : 75001 Paris, FranceRemote Option : Full RemoteLanguage : FrenchDescription :The Group has deployed a new observability and alerting solution, but some entities lack the necessary skills to implement it. We are looking for an engineer to support these entities...
-
SRE Architect
il y a 2 jours
Paris, Île-de-France Photon Group Temps pleinDescription Site Reliability Engineering Architect (SRE Architect) Pillar Alignment: Reliability Summary: The SRE Architect is a senior engineer responsible for designing and implementing the foundational platforms and practices for system stability, performance, and efficiency across all Tech Engineering solutions. This hands-on role will build out...
-
Technical writer h/f
il y a 4 jours
Paris, Île-de-France FREELANCE Temps pleinAu sein d?une grande organisation internationale Tech & Data (~200 personnes), vous intervenez dans une équipe Technical Operations structurée autour de 2 assets majeurs :CI Factory (Engineering Platform)Observability PlatformObjectif : professionnaliser et structurer la documentation technique afin de faciliter l?onboarding, harmoniser les pratiques et...
-
GenAI E2E Observability Implementation Engineer
il y a 2 semaines
Paris, Île-de-France Tata Consultancy Services Temps pleinTata Consultancy Services (TCS) est une société de services informatiques et de conseil qui s'associe depuis 55 ans à de nombreuses entreprises parmi les plus importantes au monde dans leurs parcours de transformation. En tant que membre du groupe Tata, le plus grand groupe multinational de l'Inde, TCS compte plus de consultants parmi les mieux formés au...
-
Account Executive Public Sector
il y a 2 jours
Paris, Île-de-France Elastic Temps pleinWhat Is The RoleElastic, the Search AI company, is looking for a high-energy Public Sector Account Executive to drive net-new revenue and expansion within the French Public Sector. You'll build your own pipeline, tell the Elastic Search AI story, and close complex, multi-stakeholder deals in a consumption-based model. This role sits at the intersection of...
-
Senior FullStack Developer
il y a 7 jours
Paris, Île-de-France CryptoNext Security Temps plein*Who we are*CryptoNext Security is a deeptech startup specializing inpost-quantum cryptography. We help institutions and enterprises prepare for a future where quantum computers will break current cryptographic standards.We work with major players infinance, defense, and telecommunications, delivering cutting-edge, quantum-safe security solutions.*On a daily...
-
Senior DevOps Engineer, Managed Platform Team
il y a 2 semaines
Paris, Île-de-France Teads Temps pleinAbout TeadsTeads is the omnichannel outcomes platform for the open internet, driving full-funnel results for marketers across premium media. With a focus on meaningful business outcomes for branding and performance objectives, the combined company ensures value is driven with every media dollar by leveraging predictive AI technology to connect quality media,...
-
Senior Probe Appliance Engineer
il y a 7 jours
Paris, Île-de-France CryptoNext Security Temps plein*Who we are*CryptoNext Security is a deeptech startup specializing inpost-quantum cryptography. We help businesses and institutions get ready for a world where quantum computers will break today's cryptography.Our customers include major banks, defense actors, telecom operators, and large enterprises securing their most sensitive infrastructures.*On a daily...
-
principal software engineer, eu
il y a 3 jours
Paris, Île-de-France STATION F Temps pleinAboutDfns is the leading Wallets-as-a-Service (WaaS) platform, helping fintechs, institutions, and enterprises simplify digital asset management and securely onboard users onchain.Its API-first wallet platform unifies transaction management, workflow governance, key deployment, and third-party integrations into one secure operating system for blockchains....