Site Reliability Engineer
Free-Work
About the role
Dans le cadre du renforcement des pratiques d’observabilité et de fiabilité opérationnelle, nous recherchons un Site Reliability Engineer (SRE) spécialisé sur Datadog.
Vous interviendrez sur des applications critiques afin de fiabiliser le Run, anticiper les incidents et améliorer la performance globale des systèmes.
Vous intégrerez les équipes Ops / Plateforme / Production, en collaboration étroite avec les équipes Développement, Cloud et Sécurité.
Objectifs de la mission
Consolider et industrialiser le monitoring et l’observabilité Améliorer la qualité du Run Anticiper et réduire les incidents récurrents Renforcer la fiabilité et la résilience des applications du périmètre
Missions principalesObservabilité & Monitoring – Datadog
Définir, mettre en place et optimiser les dashboards Datadog Configurer et maintenir l’APM (Application Performance Monitoring) Implémenter des monitors (alerting, sondes, seuils dynamiques) Créer des dashboards métiers et techniques pour les équipes applicatives Superviser logs, métriques, traces et événements via : Datadog Logs Datadog Metrics Datadog Tracing
Profil candidat:
Collaboration & Support Technique
Accompagner les équipes Dev et Ops sur l’instrumentation applicative Sensibiliser les équipes aux bonnes pratiques d’observabilité Créer et maintenir des modèles standards de dashboards et d’alertes
Don't send a generic resume
Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.
Get started free