Site Reliability Engineer (SRE) – Datadog (IT) / Freelance
Allegis Group
About the role
Dans le cadre du renforcement des pratiques d?observabilité et de fiabilité opérationnelle, nous recherchons un Site Reliability Engineer (SRE) spécialisé sur Datadog.
Vous interviendrez sur des applications critiques afin de fiabiliser le Run, anticiper les incidents et améliorer la performance globale des systèmes. Vous intégrerez les équipes Ops / Plateforme / Production, en collaboration étroite avec les équipes Développement, Cloud et Sécurité.
Objectifs de la missionConsolider et industrialiser le monitoring et l?observabilité
Améliorer la qualité du Run
Anticiper et réduire les incidents récurrents
Renforcer la fiabilité et la résilience des applications du périmètre
Missions principalesObservabilité & Monitoring ? DatadogDéfinir, mettre en place et optimiser les dashboards Datadog
Configurer et maintenir l?APM (Application Performance Monitoring)
Implémenter des monitors (alerting, sondes, seuils dynamiques)
Créer des dashboards métiers et techniques pour les équipes applicatives
Superviser logs, métriques, traces et événements via : Datadog Logs
Datadog Metrics
Datadog Tracing
Profil candidat: Collaboration & Support TechniqueAccompagner les équipes Dev et Ops sur l?instrumentation applicative
Sensibiliser les équipes aux bonnes pratiques d?observabilité
Créer et maintenir des modèles standards de dashboards et d?alertes
Don't send a generic resume
Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.
Get started free