Skip to content
mimi

[LFR] Site Reliability Engineering | DIRECT SRE/ DATADOG, Sénior à La Garenne-Colombes - 1424 (IT) / Freelance

ISUPPLIER

La Garenne-Colombes · Hybrid 5d ago

About the role

Description et localisation

  • Localisation : Garennes‑Colombes (présentiel partiel souhaité)

Contexte de la mission

Dans le cadre du renforcement des pratiques d’observabilité et de fiabilité opérationnelle, le client souhaite intégrer un Site Reliability Engineer (SRE) spécialisé sur Datadog.
L’objectif est de consolider le monitoring, d’améliorer la qualité du Run, d’anticiper les incidents et de fiabiliser les applications critiques du périmètre.
Intervention au sein des équipes Ops / Plateforme / Production, en lien direct avec les équipes Dev, Cloud et Sécurité.

Missions principales

Observabilité & Monitoring Datadog

  • Définir, mettre en place et optimiser les dashboards Datadog.
  • Configurer l’APM (Application Performance Monitoring).
  • Implémenter des monitors (alerting, sondes, seuils dynamiques).
  • Mettre en place des dashboards métiers et techniques pour les équipes applicatives.
  • Superviser logs, métriques, traces et événements via Datadog Logs / Metrics / Tracing.

Fiabilité & Performance (SRE)

  • Analyser les incidents récurrents et proposer des actions de remédiation.
  • Définir et suivre les SLO / SLI / SLA.
  • Participer à la réduction du toil et à l’automatisation des tâches répétitives.
  • Participer aux post‑mortems (blameless) et à la mise en place d’actions correctives.

Automatisation & Pipeline CI/CD

  • Automatiser la configuration Datadog via Terraform / Ansible / CI‑CD.
  • Participer à l’intégration Datadog dans les pipelines de déploiement.
  • Contribuer à l’industrialisation des pratiques d’observabilité.

Collaboration & Support technique

  • Accompagner les équipes Dev et Ops sur la bonne instrumentation applicative.
  • Sensibiliser les équipes à l’observabilité (good practices).
  • Participer à la création de modèles de dashboards / alertes standardisés.

Détails du projet

  • Type de projet : Support
  • Type de prestation : Hybrid (Client / Hybrid / Remote)
  • Fréquence : 3 jours / semaine chez le client
  • Astreintes : Non (HNO, etc.)
  • Possibilité de renouvellement : Oui

Responsibilities

  • Définir, mettre en place et optimiser les dashboards Datadog.
  • Configurer l'APM (Application Performance Monitoring).
  • Implémenter des monitors (alerting, sondes, seuils dynamiques).
  • Mettre en place des dashboards métiers et techniques pour les équipes applicatives.
  • Superviser logs, métriques, traces et événements via Datadog Logs / Metrics / Tracing.
  • Analyser les incidents récurrents et proposer des actions de remédiation.
  • Définir et suivre les SLO / SLI / SLA.
  • Participer à la réduction du toil et à l'automatisation des tâches répétitives.
  • Participer aux post-mortems (blameless) et à la mise en place d'actions correctives.
  • Automatiser la configuration Datadog via Terraform / Ansible / CI-CD.
  • Participer à l'intégration Datadog dans les pipelines de déploiement.
  • Contribuer à l'industrialisation des pratiques d'observabilité.
  • Accompagner les équipes Dev et Ops sur la bonne instrumentation applicative.
  • Sensibiliser les équipes à l'observabilité (good practices).
  • Participer à la création de modèles de dashboards / alertes standardisés.

Skills

AnsibleCI/CDDatadogDevOpsLogsMetricsTerraformTraces

Don't send a generic resume

Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.

Get started free