Skip to content
mimi

[S3NS] SRE Monitoring & Observability (H/F)

Thales

Paris · On-site Full-time Mid Level 3w ago

About the role

QUI SOMMES-NOUS ?

S3NS est né du partenariat industriel entre Thales, leader mondial de la cyber sécurité, et Google Cloud, leader mondial des solutions cloud. Nous avons pour ambition d’offrir le meilleur des deux mondes à l’ensemble des organisations soucieuses de protéger leurs données sensibles (institutions publiques, OIV, OSE…). C’est-à-dire une solution équivalente à Google Cloud Platform (incluant à la fois les services IaaS et PaaS de GCP) et respectant les exigences du label SecNumCloud.

Une première offre, ‘Contrôles locaux avec S3NS’, est déjà disponible depuis février 2023 pour permettre à nos clients de bénéficier d’un premier niveau de transparence et contrôles additionnels, et d'accélérer la trajectoire vers le cloud de confiance.

Vos missions

Rattaché au responsable de l'équipe Engineering S3NS, vous aurez pour missions :

  • Maintenir et faire évoluer la stack de monitoring des infrastructures S3NS “on prem”: Zone de Service Partagées et Partner Space
  • Assurer le suivi et le respect des engagements de disponibilité de ces stacks de monitoring (SLI, SLO, SLA) envers Google et les équipes S3NS.
  • Fournir des recommandations (règles de nommage, granularité…) permettant une utilisation homogène de cette stack de monitoring et supporter les équipes dans la mise en œuvre de leur métriques, dashboard, alertes.
  • Participer aux astreintes de l’équipe PS Platform, assurer la réponse aux incidents, contribuer aux post-mortems et plans de prévention.
  • Automatiser les tâches d’exploitation récurrentes via scripts et pipelines CICD
  • Contribuer aux autres périmètres de l’équipe “Platform”: IaaS/KaaS/CICD

Périmètre Technique

  • Métriques: Prometheus / Mimir
  • Dashboard: Grafana
  • Logs: Loki
  • Alerting & on-call: Alertmanager, Signl4

Votre profil

  • Vous disposez d'un bac+5 en informatique avec 3 ans d'expérience minimum sur un poste similaire.
  • Vous maitrisez :
    • les concepts SRE: disponibilité, fiabilité, SLA/SLO/SLI, error budget, on-call, post-mortem blameless
    • La stack k8S on-prem: CNI, gestion du storage, gestion des clusters
    • La Maîtrise des composants de la stack monitoring / observabilité

La gestion du stress et des incidents, une communication claire et un esprit d’analyse et de résolution de problèmes complexes sont des atouts que l'on vous reconnait?

Alors ce poste est fait pour vous!

Skills

AlertmanagerCNIGrafanaK8sLokiMimirPrometheusSRESignl4

Don't send a generic resume

Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.

Get started free