Site Reliability Engineer Expérimenté
Hyperweb
About the role
Nous recherchons un Site Reliability Engineer expérimenté, avec une approche d’ingénierie forte, capable de faire évoluer la plateforme vers plus de fiabilité, de performance et de maîtrise opérationnelle. Poste basé à Grenoble – télétravail hybride (2–3 jours / semaine). Vous intervenez sur deux produits, avec une approche orientée valeur et impact business. 🟢 Pleenk – Plateforme de paiement crypto & identité Pleenk est une plateforme moderne permettant l’intégration de paiements en cryptomonnaie avec des mécanismes avancés de gestion d’identité et de conformité (KYC, onboarding, traçabilité). Son ambition est claire : fournir une infrastructure fiable, sécurisée et observable, capable de supporter des flux financiers critiques. L’infrastructure est pensée comme un produit à part entière : automatisée, mesurable et conçue pour accompagner la croissance rapide du système. Infra & SRE • Kubernetes
• CI/CD industrialisée
• Observabilité (logs, métriques, alerting)
• Infrastructure as Code
Les enjeux principaux : fiabilité des flux financiers, sécurité, traçabilité, résilience et scalabilité. 🔵 Plateforme marketplace Plateforme en production depuis plus de 15 ans, avec : • Trafic élevé
• Volumes de données importants
• Contraintes de disponibilité fortes
• Évolutions fonctionnelles continues
L’enjeu est de faire évoluer l’infrastructure pour accompagner un passage à l’échelle international, tout en garantissant stabilité et performance. Infra & SRE • Kubernetes (bare metal)
• CI/CD (Jenkins / GitLab CI)
• PostgreSQL, Elasticsearch
• Systèmes distribués
Les enjeux principaux : scalabilité, performance, disponibilité et maîtrise des coûts d’exploitation. Votre mission Fiabilité & Résilience Garantir la disponibilité et la stabilité des systèmes en production. Définir et suivre les indicateurs de fiabilité (SLA, SLO, SLI). Améliorer en continu la résilience des systèmes (gestion des pannes, fallback, retry, circuit breakers). Observabilité & Run Mettre en place et faire évoluer l’observabilité (logs, métriques, traces). Améliorer la détection et la résolution des incidents. Mener des post-mortems orientés amélioration continue. Réduire le bruit d’alerting et améliorer la pertinence des signaux. Automatisation & Plateforme Automatiser l’exploitation et réduire le toil. Améliorer les pipelines CI/CD et les processus de déploiement. Faire évoluer les environnements (dev, staging, prod) pour plus de fiabilité et de reproductibilité. Concevoir des outils internes pour améliorer la productivité des équipes. Infrastructure & Performance Faire évoluer Kubernetes et l’infrastructure associée. Optimiser les performances (latence, ressources, coût). Opérer et sécuriser les composants critiques (bases de données, services techniques). Anticiper les problématiques de passage à l’échelle. Collaboration Produit & Engineering Travailler en proximité avec les développeurs pour concilier vitesse et fiabilité. Accompagner les équipes sur les bonnes pratiques (déploiement, monitoring, gestion d’erreurs). Participer aux choix techniques structurants. Faire de la plateforme un levier d’accélération produit, pas un frein.
Don't send a generic resume
Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.
Get started free