Consultant Senior SRE DevOps
HOXTON PARTNERS
About the role
Mission
Dans le cadre d’un programme stratégique au sein d’un grand groupe du secteur du luxe, nous recherchons un consultant senior SRE DevOps disposant d’une forte expertise sur AWS et d’une expérience concrète dans l’automatisation de la remédiation d’incidents via des agents IA.
La mission s’inscrit dans un environnement exigeant, orienté fiabilité, performance et industrialisation des opérations. Le consultant interviendra sur des sujets de Site Reliability Engineering, d’automatisation avancée, d’observabilité et d’optimisation de la production, avec une forte dimension innovation autour des LLM et des agents autonomes.
Responsabilités
- Contribuer à la fiabilité, à la stabilité et à la performance des plateformes cloud AWS ;
- Concevoir et mettre en œuvre des mécanismes de remédiation automatique d’incidents ;
- Intégrer des agents IA dans les workflows d’exploitation, de troubleshooting et de runbooks ;
- Participer à la mise en place de chaînes d’automatisation autour du monitoring, de l’alerting et de la gestion des incidents ;
- Travailler sur des architectures et outils liés à Kubernetes, Docker, Terraform, Ansible et Helm ;
- Collaborer avec les équipes infrastructure, applicatives, sécurité et opérations pour améliorer la résilience globale des services ;
- Contribuer à l’observabilité et à l’exploitation des données issues d’outils tels que Datadog, Dynatrace, New Relic ou Elastic ;
- Accompagner l’industrialisation des pratiques DevSecOps, de la gestion des accès, des secrets et des sujets IAM.
Profil candidat
Nous recherchons un profil senior disposant d’une solide expérience en SRE / DevOps dans des environnements cloud complexes, avec une maîtrise impérative d’AWS.
Le consultant doit également justifier d’une expérience significative sur les sujets suivants :
- Automatisation avancée des opérations et de la remédiation incident ;
- Agents IA, LLM, RAG, orchestration d’agents et workflows automatisés ;
- Outils et frameworks tels que LangChain, LlamaIndex ou AutoGen ;
- Conteneurisation et orchestration avec Docker et Kubernetes ;
- Infrastructure as Code et automatisation avec Terraform, Ansible et Helm ;
- Bonnes bases de développement / scripting en Python, Go ou Node.js ;
- Culture forte de la production, du monitoring, de la fiabilité et de l’amélioration continue.
Une expérience dans des environnements exigeants, avec de forts enjeux de qualité de service et de réactivité, sera particulièrement appréciée.
Skills
Don't send a generic resume
Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.
Get started free