Site Reliability Engineer
OVH GmbH
About the role
Processus de recrutement
- Échange avec notre Talent Acquisition Specialist: Magali
- Entretien avec le Manager: Aymen
- Cas pratique (si pertinent)
- Rencontre avec un pair, un membre de l'équipe ou de la direction
- Débriefing ensemble
Avantages
- Une politique de télétravail hybride
- Un plan d'actionnariat salarié
- Un programme de reconnaissance de l'ancienneté
- Des subventions vacances et sport
- Berceau et crèche d'entreprise (selon site)
- Des équipes multiculturelles
- Des locaux bien équipés
- Une plateforme de formation et de certification en ligne
- Une offre d'accompagnement médical et social digitalisée pour vous et votre famille
Diversité et inclusion
OVHcloud valorise la diversité des personnes qu’elle embauche et accompagne. La diversité pour nous, c’est favoriser un milieu de travail où les différences individuelles sont reconnues, appréciées et respectées de façon à développer le plein potentiel et les forces de chacune et chacun. Soyez libre d’être vous-même
Intelligence artificielle
L'intelligence artificielle réinvente nos métiers au quotidien. Rejoignez-nous pour explorer ses immenses possibilités et coconstruire l'avenir
Égalité femmes‑hommes
Nous savons que les femmes peuvent parfois s'abstenir de postuler si elles ne répondent pas à 100 % des critères d’une offre. Nous souhaitons clarifier : nos fiches de poste sont des repères, pas des barrières. Nous avons hâte de recevoir votre candidature.
Présentation de l’entreprise
Vous voulez contribuer à des projets uniques pour construire ensemble le cloud libre ? Allons-y Chez OVHcloud, nous sommes animés par la même volonté, celle de construire l’avenir ensemble pour défendre la liberté d’innover. Découvrez l'acteur majeur du cloud libre et responsable.
Équipe et rôle
Au sein de votre équipe #OneTeam Vous intégrez la Squad GPIO NEOS pour devenir un pilier de la nouvelle équipe SRE. Votre rôle est hybride : vous êtes le garant du socle SRE moderne (K8s, Auto), tout en apportant une expertise réseau et en pilotant l'adoption de l'IA pour nos opérations.
Vos principales responsabilités
- Infrastructure & Cloud : Vous maintenez et faites évoluer des clusters Kubernetes et des environnements OpenStack via Terraform et Ansible.
- Administration Système : Vous assurez l'ingénierie système avancée sous Linux tout en garantissant l'intégration fluide avec les environnements Windows et MacOS.
- Réseau Interne : Vous appliquez vos connaissances réseaux avancées pour gérer la connectivité et la segmentation des services internes.
- Développement & Automatisation : Vous concevez des outils d'automatisation et des scripts de maintenance en Python ou Go intégrés aux pipelines CI/CD.
- Observabilité : Vous configurez la surveillance proactive des systèmes et des réseaux via la stack Prometheus / Grafana.
- Outillage IA : Vous utilisez et intégrez des assistants de code IA (Cursor, Copilot) pour accélérer le développement et optimiser les scripts de l'équipe.
- Interface Utilisateur : Vous développez ponctuellement des dashboards internes en React pour visualiser l'état des services.
Votre futur impact
Dans 4 à 6 mois
- Vous serez autonome sur l'administration complète de notre stack interne (OpenStack/K8s) et la gestion des interconnexions réseaux.
- Vous contribuerez à moderniser nos opérations en ayant automatisé les tâches récurrentes grâce à vos développements assistés par l'IA.
Compétences requises
- Vous êtes issu(e) d’une formation BAC+5 avec un solide bagage en infrastructure et système.
- Vous maîtrisez l'environnement Linux (niveau avancé) ainsi que les conteneurs (Docker, Kubernetes).
- Vous possédez de solides compétences en Réseau (Routage, TCP/IP, Firewalling) indispensables pour ce poste.
- Vous êtes à l'aise avec le développement logiciel backend (Python, Go) et avez des bases en frontend (React).
- Vous avez une expérience concrète de l'Automatisation (Ansible, Terraform, CI/CD) et de l'observabilité (Prometheus).
- Vous êtes expert Linux et curieux(se) des nouvelles méthodes de développement (IA Generative).
C’est un +
- Vous avez déjà mis en place des solutions de monitoring intelligentes (IA).
- Vous av
Requirements
- You have a BAC+5 training with a solid background in infrastructure and system.
- You master the Linux environment (advanced level) as well as containers (Docker, Kubernetes).
- You have solid network skills (Routing, TCP/IP, Firewalling) essential for this position.
- You are comfortable with backend software development (Python, Go) and have frontend basics (React).
- You have concrete experience in Automation (Ansible, Terraform, CI/CD) and observability (Prometheus).
- You are a Linux expert and curious about new development methods (Generative AI).
Responsibilities
- You maintain and evolve Kubernetes clusters and OpenStack environments via Terraform and Ansible.
- You ensure advanced system engineering under Linux while guaranteeing smooth integration with Windows and MacOS environments.
- You apply your advanced network knowledge to manage internal service connectivity and segmentation.
- You design automation tools and maintenance scripts in Python or Go integrated into CI/CD pipelines.
- You configure proactive system and network monitoring via the Prometheus / Grafana stack.
- You use and integrate AI code assistants (Cursor, Copilot) to accelerate development and optimize team scripts.
- You occasionally develop internal dashboards in React to visualize service status.
Benefits
Skills
Don't send a generic resume
Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.
Get started free