Skip to content
mimi

System Engineer/Site Reliability Engineer OMCOPA (m/w/d)

Atruvia AG

Münster (Hessen) · flexible Full-time Today

About the role

About

In dieser Rolle treibst du die Einführung von SRE-/DevOps-Praktiken voran und berätst Entwicklungsteams. Du sicherst Systemstabilität durch Observability, Monitoring und Kapazitätsplanung und verantwortest 2nd/3rd Level-Support sowie Root-Cause-Analysen. Du optimierst Betriebsprozesse und Automationen und entwickelst Ideen zur Steigerung von Kundenzufriedenheit und Verfügbarkeit. Dabei arbeitest du standortübergreifend im Site Reliability Engineering Chapter/Squad und wirkst an Sicherheits- und Compliance-Themen mit. Dein Beitrag unterstützt die digitale Transformation in der Bankenwelt und die Betriebszuverlässigkeit unserer Services.

Benefits

  • 30 Tage Urlaub
  • Teilzeit möglich + 30–40 h Vollzeit-Option
  • Lebensarbeitszeitkonto / Sabbatical
  • Bike-/IT-Hardware-Leasing und vermögenswirksame Leistungen
  • betriebliche Altersvorsorge

Responsibilities

  • Einführung von SRE-/DevOps-Praktiken und Beratung der Entwicklungsteams
  • Sicherung der Systemstabilität durch Observability, Monitoring (Prometheus, Grafana, Dynatrace) und Kapazitätsplanung
  • Störungsbehebung mit Root-Cause-Analysen und 2nd/3rd Level-Support
  • Optimierung und Weiterentwicklung von Betriebsprozessen und Automationen mittels Scriptsprachen und Tools
  • Entwicklung von Ideen zur Steigerung der Kundenzufriedenheit und Verfügbarkeit unserer Services
  • Unterstützung bei Sicherheits- und Compliance-Themen sowie Umsetzung von Best Practices

Qualifications

  • Abgeschlossenes Studium der Informatik oder vergleichbare Qualifikation
  • Kenntnisse in Automatisierung und Performance-Optimierung sowie Stabilisierung/Skalierung kritischer Produktionsservices
  • Praktische Erfahrung mit SRE-/DevOps-Methoden, Monitoring-Tools und Cloud-Technologien (Kubernetes, Docker)
  • Kenntnisse in Scriptsprachen/Programmiersprachen (Bash, Perl, Python, Go, Node.js) und GIT
  • Praktische Erfahrung mit Google Cloud Platform (GCP), insbesondere GKE
  • Erfahrung mit SRE, SLIs/SLOs, Error Budget, Toil Reduktion und agiler Softwareentwicklung
  • Verhandlungssichere Deutschkenntnisse (mindestens C1) und gute Englischkenntnisse (B2)
  • Hohe Teamfähigkeit, analytisches Denken, Kommunikationsfähigkeit sowie selbständige Arbeitsweise und Eigeninitiative

Skills

BashDockerDynatraceGitGoGrafanaগ্রুপKubernetesNode.jsPerlPrometheusPythonSRESite Reliability Engineering

Don't send a generic resume

Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.

Get started free