AI Platform & Cloud Engineer (m/w/d), Köln
Anstalt für kommunale Datenverarbeitung Bayern
About the role
About
Wir machen Deutschlands Verwaltung digital. Gestalte mit uns Softwarelösungen für eine digitale und moderne Verwaltung, die das Miteinander von Bürger:innen und Verwaltungen in Städten sowie Gemeinden organisieren - bayern- und bundesweit.
Im Bereich AI & Cloud entwickeln wir skalierbare, sichere und souveräne KI-Lösungen für die öffentliche Verwaltung. Unser Anspruch ist es, generative KI produktiv, verantwortungsvoll und wirtschaftlich nutzbar zu machen. Dabei verbinden wir moderne Cloud-Architekturen mit hohen Anforderungen an Datenschutz, Stabilität und Nachhaltigkeit.
Your New Job as AI Platform & Cloud Engineer (m/f/d)
- You will design and build a productive, scalable AI platform based on cloud and Kubernetes – not a proof-of-concept, but a real production system.
- You will develop LLM and GenAI applications that make administrative processes measurably more efficient.
- You will orchestrate different LLM providers and models and develop a flexible, interchangeable architecture.
- You will establish clean DevOps and MLOps standards – from CI/CD to monitoring and observability.
- You will automate infrastructure and deployments using Infrastructure as Code and container technologies.
- You will take technical responsibility for performance, scalability, security, and sustainable operation in a regulated environment.
This is You
- Several years of experience in building and operating cloud-native systems in a production environment – ideally with Kubernetes, Docker, and Infrastructure as Code (e.g., Terraform, Helm).
- Very good knowledge of Python (Go is a plus) and a solid understanding of software engineering for robust, maintainable systems.
- Practical experience with machine learning frameworks (e.g., PyTorch or TensorFlow) and production-deployed LLM architectures or GenAI applications.
- Experience with CI/CD, DevOps, and ideally MLOps principles, including monitoring stacks (e.g., Prometheus, Grafana) and workflow orchestration (e.g., Airflow).
- Confident use of relational databases (e.g., PostgreSQL) and a good understanding of performance and scaling issues of distributed systems.
- Technical architectural thinking, a commitment to quality, and ideally experience in a regulated environment (data protection, security-by-design).
What We Offer You
- Experience an approachable and value-driven leadership & corporate culture that supports innovative and self-directed work.
- Choose a secure workplace: Our employment contracts come with an attractive salary and are usually permanent.
- Stay flexible in terms of time: Together with your team, you will plan your workday between flextime and mobile working. Work from home up to 60%.
- Enjoy your life beyond work: 30 days of vacation + 3 paid days off ensure a good work-life balance.
- Combine work and vacation: Use up to 30 days of workation in the European Economic Area (including Iceland, Liechtenstein, Norway, and Switzerland) – simply coordinate with your team and get started!
- Develop yourself: Study part-time with our support and be accompanied on your path by further training, talent management, and more.
- Work in a pleasant environment with excellent public transport connections: Our modern offices are centrally located depending on the site and feature a roof terrace, underground parking...
- Enjoy our feel-good goodies: Benefit from our corporate benefits, e.g., subsidized childcare, discounted Deutschlandticket, and changing employee events.
If you have any questions, please feel free to contact the recruiting team at 089/5903-1780. We look forward to receiving your online application, including your salary expectations and earliest possible start date.
Requirements
- Mehrjährige Erfahrung im Aufbau und Betrieb cloud-nativer Systeme im produktiven Umfeld - idealerweise mit Kubernetes, Docker und Infrastructure as Code (z. B. Terraform, Helm).
- Sehr gute Kenntnisse in Python (Go ist ein Plus) sowie ein solides Software-Engineering-Verständnis für robuste, wartbare Systeme.
- Praktische Erfahrung mit Machine-Learning-Frameworks (z. B. PyTorch oder TensorFlow) und produktiv eingesetzten LLM-Architekturen oder GenAI-Anwendungen.
- Erfahrung mit CI/CD-, DevOps- und idealerweise MLOps-Prinzipien inklusive Monitoring-Stacks (z. B. Prometheus, Grafana) und Workflow-Orchestrierung (z. B. Airflow).
- Sicherer Umgang mit relationalen Datenbanken (z. B. PostgreSQL) sowie ein gutes Verständnis für Performance- und Skalierungsfragen verteilter Systeme.
- Technisches Architekturdenken, Qualitätsanspruch und idealerweise Erfahrung im regulierten Umfeld (Datenschutz, Security-by-Design).
Responsibilities
- Du designst und baust eine produktive, skalierbare AI-Plattform auf Cloud- und Kubernetes-Basis - kein Proof-of-Concept, sondern echtes Produktivsystem.
- Du entwickelst LLM- und GenAI-Anwendungen, die Verwaltungsprozesse messbar effizienter machen.
- Du orchestrierst unterschiedliche LLM-Provider und Modelle und entwickelst eine flexible, austauschbare Architektur.
- Du etablierst saubere DevOps- und MLOps-Standards - von CI/CD bis Monitoring und Observability.
- Du automatisierst Infrastruktur und Deployments mittels Infrastructure as Code und Container-Technologien.
- Du übernimmst technische Verantwortung für Performance, Skalierbarkeit, Sicherheit und nachhaltigen Betrieb im regulierten Umfeld.
Benefits
Skills
Don't send a generic resume
Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.
Get started free