Senior Data Engineer (m/w/d) Lakehouse, Databricks
IT-Systemhaus der Bundesagentur für Arbeit
About the role
Stellenbeschreibung
Für unseren Kunden aus dem Versicherungsumfeld suchen wir einen Senior Data Engineer (m/w/d) am Standort Köln.
Ort: Köln Anstellungsart: Vollzeit Beschäftigungsbedingungen: Homeoffice (bis zu 80 %)
Stelle im Rahmen der Arbeitnehmerüberlassung
Nach der Einarbeitungsphase Vor‑Ort‑Anwesenheit von 2 aufeinanderfolgenden Tagen alle 2 Wochen
Projektbeschreibung
Die Versicherung betreibt mit einer Analytics Plattform eine moderne Data-&AI-Plattform in der Azure Cloud. Diese wird aktuell für folgende Zwecke genutzt:
- Entwicklung und Betrieb von KI-Systemen (z. B. RAG‑Applikationen)
- Hosting selbst trainierter KI‑Modelle
- Durchführung von Ad-hoc‑Analysen auf strukturierten und unstrukturierten Daten
- Entwicklung von Datenprodukten, Datenintegration und -transformation für ein separates Data Warehouse
Im Rahmen der IT‑Transformations‑Roadmap wird Unterstützung für die Weiterentwicklung sowie die spätere Migration der Plattform benötigt.
Was wir bieten
- Attraktive Vergütung
- Interessantes technisches Umfeld
- Homeoffice‑Regelung
- Respektvolle Arbeitskultur
- Weihnachts- und Urlaubsgeld
Aufgabenbereich
- Weiterentwicklung der bestehenden Plattform zu einem Lakehouse
- Unterstützung bei der technischen Anbindung weiterer IT‑Systeme
- Unterstützung bei der Implementierung von Entwicklungsprozessen für Lakehouse‑Entwickler unter Beachtung von DABs und Data Contracts
- Unterstützung bei der automatischen Bereitstellung von Berechtigungsgruppen, Monitoring‑Dashboards und Incident‑Routing‑Mechanismen
- Vorbereitung der vorhandenen Infrastructure‑as‑Code‑Repositories sowie Bewertung der vorhandenen Assets
- Wiederherstellen vorhandener Assets, Daten und Daten‑Pipelines im neuen Tenant
- Anbindung an Umsysteme, SIEM und IAM
- Migration von Git Lab CI/CD zu Git Hub Actions
- Abbau der Cloud‑Ressourcen, Prozesse und Assets im alten Azure‑Tenant
Anforderungen
- Tiefes Verständnis von Berechtigungsstrukturen innerhalb von Databricks mit Unity Catalog
- Erfahrung beim Design und Administration von Databricks Workspaces
- Entwicklung von resilienten Data‑Pipelines mit PySpark inkl. Testautomatisierung, Packaging und Deployment mit Declarative Automation Bundles (DAB)
- Kenntnisse von Data Contracts
- Partitionierung von Daten in Delta Lake
- Erfahrung mit Git Lab CI/CD und/oder Git Hub Actions
- Sehr gute Deutschkenntnisse in Wort und Schrift
Haben wir Ihr Interesse geweckt?
Dann freuen wir uns auf Ihre Rückmeldung.
#J-18808-Ljbffr
Skills
Don't send a generic resume
Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.
Get started free