Skip to content
mimi

Senior Data Engineer (m/w/d) Lakehouse, Databricks

IT-Systemhaus der Bundesagentur für Arbeit

Köln · flexible Full-time Senior 2w ago

About the role

Stellenbeschreibung

Für unseren Kunden aus dem Versicherungsumfeld suchen wir einen Senior Data Engineer (m/w/d) am Standort Köln.

Ort: Köln Anstellungsart: Vollzeit Beschäftigungsbedingungen: Homeoffice (bis zu 80 %)

Stelle im Rahmen der Arbeitnehmerüberlassung

Nach der Einarbeitungsphase Vor‑Ort‑Anwesenheit von 2 aufeinanderfolgenden Tagen alle 2 Wochen

Projektbeschreibung

Die Versicherung betreibt mit einer Analytics Plattform eine moderne Data-&AI-Plattform in der Azure Cloud. Diese wird aktuell für folgende Zwecke genutzt:

  • Entwicklung und Betrieb von KI-Systemen (z. B. RAG‑Applikationen)
  • Hosting selbst trainierter KI‑Modelle
  • Durchführung von Ad-hoc‑Analysen auf strukturierten und unstrukturierten Daten
  • Entwicklung von Datenprodukten, Datenintegration und -transformation für ein separates Data Warehouse

Im Rahmen der IT‑Transformations‑Roadmap wird Unterstützung für die Weiterentwicklung sowie die spätere Migration der Plattform benötigt.

Was wir bieten

  • Attraktive Vergütung
  • Interessantes technisches Umfeld
  • Homeoffice‑Regelung
  • Respektvolle Arbeitskultur
  • Weihnachts- und Urlaubsgeld

Aufgabenbereich

  • Weiterentwicklung der bestehenden Plattform zu einem Lakehouse
  • Unterstützung bei der technischen Anbindung weiterer IT‑Systeme
  • Unterstützung bei der Implementierung von Entwicklungsprozessen für Lakehouse‑Entwickler unter Beachtung von DABs und Data Contracts
  • Unterstützung bei der automatischen Bereitstellung von Berechtigungsgruppen, Monitoring‑Dashboards und Incident‑Routing‑Mechanismen
  • Vorbereitung der vorhandenen Infrastructure‑as‑Code‑Repositories sowie Bewertung der vorhandenen Assets
  • Wiederherstellen vorhandener Assets, Daten und Daten‑Pipelines im neuen Tenant
  • Anbindung an Umsysteme, SIEM und IAM
  • Migration von Git Lab CI/CD zu Git Hub Actions
  • Abbau der Cloud‑Ressourcen, Prozesse und Assets im alten Azure‑Tenant

Anforderungen

  • Tiefes Verständnis von Berechtigungsstrukturen innerhalb von Databricks mit Unity Catalog
  • Erfahrung beim Design und Administration von Databricks Workspaces
  • Entwicklung von resilienten Data‑Pipelines mit PySpark inkl. Testautomatisierung, Packaging und Deployment mit Declarative Automation Bundles (DAB)
  • Kenntnisse von Data Contracts
  • Partitionierung von Daten in Delta Lake
  • Erfahrung mit Git Lab CI/CD und/oder Git Hub Actions
  • Sehr gute Deutschkenntnisse in Wort und Schrift

Haben wir Ihr Interesse geweckt?

Dann freuen wir uns auf Ihre Rückmeldung.

#J-18808-Ljbffr

Skills

AzureDatabricksDelta LakeGitGit Hub ActionsGitLab CI/CDIAMPySparkRAG

Don't send a generic resume

Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.

Get started free