Skip to content
mimi

ALSL - Data Engineer Senior : Couche d'ingestion · Plateforme Data GCP (IT) / Freelance

Pickmeup

Paris · On-site Senior 2d ago

About the role

Nous recherchons un Data Engineer Senior : Couche d'ingestion · Plateforme Data GCP

Vous garantissez la porte d'entrée des données : tout ce qui alimente la plateforme passe par les pipelines que vous construisez.

LE CONTEXTE

La donnée arrive de partout, dans tous les formats, à un volume qui grossit vite. Vous rejoignez l'équipe Bronze, au c?ur de la plateforme Data : la couche qui collecte, centralise et fiabilise les sources avant qu'elles ne soient exploitées par les autres équipes Data. Un rôle d'ingénierie d'ingestion pure (batch et streaming), avec une vraie exigence de robustesse, de scalabilité et de gouvernance.

L'ÉQUIPE :

Une équipe resserrée et complémentaire : Lead, PO et 3 Data Engineers (vous inclus).

CE QUE VOUS FEREZ CONCRÈTEMENT

Construire et fiabiliser les pipelines d'ingestion de sources hétérogènes (batch + streaming), pensés pour absorber un volume en forte croissance

Structurer le stockage de la donnée brute (Cloud Storage / Delta Lake) de façon durable et requêtable

Industrialiser l'infrastructure en IaC (Terraform / Terragrunt) et les workflows CI/CD (GitLab)

Embarquer la gouvernance dès l'ingestion : conformité, sécurité, catalogage (Dataplex)

Accompagner les équipes Data dans l'exploitation et le requêtage des données ? vulgariser, transmettre, documenter

Partager et faire progresser les pratiques avec les autres Data Engineers (revues, standards, veille techno active)

LA STACK

Python · Spark / PySpark · SQL pour les traitements · Airflow pour l'orchestration · Cloud Storage + Delta Lake pour le stockage · GCP : BigQuery · Dataproc · Pub/Sub · Cloud Storage · Dataplex · Terraform + Terragrunt pour l'infra · GitLab CI/CD · Agile (Scrum / Kanban)

Profil candidat:

LE PROFIL RECHERCHÉ

Indispensable :

5+ ans en Data Engineering, sur des pipelines en production (autonomie de la conception au run)

Solide en Python et SQL, à l'aise sur les structures de données et l'architecture

Expérience réelle de Spark / PySpark et de la construction de pipelines d'ingestion de sources variées

Pratique d'un environnement Google Cloud (GCP) : a minima BigQuery + un compute Spark

Airflow, Terraform, GitLab CI/CD en conditions réelles

Agile (Scrum ou Kanban)

Vraie capacité à vulgariser et communiquer sur des sujets techniques pointus

Les plus dans un contexte pro :

Dataplex Universal Catalog (gouvernance / catalogage)

Delta Lake sur GCP / Dataproc

Terragrunt au-delà de Terraform

Expérience d'une architecture medallion (Bronze / Silver / Gold)

Ingestion streaming Pub/Sub ? Dataflow / Spark Streaming

Sécurité & conformité data (RGPD, data masking, IAM GCP)

Don't send a generic resume

Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.

Get started free