Alternant(e) Data Factory

veepee_france

L'Île-Saint-Denis · flexible Internship Entry Level 2mo ago

About the role

À propos de Veepee

Pionnier des ventes événementielles en ligne depuis 2001 et acteur incontournable du e-commerce en Europe, Veepee collabore avec plus de 7 000 marques pour proposer des produits à forte décote, disponibles sur une durée limitée. Présent dans de nombreux univers parmi lesquels la mode, la maison, le vin, le voyage, ou encore la beauté ... Veepee a réalisé en 2024 un chiffre d’affaires de 3,3 milliards d’euros TTC et compte 5 000 collaborateurs répartis dans 10 pays.

Description Du Poste

L’équipe Data Factory est responsable de la plateforme d’ingestion de données (Agate) permettant d’alimenter le Data Lake et le Data Warehouse de Veepee. Dans un contexte de transformation stratégique (migration vers une architecture basée sur Trino / Iceberg / S3 on-prem), l’équipe renforce la fiabilité, la qualité et l’industrialisation des pipelines d’ingestion. L’alternant(e) interviendra dans un environnement :

Kubernetes / VPCloud
Python / Java / Beam / Dataflow
BigQuery & nouvelle stack Trino / Iceberg
CI/CD (GitLab, tests automatisés)
Observabilité & monitoring

MISSIONS

L'alternant contribuera à la fiabilisation et à l’industrialisation de la plateforme d’ingestion de données, afin de garantir une base solide pour l’ensemble des usages Data chez Veepee.

Activité 1 : Stabilisation de la stack d’ingestion
- Ajout de tests unitaires sur les pipelines existants
- Amélioration de la couverture de tests
- Détection des zones de fragilité
Activité 2 : Amélioration continue de la plateforme Agate
- Refactoring de composants techniques
- Participation à l’optimisation des performances
- Contribution à la gestion des erreurs et retry
Activité 3 : Qualité & fiabilité des données
- Mise en place de contrôles automatiques
- Contribution aux métriques de qualité
- Participation au monitoring technique
Activité 4 : Documentation & industrialisation
- Rédaction de README techniques
- Formalisation des bonnes pratiques
- Aide à la standardisation des nouveaux pipelines
Activité 5 : Participation aux projets stratégiques
- Contribution au double run (BigQuery ↔ nouvelle stack)
- Support aux équipes Data Governance / Science / Analytics

PRÉ REQUIS

Formation

Bac +3 à Bac +5 en informatique / data / école d’ingénieur

Compétences techniques

Bases solides en Python & Java
Compréhension des APIs et pipelines de données
Notions SQL
Intérêt pour les architectures data modernes

Langues

Anglais technique

Compétences comportementales

Rigueur
Curiosité technique
Envie d’apprendre
Esprit collaboratif

LE PETIT PLUS

Connaissance de Kubernetes
Notions de CI/CD
Expérience avec Airflow / Beam / Spark
Sensibilité à la qualité logicielle

AVANTAGES

Prime variable
Participation & intéressement
Télétravail possible jusqu'à 2 jours/semaine
Plate-forme d'apprentissage des langues en ligne
CSE et ses avantages
Chèques CESU et chèques vacances
Accès à une restauration d'entreprise et des frigos connectés
Accès à la Salle de sport

EN SAVOIR PLUS SUR L'ÉQUIPE

L’équipe Data Factory fait partie de la Data Platform. Elle travaille en étroite collaboration avec :

Data Governance
Data Core
Data Science
Analytics

PROCESSUS DE RECRUTEMENT

Entretien RH
Entretien technique (Data Factory)
Cas pratique léger (optionnel)
Entretien manager

Skills

AWS LambdaBigQueryBeamCI/CDDataflowDockerGitLabIcebergJavaKubernetesMonitoringObservabilityPythonS3SparkSQLTrino

Don't send a generic resume

Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.

Get started free