Skip to content
mimi

Alternant(e) Data Factory

veepee_france

L'Île-Saint-Denis · flexible Internship Entry Level 1mo ago

About the role

À propos de Veepee

Pionnier des ventes événementielles en ligne depuis 2001 et acteur incontournable du e-commerce en Europe, Veepee collabore avec plus de 7 000 marques pour proposer des produits à forte décote, disponibles sur une durée limitée. Présent dans de nombreux univers parmi lesquels la mode, la maison, le vin, le voyage, ou encore la beauté ... Veepee a réalisé en 2024 un chiffre d’affaires de 3,3 milliards d’euros TTC et compte 5 000 collaborateurs répartis dans 10 pays.

Description Du Poste

L’équipe Data Factory est responsable de la plateforme d’ingestion de données (Agate) permettant d’alimenter le Data Lake et le Data Warehouse de Veepee. Dans un contexte de transformation stratégique (migration vers une architecture basée sur Trino / Iceberg / S3 on-prem), l’équipe renforce la fiabilité, la qualité et l’industrialisation des pipelines d’ingestion. L’alternant(e) interviendra dans un environnement :

  • Kubernetes / VPCloud
  • Python / Java / Beam / Dataflow
  • BigQuery & nouvelle stack Trino / Iceberg
  • CI/CD (GitLab, tests automatisés)
  • Observabilité & monitoring

MISSIONS

L'alternant contribuera à la fiabilisation et à l’industrialisation de la plateforme d’ingestion de données, afin de garantir une base solide pour l’ensemble des usages Data chez Veepee.

  • Activité 1 : Stabilisation de la stack d’ingestion
    • Ajout de tests unitaires sur les pipelines existants
    • Amélioration de la couverture de tests
    • Détection des zones de fragilité
  • Activité 2 : Amélioration continue de la plateforme Agate
    • Refactoring de composants techniques
    • Participation à l’optimisation des performances
    • Contribution à la gestion des erreurs et retry
  • Activité 3 : Qualité & fiabilité des données
    • Mise en place de contrôles automatiques
    • Contribution aux métriques de qualité
    • Participation au monitoring technique
  • Activité 4 : Documentation & industrialisation
    • Rédaction de README techniques
    • Formalisation des bonnes pratiques
    • Aide à la standardisation des nouveaux pipelines
  • Activité 5 : Participation aux projets stratégiques
    • Contribution au double run (BigQuery ↔ nouvelle stack)
    • Support aux équipes Data Governance / Science / Analytics

PRÉ REQUIS

Formation

  • Bac +3 à Bac +5 en informatique / data / école d’ingénieur

Compétences techniques

  • Bases solides en Python & Java
  • Compréhension des APIs et pipelines de données
  • Notions SQL
  • Intérêt pour les architectures data modernes

Langues

  • Anglais technique

Compétences comportementales

  • Rigueur
  • Curiosité technique
  • Envie d’apprendre
  • Esprit collaboratif

LE PETIT PLUS

  • Connaissance de Kubernetes
  • Notions de CI/CD
  • Expérience avec Airflow / Beam / Spark
  • Sensibilité à la qualité logicielle

AVANTAGES

  • Prime variable
  • Participation & intéressement
  • Télétravail possible jusqu'à 2 jours/semaine
  • Plate-forme d'apprentissage des langues en ligne
  • CSE et ses avantages
  • Chèques CESU et chèques vacances
  • Accès à une restauration d'entreprise et des frigos connectés
  • Accès à la Salle de sport

EN SAVOIR PLUS SUR L'ÉQUIPE

L’équipe Data Factory fait partie de la Data Platform. Elle travaille en étroite collaboration avec :

  • Data Governance
  • Data Core
  • Data Science
  • Analytics

PROCESSUS DE RECRUTEMENT

  1. Entretien RH
  2. Entretien technique (Data Factory)
  3. Cas pratique léger (optionnel)
  4. Entretien manager

Skills

AWS LambdaBigQueryBeamCI/CDDataflowDockerGitLabIcebergJavaKubernetesMonitoringObservabilityPythonS3SparkSQLTrino

Don't send a generic resume

Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.

Get started free