Skip to content
mimi

Senior Data Engineer – Infrastructure & Industrialisation IA - Freelance H/F

Collective.work

Paris · Hybrid Contract Senior Today

About the role

Description du poste

Data Engineer – Infrastructure & Industrialisation IA

Paris, 3 jours de présence par semaine. Mission freelance, démarrage dès que possible.

Le contexte

Notre client, grand groupe pharmaceutique international, développe une plateforme IA interne (agents, RAG, génération de contenu) et entre dans une phase d'industrialisation. L'enjeu : faire passer ces systèmes du stade prototype à une infrastructure robuste, scalable et maintenue en production.

Ta mission

Tu seras le data engineer pour construire et structurer toute l'infrastructure data & IA de la plateforme. Concrètement :

  • Déployer et industrialiser l'infrastructure multi-agents (orchestration, scalabilité, monitoring)
  • Mettre en place un pipeline d'évaluation et de monitoring unifié : qualité des outputs, latence, coûts (ex. Weave)
  • Déployer et optimiser les bases de données orientées retrieval (indexation, versioning, performance) pour les cas d'usage RAG
  • Adapter les pratiques CI/CD existantes aux pipelines LLM : tests automatiques, validation, déploiement
  • Structurer les flux de données (ingestion, transformation, traçabilité) dans le respect des standards de gouvernance interne
  • Gérer les environnements dev / staging / prod en garantissant la reproductibilité des pipelines et expériences

Stack

  • Airflow
  • dbt
  • Snowflake
  • AWS
  • et idéalement des outils de l'écosystème LLMOps (LangChain, LlamaIndex, Weave, ou équivalents)

Profil recherché

  • Expérience solide en Data Engineering sur des environnements cloud (AWS en priorité)
  • Expérience en MLOps ou LLMOps : tu sais faire tourner des systèmes IA en production, pas seulement des pipelines data classiques
  • À l'aise avec les architectures RAG et les bases vectorielles
  • Rigueur sur les sujets de gouvernance, traçabilité et reproductibilité

Requirements

  • Expérience solide en Data Engineering sur des environnements cloud (AWS en priorité)
  • Expérience en MLOps ou LLMOps : tu sais faire tourner des systèmes IA en production, pas seulement des pipelines data classiques
  • À l'aise avec les architectures RAG et les bases vectorielles
  • Rigueur sur les sujets de gouvernance, traçabilité et reproductibilité

Responsibilities

  • Déployer et industrialiser l'infrastructure multi-agents (orchestration, scalabilité, monitoring)
  • Mettre en place un pipeline d'évaluation et de monitoring unifié : qualité des outputs, latence, coûts (ex. Weave)
  • Déployer et optimiser les bases de données orientées retrieval (indexation, versioning, performance) pour les cas d'usage RAG
  • Adapter les pratiques CI/CD existantes aux pipelines LLM : tests automatiques, validation, déploiement
  • Structurer les flux de données (ingestion, transformation, traçabilité) dans le respect des standards de gouvernance interne
  • Gérer les environnements dev / staging / prod en garantissant la reproductibilité des pipelines et expériences

Skills

AWSAirflowdbtLangChainLlamaIndexLLMOpsMLOpsRAGSnowflakeWeave

Don't send a generic resume

Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.

Get started free