C
Senior Data Engineer – Infrastructure & Industrialisation IA - Freelance H/F
Collective.work
Paris · Hybrid Contract Senior Today
About the role
Description du poste
Data Engineer – Infrastructure & Industrialisation IA
Paris, 3 jours de présence par semaine. Mission freelance, démarrage dès que possible.
Le contexte
Notre client, grand groupe pharmaceutique international, développe une plateforme IA interne (agents, RAG, génération de contenu) et entre dans une phase d'industrialisation. L'enjeu : faire passer ces systèmes du stade prototype à une infrastructure robuste, scalable et maintenue en production.
Ta mission
Tu seras le data engineer pour construire et structurer toute l'infrastructure data & IA de la plateforme. Concrètement :
- Déployer et industrialiser l'infrastructure multi-agents (orchestration, scalabilité, monitoring)
- Mettre en place un pipeline d'évaluation et de monitoring unifié : qualité des outputs, latence, coûts (ex. Weave)
- Déployer et optimiser les bases de données orientées retrieval (indexation, versioning, performance) pour les cas d'usage RAG
- Adapter les pratiques CI/CD existantes aux pipelines LLM : tests automatiques, validation, déploiement
- Structurer les flux de données (ingestion, transformation, traçabilité) dans le respect des standards de gouvernance interne
- Gérer les environnements dev / staging / prod en garantissant la reproductibilité des pipelines et expériences
Stack
- Airflow
- dbt
- Snowflake
- AWS
- et idéalement des outils de l'écosystème LLMOps (LangChain, LlamaIndex, Weave, ou équivalents)
Profil recherché
- Expérience solide en Data Engineering sur des environnements cloud (AWS en priorité)
- Expérience en MLOps ou LLMOps : tu sais faire tourner des systèmes IA en production, pas seulement des pipelines data classiques
- À l'aise avec les architectures RAG et les bases vectorielles
- Rigueur sur les sujets de gouvernance, traçabilité et reproductibilité
Requirements
- Expérience solide en Data Engineering sur des environnements cloud (AWS en priorité)
- Expérience en MLOps ou LLMOps : tu sais faire tourner des systèmes IA en production, pas seulement des pipelines data classiques
- À l'aise avec les architectures RAG et les bases vectorielles
- Rigueur sur les sujets de gouvernance, traçabilité et reproductibilité
Responsibilities
- Déployer et industrialiser l'infrastructure multi-agents (orchestration, scalabilité, monitoring)
- Mettre en place un pipeline d'évaluation et de monitoring unifié : qualité des outputs, latence, coûts (ex. Weave)
- Déployer et optimiser les bases de données orientées retrieval (indexation, versioning, performance) pour les cas d'usage RAG
- Adapter les pratiques CI/CD existantes aux pipelines LLM : tests automatiques, validation, déploiement
- Structurer les flux de données (ingestion, transformation, traçabilité) dans le respect des standards de gouvernance interne
- Gérer les environnements dev / staging / prod en garantissant la reproductibilité des pipelines et expériences
Skills
AWSAirflowdbtLangChainLlamaIndexLLMOpsMLOpsRAGSnowflakeWeave
Don't send a generic resume
Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.
Get started free