Skip to content
mimi

Data Engineer (MLOPS) - Plateforme Données Massives AP-HP F/H

APHP Assistance publique hôpitaux de Paris

Paris · On-site Contract 1w ago

About the role

Experteer Overview En tant que Data Engineer spécialisé MLOps, vous concevez et déployez des pipelines de données massives au sein de l’Environnement de Données de Santé de l’AP-HP. Vous travaillez avec l’équipe Data Science pour assurer robustesse, reproductibilité et scalabilité des modèles ML dans une infrastructure Kubernetes. Vous contribuerez à l’ingestion, l’exploitation et l’industrialisation des processus tout en garantissant sécurité et conformité des données de santé.

Rémunérations / Avantages • Concevoir et développer des pipelines de traitement de données à grande échelle pour l’ingestion, transformation et stockage des données (imagerie, voix, signaux) • Intégrer des modèles ML/DL dans les pipelines et assurer leur évolutivité • Optimiser les performances des pipelines dans un contexte Big Data • Veiller à la sécurité et à la conformité des outils et données (RGPD, pseudonymisation) • Maintenir la disponibilité et la performance des outils développés • Rédiger et mettre à jour la documentation technique et utilisateur • Contribuer à la communauté Open Source autour des projets • Concevoir des outils d’annotation de données médicales pour l’entraînement des modèles ML/DL • Assurer une veille technologique et diffuser les connaissances au sein de l’équipe

Responsabilités • 55+ ans d'expérience en Data Engineering avec spécialisation MLOps et expérience en Big Data • Maîtrise Python et Scala; scripting Bash • Gestion de pipelines de données avec Spark, Polars ou équivalent • Infrastructure et DevOps: Docker, Kubernetes, Terraform; environnements on-premise et Cloud optionnel • Gestion de bases et stockage: Hive, HBase, Solr, Kafka, PostgreSQL, S3; SQL et Lucene • Back-end/API et architectures associées (Spring Boot, FastAPI) • Intégration et déploiement de modèles ML/AI en production; CI/CD pour ML; supervision des pipelines ML • Connaissance avancée de la sécurité des données et RGPD • Gestion de projets Agile (Scrum/Kanban) et rédaction de documentation technique • Veille technologique; HL7-FHIR et standards santé appréciés; Linux; connaissances en stats (apprécié) • Autonomie, esprit d’innovation, orientation service utilisateur

Principales exigences • Télétravail • Remboursement transports 75% • Restaurant du personnel • 19 RTT • Centre formation et développement des compétences • 25 jours de congés

Don't send a generic resume

Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.

Get started free