Skip to content
mimi

Alternant(e) - Conception et déploiement d'un service transverse de gestion des données

CEA

Le Bourget-du-Lac · On-site Internship Entry Level Today

About the role

À propos du CEA

Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat. Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.

Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.

Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :

  • La conscience des responsabilités
  • La coopération
  • La curiosité

Missions du poste

Dans le cadre de la digitalisation de la plateforme ModSyst, nous cherchons un(e) alternant(e) pour concevoir et déployer un service transverse de gestion des données (DIGIMODSYS) conçu pour :

  1. Automatiser l'ingestion, le stockage et le traitement des données techniques (caractérisations, simulations, procédés);
  2. Structurer ces données dans un datalake et des bases relationnelles;
  3. Mettre à disposition les résultats via un portail web et des API pour les utilisateurs internes (authentification et droits différenciés);
  4. Intégrer une "PV Toolbox" (boîte à outils algorithmique) pour automatiser les traitements métiers (analyses, visualisations);
  5. Assurer la compatibilité avec les évolutions futures (2027) de la DSI et du LITEN.

Missions principales :

  1. Concevoir et déployer l'architecture technique Vous serez en charge de concevoir une architecture hybride combinant une base de données PostgreSQL et un stockage S3/Iceberg, de containeriser les services via Docker et d'automatiser les déploiements avec une pipeline CI/CD GitLab, tout en garantissant la compatibilité avec les évolutions prévues en 2027.

  2. Développer le pipeline de données Vous automatiserez l'ingestion des données depuis les dossiers existants, les nettoierez et structurerez à l'aide d'outils comme Spark, Airflow et Python, puis intégrerez une boîte à outils algorithmique (PV Toolbox) pour réaliser les analyses métiers.

  3. Créer les interfaces utilisateurs Vous développerez un portail web (FastAPI+Frontend) pour visualiser les données et résultats, implémenterez des API pour faciliter leur interrogation, et gérerez les droits d'accès via une authentification sécurisée (LDAP/OAuth2).

  4. Assurer le monitoring et la maintenance Vous assurerez la surveillance des performances des services via Prometheus et Grafana, documenterez l'architecture et les procédures, et participerez activement aux mises à jour ainsi qu'à la veille technologique pour garantir l'évolution du système.

  5. Collaborer avec les équipes R&D Vous collaborerez en mode agile avec les équipes techniques et les laboratoires du Service SMSP, en recueillant leurs besoins et en assurant la formation des utilisateurs pour une adoption optimale des outils.

Profil recherché

De formation Bac +2, vous êtes à la recherche d'une entreprise afin de réaliser en alternance votre diplôme type : Bac +5 en informatique, data engineering, ou équivalent (École d'ingénieur).

Compétences scientifiques :

  • Maîtrise de Linux, Python, SQL et Docker.
  • Connaissance des bases de données et du développement web (API, frameworks légers)

Connaissances :

  • Expérience avec Airflow, Spark ou GitLab CI/CD sera un atout supplémentaire

Vous êtes reconnu(e) pour votre :

  • Autonomie
  • Rigueur
  • Esprit d'équipe
  • Curiosité

Vous devrez allier rigueur technique et curiosité scientifique pour concevoir un service robuste, évolutif et adapté aux besoins R&D du LITEN.

Skills

APIAirflowCI/CDDockerFastAPIGitLabGrafanaLDAPLinuxOAuth2PostgreSQLPrometheusPythonS3SparkSQL

Don't send a generic resume

Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.

Get started free