Skip to content
mimi

Data Engineer - Débutant H/F

TOTALENERGIES SE

Pau · On-site Contract 1mo ago

About the role

TotalEnergies est l'une des principales entreprises énergétiques au monde. Dans un contexte de changement technologique et de transformation numérique, vous travaillerez au sein du DataLab pour le support à l'entité Excellence/KM dans la consolidation et l'évolution de son outil d'IA générative (Bookfeeder), développé en 2025.

Le département Excellence/KM est acteur dans la capitalisation du savoir des métiers Géoscience et Réservoir (G&R).

Le DataLab est un projet interdisciplinaire visant à faciliter la gestion des documents à l'aide de techniques de pointe en matière de science des données et de l'intelligence artificielle.

Ce double rattachement sera un atout pour expérimenter et mettre en application des sujets digitaux, dans un métier gérant une grande quantité de données.

Vous profiterez ainsi de toute l’expérience d’une équipe interdisciplinaire composée de gestionnaires de données, membres de la R&D, chefs de projet SI, experts IT, Product Owners et data scientists expérimentés.

Rattaché(e) à l’équipe Excellence/KM et hébergé au sein du DataLAB, vous participerez aux rituels et à des réunions des deux entités Data Science et gestion de la connaissance en Géoscience et Réservoir.

Responsabilités

  • Partager avec les équipes de data science sur des projets en traitement du langage naturel (NLP), vision par ordinateur, grands modèles de langage (LLM) et recherche multimodale
  • Optimiser les processus de traitement des données de Bookfeeder pour améliorer ses performances et l’efficacité globale
  • Surveiller et déboguer les pipelines afin de résoudre les problèmes liés aux données.

Responsabilités techniques

  • Concevoir, développer et maintenir des pipelines de données efficaces et évolutifs pour BookFeeder (outil d’extraction de paramètres décrivant un champ pétrolier ou de stockage de CO2 à partir d’un corpus documentaire
  • Obtenir des informations structurées (valeurs et unités) à partir de données non structurées (un corpus documentaire – rapports) au sein d’un écosystème (briques IA, Pipeline data science et infrastructure scientific computing) performant, mutualisé et rationalisé.

Vous vous reconnaissez ? N'attendez plus... postulez pour rejoindre les équipes TotalEnergies du CSTJF à Pau !

Skills

IAData ScienceLLMNLPPipeline

Don't send a generic resume

Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.

Get started free