Skip to content
mimi

AI DevOps / Infrastructure / Optimisation

infomaniak | The Ethical Cloud

On-site Full-time 3w ago

About the role

Infomaniak développe une plateforme IA open source hébergée sur ses propres datacenters suisses. Nous déployons des modèles de langage à grande échelle et construisons des agents intelligents pour nos produits (kChat, kMeet, kDrive).

Nous recherchons un·e AI Engineer pour concevoir, implémenter et optimiser nos agents IA, avec un focus sur la qualité, la fiabilité et l’expérience utilisateur.

Tes responsabilités

  • Déploiement & Orchestration : Déployer, maintenir et optimiser des LLM sur Kubernetes en maximisant l’efficacité des ressources GPU / Compute.
  • CI/CD & Automatisation : Améliorer et industrialiser nos pipelines Gitlab CI pour les modèles IA (build, test, déploiement, rollback).
  • Piloter les déploiements via Flux CD (GitOps).
  • Monitoring & Observabilité : Renforcer notre stack Prometheus / Grafana / Victoria Metrics pour une visibilité fine sur les performances, la consommation GPU, la latence, la disponibilité et de manière générale la santé des services IA.
  • Optimisation des ressources : Travailler sur l’efficacité des coûts et des performances (autoscaling, scheduling, gestion des quotas, optimisation des images...).
  • Qualité & Fiabilité : Garantir la robustesse, la sécurité et la reproductibilité des déploiements dans un environnement critique.

Le profil qui nous fait vibrer

  • Maîtrise des frameworks modernes de serving (ex : vLLM, TGI, TensorRT-LLM...)
  • Maîtrise de GitLab CI (pipelines, runners, variables, intégration avec Kubernetes).
  • Expérience confirmée en Kubernetes (operators, Helm, CRDs, networking, autoscaling).
  • Expérience avec Flux CD (GitOps, HelmReleases, Kustomize, automatisation des déploiements).
  • Expérience avec Prometheus / Grafana (dashboards, alerting, exporters).
  • Connaissance des infrastructures GPU (NVIDIA, CUDA, GPU scheduling, monitoring).
  • Appétence pour la qualité, la fiabilité et la performance.
  • Capacité à travailler en environnement critique (SLA élevé, haute disponibilité).
  • Bonne capacité à collaborer avec des équipes ML et Dev.

Un plus si tu as des connaissances en

  • Curiosité technique, goût pour les challenges innovants et l’optimisation.
  • Les contributions open source ou les side projects sont appréciés.
  • Tu aimes travailler en équipe, et fais preuve d’une communication positive.
  • Ton humour, ta flexibilité et ton esprit d’équipe sont des atouts indispensables pour travailler dans le fun.

La stack technique que l’on utilise

  • LangChain
  • Pydantic-ai
  • vLLM
  • FastAPI

Skills

CUDAFastAPIFlux CDGitLab CIGrafanaGPU schedulingKubernetesLangChainNVIDIAPydantic-aiPrometheusTensorRT-LLMVictoria MetricsvLLM

Don't send a generic resume

Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.

Get started free