via indeed · 8 juin 2026 ·il y a 5 jours

ML Ops Engineer H/F

Septeo
Courbevoie Temps plein
87 autres offres à Courbevoie.
Importez votre CV et voyez lesquelles vous correspondent vraiment.
Importer mon CV

Description de l'entreprise

Septeo est un acteur de référence du software en Europe, présent à l’international et reconnu parmi le top 5 des éditeurs de logiciels sectoriels en France. En forte croissance et en transformation permanente, le groupe s’impose comme un acteur clé de l’édition logicielle grâce à la force de son collectif : des équipes déterminées, audacieuses et engagées.

Chez Septeo, l’intelligence artificielle est placée au cœur de notre évolution. Nous la concevons comme un levier de performance durable, de collaboration et d’innovation, intégrée de manière responsable dans les pratiques du quotidien et démocratisé sur l’ensemble de nos métiers. L'ambition est claire : “make intelligent software for Europe”.

Notre culture repose sur des valeurs fortes : être, faire et transformer ensemble. Elle n’est pas figée; elle se vit chaque jour dans nos actions et nos décisions, à travers un équilibre entre performance, responsabilité et plaisir.

Cette ambition s’incarne dans ce que nous faisons au quotidien : concevoir des logiciels qui accompagnent les moments de vie essentiels, au service de millions de citoyens. Être présent derrière ces instants clés est une responsabilité forte. C’est la nôtre. Et peut\-être bientôt la votre.

Rejoindre Septeo, c’est intégrer une aventure collective à dimension internationale, porter la transformation du groupe dans un environnement en mouvement rapide, et faire de l’IA un levier concret de création de valeur, aujourd’hui comme demain.

Nous recherchons un ML Ops Engineer (H/F) en CDI, basé à Courbevoie.

Description du poste

Mission principale

Garantir que les solutions d'IA produites par Brain soient déployées, exploitées et supervisées de manière fiable, performante et reproductible, en cohérence avec les standards de la DSI et les exigences métier.

Industrialisation des APIs Brain :

  • Concevoir, maintenir et faire évoluer les chaînes CI/CD (Azure DevOps) pour les APIs développées par Brain (.NET sur Linux notamment).

  • Packager les applications via Helm, gérer les charts, les valeurs par environnement (dev / staging / prod) et les hooks de déploiement.

  • Définir les bonnes pratiques de configuration Kubernetes : requests / limits, sondes liveness / readiness, autoscaling, gestion des secrets, observabilité.

  • Diagnostiquer et résoudre les incidents de plateforme (OOMKilled, hooks Helm en échec, problèmes RBAC, certificats, etc.) en collaboration avec la DSI.
Déploiement et exploitation des LLMs
  • Mettre en place les pipelines de déploiement de modèles (LLMs auto\-hébergés ou via API externes) : versionning, gestion du cycle de vie, rollback, A/B testing.

  • Optimiser l'inférence : choix du runtime (vLLM, TGI, Triton, ONNX Runtime ou équivalent), gestion GPU / CPU, mise en cache, batching, quantification.

  • Intégrer les briques d'écosystème LLM (vector stores, orchestrateurs type LangChain / Semantic Kernel, passerelles type LiteLLM) dans des architectures industrielles.

  • Mettre en place le monitoring spécifique aux LLMs : latence, coûts par requête, qualité des réponses, dérive, télémétrie applicative.
Interface avec la DSI groupe :
  • Être l'interlocuteur·rice technique privilégié·e entre Brain et la DSI sur les sujets infrastructure, sécurité, conformité et déploiement.

  • Aligner les pratiques de Brain avec les standards groupe (gestion des clusters Kubernetes, politiques RBAC, gestion des secrets, conformité réseau).

  • Co\-construire les processus de mise en production : revues d'architecture, critères de Go Live, gestion des changements, astreintes éventuelles.

  • Documenter et transmettre la connaissance : runbooks, schémas d'architecture, post\-mortems.
Observabilité, fiabilité et sécurité :
  • Mettre en place et faire vivre la stack d'observabilité (logs, métriques, traces) pour les APIs et les modèles.

  • Définir et suivre les indicateurs SRE pertinents (SLO, SLI, error budgets) sur les services Brain.

  • Intégrer la sécurité dès la conception : gestion des secrets, scans de vulnérabilités, signature d'images, supply chain.

  • Optimiser les coûts d'infrastructure et d'inférence (FinOps appliqué à l'IA).
Stack Technique :
  • Frameworks ML/DL : PyTorch et/ou TensorFlow, scikit\-learn ; compréhension du cycle entraînement checkpoint export (ONNX, SafeTensors).

  • Serving de modèles : Triton Inference Server, TorchServe, BentoML, KServe/Seldon Core sur Kubernetes. Expérience sur clusters on\-premise appréciée.

  • CI/CD : Azure DevOps (pipelines YAML), GitOps (ArgoCD ou Flux), pratiques de déploiement progressif.

  • Conteneurisation : Docker, optimisation d'images, multi\-stage builds, sécurité.

  • Infrastructure as Code : Terraform, Ansible ou équivalent.

  • Observabilité : Prometheus, Grafana, OpenTelemetry, ELK ou stack équivalente.
Qualifications

Nous recherchons un profil doté d’un excellent sens du dialogue et de la pédagogie, capable de traduire de manière claire les contraintes liées à l’intelligence artificielle auprès des équipes IT.

La personne devra faire preuve de pragmatisme, avec une capacité à aller à l’essentiel, livrer rapidement des résultats et adopter une démarche d’amélioration continue par itérations.

Une curiosité technique est également indispensable, notamment concernant les évolutions rapides de l’écosystème des modèles de langage (LLM) et des technologies associées.

Le poste requiert par ailleurs une grande autonomie, ainsi qu’une bonne capacité à prioriser dans un environnement en construction et en évolution constante.

Informations supplémentaires

Rejoindre Septeo, c’est aussi :

  • Grandir et s’épanouir grâce à un parcours de formation personnalisé, des opportunités de mobilité interne et la possibilité de s’auto\-former via notre plateforme Udemy

  • Vivre une aventure humaine, échanger et partager autour d’évènements thématisés (afterworks, sport, RSE, séminaires, etc.)

  • Rejoindre un collectif qui prend soin des autres et s’engage en faveur de l’égalité des chances, la diversité et l’inclusion
Vous faites quoi lundi ?

Le marché pour ce type de poste

Offres similaires
87
postes Ingénierie à Courbevoie
Temps plein
83%
des offres Ingénierie en France
Télétravail possible
3%
des offres Ingénierie
Septeo

10 postes ouverts · Barcelona, Bordeaux, Courbevoie, Lyon, Paris +2

📊 Ingénierie · France
38 726
offres actives
3%
Remote
Ø 1d
Ø en ligne
Compétences les plus demandées
ExcelERPISOPythonAWSCI/CDSQLAzureAgileLean

Questions fréquentes

Combien d'offres Ingénierie sont disponibles à Courbevoie ?
Actuellement 87 postes en Ingénierie à Courbevoie sur AlmostHired, dans 29 entreprises différentes. Nos données sont mises à jour quotidiennement.
Est-ce que les postes Ingénierie offrent du télétravail ?
3% des offres Ingénierie en France permettent le télétravail, partiel ou total. Pour filtrer spécifiquement les postes en remote, utilisez AlmostHired.
Comment savoir si je corresponds à cette offre ?
Déposez votre CV — notre IA compare votre profil aux exigences du poste et vous donne un score de compatibilité précis, avec les compétences qui correspondent et celles qui manquent.