via indeed · 25 mai 2026 ·il y a 12 jours

Lead LLM

Licorne Society
Paris Temps plein
13 979 autres offres à Paris.
Importez votre CV et voyez lesquelles vous correspondent vraiment.
Importer mon CV

Licorne Society a été missionné par une startup IA en pleine croissance pour les aider à trouver leur Lead LLM Engineer.

What you will own
---------------------

You will be responsible for one thing:

Make our AI outputs reliable, fast, and indispensable in real workflows.

Concretely:

  • Design and evolve our LLM / agent architecture

  • Own output quality across key use cases (emails, document analysis, etc.)

  • Build evaluation systems (datasets, metrics, regression detection)

  • Drive fast iteration loops from production data

  • Improve retrieval, reasoning, and tool usage

  • Ensure production reliability (latency, failure modes, fallback)

  • Work directly with product \+ founders on what to build and why
What this role is really about
----------------------------------

Most teams fail because:

  • they don’t know what “good output” means

  • they don’t have evals

  • they iterate randomly

  • they overuse agents
Your job is to fix that.

You will turn:

  • vague user problems

  • + into structured AI systems

  • + with measurable performance

  • + that improve every week
What you need to be excellent at
------------------------------------

1\. Shipping real LLM systems


  • You’ve built systems used in production (not demos)

  • You understand RAG, tools, agents, structured outputs

  • You can design full pipelines, not just prompts

2\. Evaluation\-driven development


  • You know how to define quality metrics

  • You build datasets from real usage

  • You run continuous evals to prevent regressions

3\. Debugging complex failures


  • You can trace issues across:

  • + retrieval

+ prompts
+ model behavior
  • You don’t guess — you isolate and fix

4\. Speed of iteration

You move from problem* improvement in hours or days, not weeks

  • You use logs, traces, and data — not intuition alone

5\. Strong judgment


  • You know when to:

  • + use an agent vs a pipeline

+ add complexity vs simplify
  • You optimize for reliability and user value , not novelty
What we don’t care about
----------------------------
  • Number of years of experience

  • Whether you’ve used a specific framework

  • Fancy research credentials
If you can build, debug, and improve real systems , you’re a fit.

What success looks like (first 90 days)
-------------------------------------------

  • Clear eval framework for core use cases

  • Measurable improvement in output quality

  • Faster iteration cycles across the team

  • Reduced hallucinations / failures

  • Stronger system architecture decisions
Stack (context, not requirements)
-------------------------------------
  • Python (FastAPI)

  • Postgres

  • Google Cloud

  • LangGraph / LangChain (evolving)

  • PostHog (product analytics)

  • Langfuse (LLM traces)

  • LLM APIs (Azure OpenAI)

Le marché pour ce type de poste

Offres similaires
13 979
offres à Paris
Temps plein
83%
des offres en France
Télétravail possible
4%
des offres
Licorne Society

39 postes ouverts · Paris, Saint-Ouen, Saint-Ouen-L'Aumône

📊 Marché de l'emploi · France
351 200
offres actives
3.8%
Remote
Ø 1d
Ø en ligne

Questions fréquentes

Combien d'offres sont disponibles à Paris ?
Actuellement 13 979 postes à Paris sur AlmostHired, dans 4 659 entreprises différentes. Nos données sont mises à jour quotidiennement.
Les offres en France offrent-elles du télétravail ?
4% des offres en France permettent le télétravail, partiel ou total. Pour filtrer spécifiquement les postes en remote, utilisez AlmostHired.
Comment savoir si je corresponds à cette offre ?
Déposez votre CV — notre IA compare votre profil aux exigences du poste et vous donne un score de compatibilité précis, avec les compétences qui correspondent et celles qui manquent.