MLOps & LLM Engineer @ Industrialisation de modèles IA & architectures RAG @ Secteur Médias @ Paris - Freelance

il y a 6 jours


Paris, Île-de-France Collective Temps plein

Budget: TJM 550 €

Contexte de la mission
Dans un environnement
médias à forte exposition
, cette mission s'inscrit au cœur d'une
équipe IA transverse
rattachée à une direction numérique.

L'objectif est de
faire passer des modèles d'IA (ML, DL, LLM)
du stade expérimental à des
solutions industrielles robustes, sécurisées et observables
, intégrées à des produits d'information à fort impact.

Vous interviendrez comme
référent MLOps
, garant des bonnes pratiques d'industrialisation et de mise en production, en interaction étroite avec des
Data Scientists, ML Engineers, DevOps et Product Owner
.

Objectifs et responsabilités

  • Industrialiser l'ensemble du cycle de vie des modèles IA, de l'entraînement au déploiement en production
  • Mettre en place et maintenir des pipelines MLOps fiables, reproductibles et sécurisés
  • Structurer les pratiques de monitoring, traçabilité et gouvernance des modèles
  • Accompagner la mise en production de cas d'usage NLP / LLM, notamment autour de la recherche d'information et de la génération augmentée
  • Transformer les travaux de R&D IA en services opérationnels à l'échelle

Stack technique & expertises clés
MLOps & Industrialisation

  • Conception de pipelines CI/CD pour modèles ML (GitLab CI ou équivalent)
  • Versioning des modèles et des datasets
  • Conteneurisation avancée avec Docker
  • Gestion du cycle de vie des modèles : MLflow ou équivalent (Comet ML, etc.)
  • Mise en place de boucles de feedback : monitoring de dérive, retraining, human-in-the-loop

IA, ML & Data

  • Python avancé (NumPy, Pandas, Scikit-learn)
  • Frameworks Deep Learning : PyTorch et/ou TensorFlow
  • SQL pour l'accès et la transformation des données
  • Expérience confirmée en mise en production de modèles IA

LLM, NLP & RAG

  • Conception et industrialisation d'architectures RAG (Retrieval-Augmented Generation)
  • Intégration d'outils d'orchestration LLM :

  • LangChain / LangSmith

  • Semantic Kernel
  • ou solutions équivalentes

  • Déploiement de pipelines LLM en contexte de production

Cloud & Déploiement

  • Maîtrise d'au moins un cloud provider
  • Déploiement de services IA conteneurisés ou serverless
  • Sensibilité forte aux enjeux de sécurité et de scalabilité

Compétences complémentaires appréciées

  • Déploiement de workloads IA sur Kubernetes (K8s)
  • Écosystème MLOps avancé : Kubeflow, Argo
  • Tests de performance et de montée en charge des services d'inférence (ML / LLM)
  • Optimisation de modèles pour la production :

  • Quantization, Distillation, Pruning

  • Fine-tuning / PEFT (LoRA)

  • Expérience en :

  • Computer Vision

  • Small Language Models (SLM)

  • Évaluation avancée des LLM :

  • AI as a Judge

  • Hallucination Rate
  • Grounding Score

Environnement & modalités

  • Mission longue durée, structurante pour les produits numériques
  • Travail hybride avec présence sur site partielle selon les besoins
  • Contexte exigeant en matière de qualité, sécurité et fiabilité, propre au secteur des médias

  • LLM Engineer confirmé(e)

    il y a 2 jours


    Paris, Île-de-France Mp Data Temps plein

    ESN spécialisée Data & IA pour les environnements industriels. Pour l'un de nos clients, nous recherchons un LLM Engineer chargé d'industrialiser les POC GenAI développés par les équipes Data Science et de déployer des solutions robustes et scalables en production.Développement et Industrialisation des POC LLM / GenAI.Conception et optimisation de...


  • Paris, Île-de-France VORSTONE Temps plein

    Vorstone cherche un Expert/Architecte technique IA/ GenAI pour un client basé à ParisContexte de la missionDans le cadre de son accélération sur l?Intelligence Artificielle et l?IA Générative, un groupe industriel international de premier plan recherche un Staff Engineer /Expert technique IA/ GenAI (H/F) pour renforcer ses équipes AI Activation. La...

  • Expert IA

    il y a 2 jours


    Paris, Île-de-France 6TM Temps plein

    L'entrepriseNée de la rencontre entre 6TM et Polaria, Goria combine une solide expérience dans la construction de plateformes numériques et une expertise pointue en intelligence artificielle.Nous accompagnons PME, ETI, grands comptes et institutions pour leur permettre d'outiller leurs équipes avec des outils d'IA puissants et pertinents, et renforcer...

  • Data/ IA engineer

    il y a 6 jours


    Paris, Île-de-France The Bradery Temps plein

    Nous recherchons unData/IA Engineer (CDI/ Freelance)expérimenté pour rejoindre notre équipe data de 3 personnes et travailler sur des projets à fort impact business. Ton rôle clé : faire le pont entre notre stack data, Shopify et les nouveaux canaux agentiques (ChatGPT, Perplexity, Copilot) pour rendre notre catalogue produit pleinement discoverable et...


  • Paris, Île-de-France Free-Work Temps plein

    Je suis à la recherche pour un de nos clients d'un Développeur IA LLMPythonAPI.Maîtrise de Python pour le backend et l'interfaçage API. Expérience avérée en développement d'API REST (FastAPI, Flask ou Django).Intégration de LLM (Large Language Models) : Expérience pratique de l'utilisation d'APIs de modèles génératifs (OpenAI, Mistral,...


  • Paris, Île-de-France NEXORIS Temps plein

    Accompagner les travaux d?industrialisation et de structuration des produits d?intelligence artificielle générative, en lien avec différents cas d?usage internes. La mission inclut notamment la mise en place, l?optimisation et la supervision des chaînes de traitement de données, la conception et l?amélioration des systèmes de RAG (Retrieval-Augmented...

  • ai engineer

    il y a 2 semaines


    Paris, Île-de-France eXalt Value Temps plein

    eXalt Value, c'est la filiale du groupe de conseil ITeXaltqui propulse les entreprises dans une nouvelle ère : celle de laData, de l'IA Générativeet de l'IA Agentique.Notre credo : transformer vos données et vos projets d'IA envéritables leviers de performance, d'innovation et de créativité.ChezeXalt Value, on ne se contente pas de parler d'IA :on la...


  • Paris, Île-de-France CHOURAK CONSULTING Temps plein

    Nous recherchons un AI Engineer Azure confirmé pour le compte d?un grand groupe dans le cadre d?un projet stratégique autour de l?IA Générative.La mission consiste à concevoir et développer des solutions d?assistants IA en exploitant les services avancés de la plateforme Microsoft Azure.? Vos missions principales : Concevoir et développer des...

  • Développeur IA

    il y a 6 jours


    Paris, Île-de-France Collective Temps plein

    Budget: TJM 505 €Contexte de la missionLa mission s'inscrit dans unenvironnement média à forte volumétrie, au sein d'une direction technique numérique en charge de concevoir et d'industrialiser descas d'usage avancés autour de l'IA générative et des LLM.L'objectif est dedévelopper, intégrer et opérer des briques IA/LLMau cœur d'un écosystème...

  • Ingénieur ML-OPS H/F

    il y a 2 jours


    Paris, Île-de-France NEXTON Temps plein

    Description de l'entrepriseQui sommes-nous ?Rejoindre NEXTON, c'est intégrer une entreprise où convergent l'esprit d'un cabinet de conseil, la créativité d'une agence et la dynamique d'une ESN Grâce à notre expertise, nous accompagnons des clients grands comptes et des pure players tels que SNCF, Orange, et BNP Paribas dans leurs stratégies...