Data Scientist Nlp/genai
il y a 3 jours
Mirakl, leader et pionnier de l’économie de plateforme, propose aux entreprises une suite unique de solutions leur permettant de transformer significativement leur e-commerce afin d'accélérer de façon durable et rentable leur croissance. Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d'élargir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d'efficacité, offrir une expérience d'achat personnalisée à leurs clients, et augmenter leurs profits grâce au retail media. Basée à Paris et Boston, Mirakl est certifiée Great Place to Work.
Nos équipes techniques et produits, nommées Mirakl Labs, sont principalement réparties entre nos 2 hubs situés à Paris et à Bordeaux. Elles collaborent au quotidien afin d'adresser les problématiques de nos clients et utilisateurs en répondant à différents challenges liés aux nouvelles fonctionnalités, à la scalabilité, la sécurité et l’ergonomie
Elles opèrent en mode agile et s'organisent en Squads composées d'un Squad Lead, de 5 développeurs, d'un Product Manager et d'un QA. Chaque Squad est spécialisée sur un scope fonctionnel afin de concevoir et réaliser de nouvelles features, leurs évolutions et des APIs (avec un découpage en micro-services). Nos équipes Infrastructure, Architecture, Sécurité, Documentation, Product Design, Data et Support opèrent en transverse en apportant leur expertise et de la cohérence sur l’ensemble des produits.
Toutes les équipes sont responsables de leur périmètre et chacun des collaborateurs apporte son expérience et ses idées. Innovation, feedback et implication dans les prises de décision sont au cœur de notre philosophie.
**A propos du job**
Intégré.e dans notre équipe Data Science, votre principale mission sera de prototyper, itérer, et mettre en production des algorithmes en collaboration avec les équipes Produit, les Data Engineers et les équipes de développement.
Vos projets seront centrés sur les enjeux du catalogue Marketplace, comprenant le NLP, la Computer Vision et l'utilisation de Generative AI (LLMs customs) à grande échelle. Les sujets que vous traiterez auront un impact significatif sur nos clients : notre ambition est d'exploiter au mieux nos données riches et variées pour augmenter leur chiffre d'affaires, optimiser la gestion de leur marketplace et garantir la sécurité des utilisateurs et des transactions.
**Nous cherchons des personnes en CDI ou en freelance, Sur Paris, Bordeaux ou en full remote**
**Sujets catalogue**:
- Réécriture automatique du contenu Marketing en fonction des attentes métier
- Extraction d’attributs produit à partir d’image et de texte libre
- Détection de produits variants
- Catégorisation de produits
- Onboarding automatique des produits vendeurs
- Fusion de fiches produits provenant de sources multiples
- Prédiction de produits tendance
**Ce qu’il y a pour vous dans ce job**:
- Implémenter des algorithmes qui auront un impact visible sur plus de 500 sites e-commerce/marketplaces dans 40 pays dont certains une volumétrie très importantes (millions de produits, de clients, de commandes par an)
- Des techniques de pointe variées (modèles multimodaux, fine-tuning de LLM, etc.). Mirakl est aujourd'hui l'un des rares acteurs français à avoir des LLM finetunés en production à grande échelle. Rejoignez-nous pour continuer à cultiver cet esprit pionnier
- Une vraie autonomie et responsabilité dans les projets dont vous avez ownership
**Notre stack et nos outils**
Python, Tensorflow, Pytorch, Hugging Face, Databricks, Spark, AWS (Amazon Redshift, s3, etc.), SQL, Airflow, Delta Lake. Spécifiques LLM : Autotrain, Unsloth, Galileo, LangChain, Anyscale.
**Au quotidien, vous allez**:
- Analyser, préparer les données, prototyper des algorithmes
- Les mettre en production en collaboration avec les Data Engineers et les équipes de développement
- Faire des dashboards afin d’illustrer la pertinence des algorithmes et de monitorer la production
- Présenter les résultats au weekly data science et participer aux sessions de brainstorming de l’équipe
- Échanger avec les autres équipes pour affiner les cas d’utilisation, l’expérience utilisateur et les modes d’intégration
**Vous aimerez ce job si**:
- Vous avez 4 ans d'expérience minimum en tant que Data Scientist, avec une expérience significative en NLP et ML appliqué en entreprise
- Vous avez déjà mis en production des algorithmes de Machine Learning
- Vous avez une bonne connaissance des algorithmes de NLP et Computer Vision et des architectures State-Of-the-Art - par exemple les Transformers. (Avoir des connaissances sur les derniers LLMs est un plus)
- Vous avez une expérience en développement Spark
- Vous êtes pragmatique, data-driven et orienté métier
- Vous aimez avoir l’ownership de vos sujets et vous êtes autonome et avez un très bon esprit d’équipe
- Vo
-
Data Scientist
il y a 2 semaines
Île-de-France Esmoz Temps pleinOffre CDI – Data Scientist / ML Engineer Localisation : Région Parisienne — Présence requise : 3 jours / semaine sur site Disponibilité : Janvier – Mars 2026 Contrat : CDI Secteur : BanqueContexteNous recherchons un Data Scientist / ML Engineer pour rejoindre un Data Lab dans le secteur bancaire. Vous interviendrez sur le développement et la mise...
-
Data Scientist IA Generative F/H
il y a 4 jours
avenue de paris châtillon - Europe, France, Ile-de-France, Hauts-de-Seine () Orano Temps pleinInformations sur le poste Sociétés / Etablissements Opérateur international reconnu dans le domaine des matières nucléaires, Orano apporte des solutions aux défis actuels et futurs, dans l'énergie et la santé. Son expertise ainsi que sa maîtrise des technologies de pointe permettent à Orano de proposer à ses clients des produits et services à...
-
Data Scientist
il y a 4 jours
Rue du Dôme, Boulogne-Billancourt, France Mp Data Temps pleinNous recherchons un profil Data Scientist IAGen 3D pour renforcer notre équipe Data dans l'industrie. Vous interviendrez sur plusieures étapes des projets IA : sur l'exploration et la valorisation notamment.Vos responsabilités incluront :Analyser, structurer et valoriser des jeux de données internes et externes.Développer et fine tuner des modèles de...
-
Data Scientist – Agronomy
il y a 4 jours
Avenue Jean Médecin, Nice, France Doriane Temps pleinThe roleWe are looking for a Data Scientist with a strong interest in agronomy.You will work at the intersection of data science, agronomy and product, contributing both to the evolution of Bloomeo and to collaborative R&D projects involving clients, universities and research institutes.This role offers a high level of autonomy, close interaction with domain...
-
Stage Data Scientist
il y a 1 semaine
FRANCE - - HAU - NANTERRE AXA Temps pleinPrésente sur l'ensemble du territoire, AXA France se distingue comme la filiale la plus importante du Groupe en termes de chiffre d'affaires et d'effectifs. Leader sur les marchés de l'assurance, de la santé et de la prévoyance, l'entreprise offre à ses équipes un cadre de travail moderne et agréable en 'smartworking'. Vous hésitez encore ? Sachez...
-
Stage Data Scientist
il y a 7 jours
FRANCE - - HAU - NANTERRE AXA Temps pleinNous sommes persuadés que pour bien prendre soin de nos clients, nous devons commencer par bien prendre soin de nos collaborateurs Les avantages que nous proposons à nos salariés sont nombreux. Nous choisir, c'est bénéficier par exemple :D'un package de rémunération complet comprenant un salaire fixe, un complément de rémunération variable, des...
-
Principal Data Scientist
il y a 1 semaine
France - Paris (Rue de Bercy) RELX Temps pleinJob Description in French (English version at the bottom)Principal Data ScientistLocalisation prioritaire : Paris, FranceLexisNexis Risk Solutions est un leader mondial dans le domaine de la technologie et de l'analyse de données, s'attaquant à certains des défis les plus complexes et les plus significatifs au monde — de la lutte contre la...
-
Lead Data Scientist
il y a 3 jours
France - Paris (Rue de Bercy) LexisNexis Risk Solutions Temps pleinJob description in French (English version at the bottom)Lead Data ScientistLocalisation prioritaire : Paris, FranceLexisNexis Risk Solutions est un leader mondial dans le domaine de la technologie et de l'analyse de données, s'attaquant à certains des défis les plus complexes et les plus significatifs au monde — de la lutte contre la cybercriminalité...
-
Consultant.e - Product Data Scientist
il y a 4 heures
Avenue Franklin Delano Roosevelt, Paris, France Wivoo, a Wavestone company Temps pleinDans le cadre du développement de notre offre dans la Data et l'IA, nous recrutons plusieurs Data Scientists avec une sensibilité forte en Product management. Tu veux développer une expertise sur des produits data-driven, avoir un impact Business fort et de plus en plus exigé, et bénéficier des avantages d'intégrer une communauté de Product Data...
-
Geospatial Data Scientist
il y a 4 jours
Boulevard Poissonnière, Paris, France AXA Climate Temps pleinAltitudeAltitude solution was launched in September 2022. It is three products, connected on one single data platform. It is enabling CSR/ESG teams to screen climate and nature related risks and opportunities within minutes, very easy to use, and fully automated.Altitude Finance: dedicated for Infrastructure and Private Equity funds,Altitude Industry:...