Data Scientist NLP/GenAI

il y a 4 semaines


Paris, France Mirakl - Labs Temps plein
Mirakl, leader et pionnier de l'économie de plateforme, propose aux entreprises une suite unique de solutions leur permettant de transformer significativement leur e-commerce afin d'accélérer de façon durable et rentable leur croissance. Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d'élargir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d'efficacité, offrir une expérience d'achat personnalisée à leurs clients, et augmenter leurs profits grâce au retail media. Basée à Paris et Boston, Mirakl est certifiée Great Place to Work.

A propos de Mirakl Labs

Nos équipes techniques et produits, nommées Mirakl Labs, sont principalement réparties entre nos 2 hubs situés à Paris et à Bordeaux. Elles collaborent au quotidien afin d'adresser les problématiques de nos clients et utilisateurs en répondant à différents challenges liés aux nouvelles fonctionnalités, à la scalabilité, la sécurité et l'ergonomie...

Elles opèrent en mode agile et s'organisent en Squads composées d'un Squad Lead, de 5 développeurs, d'un Product Manager et d'un QA. Chaque Squad est spécialisée sur un scope fonctionnel afin de concevoir et réaliser de nouvelles features, leurs évolutions et des APIs (avec un découpage en micro-services). Nos équipes Infrastructure, Architecture, Sécurité, Documentation, Product Design, Data et Support opèrent en transverse en apportant leur expertise et de la cohérence sur l'ensemble des produits.

Toutes les équipes sont responsables de leur périmètre et chacun des collaborateurs apporte son expérience et ses idées. Innovation, feedback et implication dans les prises de décision sont au cœur de notre philosophie.

Et pour favoriser ce partage avec d'autres passionnés, nous sommes sponsors, speakers, et hôtes de différents événements, meetups, et associations de la scène Tech en France. Au cours des dernières années, nous avons participé à des événements tels que Devoxx, ReactEurope, ProductConf et Flupa UX Days.

A propos du job

Intégré.e dans notre équipe Data Science, votre principale mission sera de prototyper, itérer, et mettre en production des algorithmes en collaboration avec les équipes Produit, les Data Engineers et les équipes de développement.

Vos projets seront centrés sur les enjeux du catalogue Marketplace, comprenant le NLP, la Computer Vision et l'utilisation de Generative AI (LLMs customs) à grande échelle. Les sujets que vous traiterez auront un impact significatif sur nos clients : notre ambition est d'exploiter au mieux nos données riches et variées pour augmenter leur chiffre d'affaires, optimiser la gestion de leur marketplace et garantir la sécurité des utilisateurs et des transactions.

A propos de l'équipe

Get to Know the Data Science Team That Powers the Mirakl Platform

Sujets catalogue :
  • Réécriture automatique du contenu Marketing en fonction des attentes métier
  • Extraction d'attributs produit à partir d'image et de texte libre
  • Détection de produits variants
  • Catégorisation de produits
  • Onboarding automatique des produits vendeurs
  • Fusion de fiches produits provenant de sources multiples
  • Prédiction de produits tendance
Ce qu'il y a pour vous dans ce job :
  • Implémenter des algorithmes qui auront un impact visible sur plus de 500 sites e-commerce/marketplaces dans 40 pays dont certains une volumétrie très importantes (millions de produits, de clients, de commandes par an)
  • Des techniques de pointe variées (modèles multimodaux, fine-tuning de LLM, etc.). Mirakl est aujourd'hui l'un des rares acteurs français à avoir des LLM finetunés en production à grande échelle. Rejoignez-nous pour continuer à cultiver cet esprit pionnier
  • Une vraie autonomie et responsabilité dans les projets dont vous avez ownership
Notre stack et nos outils

Python, Tensorflow, Pytorch, Hugging Face, Databricks, Spark, AWS (Amazon Redshift, s3, etc.), SQL, Airflow, Delta Lake. Spécifiques LLM : Autotrain, Unsloth, Galileo, LangChain, Anyscale.

Au quotidien, vous allez :
  • Analyser, préparer les données, prototyper des algorithmes
  • Les mettre en production en collaboration avec les Data Engineers et les équipes de développement
  • Faire des dashboards afin d'illustrer la pertinence des algorithmes et de monitorer la production
  • Présenter les résultats au weekly data science et participer aux sessions de brainstorming de l'équipe
  • Échanger avec les autres équipes pour affiner les cas d'utilisation, l'expérience utilisateur et les modes d'intégration
Vous aimerez ce job si :
  • Vous avez 4 ans d'expérience minimum en tant que Data Scientist, avec une expérience significative en NLP et ML appliqué en entreprise
  • Vous avez déjà mis en production des algorithmes de Machine Learning
  • Vous avez une bonne connaissance des algorithmes de NLP et Computer Vision et des architectures State-Of-the-Art - par exemple les Transformers. (Avoir des connaissances sur les derniers LLMs est un plus)
  • Vous maîtrisez Python, Tensorflow ou/et PyTorch
  • Vous avez une expérience en développement Spark
  • Vous êtes pragmatique, data-driven et orienté métier
  • Vous aimez avoir l'ownership de vos sujets et vous êtes autonome et avez un très bon esprit d'équipe
  • Vous avez un esprit positif : respect et bienveillance font partie de vos valeurs
  • Vous aimez partager votre travail dans le cadre de présentations internes, dans des conférences ou en rédigeant des articles
Envie de nous rejoindre? ☆
  • Un échange téléphonique de 30 minutes avec un de nos recruteurs Tech. Ce sera l'occasion de discuter de votre parcours, de vos attentes et de découvrir ce que Mirakl peut vous offrir en retour.
  • Un premier échange technique par zoom de 30 minutes avec une personne de l'équipe Data Science, qui permettra de plonger dans des aspects plus concrets de votre expertise et de découvrir comment vos compétences peuvent s'intégrer à nos projets.
  • Un cas pratique à réaliser à la maison.
  • Une restitution et échange technique avec un manager de l'équipe Data Science de 75 minutes.
  • Un dernier échange de 1H par zoom avec des futurs collègues Mirakl autour de nos valeurs et de notre culture d'entreprise.
Mirakl est engagée en faveur de la diversité, de l'égalité des chances et de l'inclusion. Nous célébrons nos différences car nous sommes convaincus que les qualités visibles et invisibles de chaque Mirakl Worker sont une source de force et d'innovation. Dans le cadre de cet engagement, nous étudions toutes les candidatures sans distinction de : genre, ethnicité, religion, orientation sexuelle, handicap, âge ou toute autre caractéristique protégée par la loi.
  • Data Scientist Nlp

    il y a 2 jours


    Paris 1er, France MP DATA Temps plein

    Passionné(e) par **les use-cases NLP** ? Rejoins notre Équipe d'experts dans la **data/l'IA spécialisés en NLP** (plus d'une vingtaine de cas d'usages !). **MP DATA**, c'est une équipe de **70 Experts** **Data (Data Scientists, Data Engineers, Data Architects, ML Engineers) **qui accompagne les plus grands groupes français sur des projets d'IA très...

  • Staff Data Scientist

    il y a 1 mois


    Paris, France Data Idols Temps plein

    **Staff Data Scientist**: **Salary**:€**100,000 - **€**130,000 + Equity**: **Location: Paris/Remote**: - Data Idols are currently working with a rapidly scaling technology company at the forefront of AI, focusing on LLMs and NLP solutions. They’ve recently surpassed a £1 billion valuation and are on the lookout for a talented Staff Data Scientist to...

  • Research Scientist

    Il y a 8 mois


    Paris, France Meta Temps plein

    **Research Scientist (NLP, GenAI) Responsibilities**: - Lead research that extends the capabilities of foundation models through model fine-tuning - Work towards long-term ambitious research goals, while identifying intermediate milestones. - Influence progress of relevant research communities by producing publications. - Contribute research that can be...

  • Data Scientist

    il y a 1 mois


    Paris, Île-de-France Sonia Solutions Temps plein

    Sonia Solutions is seeking a skilled Data Scientist - NLP Expert to join our AI team in Luxembourg. This role requires expertise in implementing and deploying state-of-the-art Natural Language Processing (NLP) solutions.

  • Data Scientist Nlp/genai

    Il y a 2 mois


    Paris, France Pickmeup Temps plein

    NOTRE CLIENT Pionnier dans le domaine des solutions de plateforme, notre client offre une suite innovante permettant aux sociétés de transformer leur e-commerce pour accélérer leur croissance de manière durable et rentable. Depuis le début des années 2010, il accompagne les entreprises B2C et B2B en leur fournissant des technologies avancées,...

  • Data Scientist Nlp

    Il y a 3 mois


    Paris, France Capgemini Invent Temps plein

    **Description de l'entreprise**: Chez Capgemini Invent, nous croyons que l’innovation est le moteur du changement. En tant que consultants en Data Ingéniérie, nous combinons nos capacités techniques, créatives et scientifiques, en collaborant étroitement avec nos clients pour leur fournir des solutions de pointe. Rejoignez-nous pour construire des...

  • Data Scientist Nlp

    Il y a 4 mois


    Paris, France Capgemini Invent Temps plein

    **Description de l'entreprise**: Chez Capgemini Invent, nous croyons que l’innovation est le moteur du changement. En tant que consultants en Data Ingéniérie, nous combinons nos capacités techniques, créatives et scientifiques, en collaborant étroitement avec nos clients pour leur fournir des solutions de pointe. Rejoignez-nous pour construire des...

  • Data Scientist NLP/GenAI

    il y a 1 mois


    Paris, France Pickmeup Temps plein

    NOTRE CLIENTPionnier dans le domaine des solutions de plateforme, notre client offre une suite innovante permettant aux sociétés de transformer leur e-commerce pour accélérer leur croissance de manière durable et rentable. Depuis le début des années 2010, il accompagne les entreprises B2C et B2B en leur fournissant des technologies avancées,...

  • Data Scientist NLP/GenAI

    Il y a 2 mois


    Paris, France Mirakl Temps plein

    Mirakl, leader et pionnier de l’économie de plateforme, propose aux entreprises une suite unique de solutions leur permettant de transformer significativement leur e-commerce afin d'accélérer de façon durable et rentable leur croissance. Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et...

  • Data Scientist NLP

    il y a 1 semaine


    Paris, France Capgemini Temps plein

    Description de l'entrepriseChez Capgemini Invent, nous croyons que l'innovation est le moteur du changement. En tant que consultants en Data Ingéniérie, nous combinons nos capacités techniques, créatives et scientifiques, en collaborant étroitement avec nos clients pour leur fournir des solutions de pointe. Rejoignez-nous pour construire des outils...

  • Data Scientist NLP

    il y a 1 mois


    Paris, France Capgemini Temps plein

    Description de l'entrepriseChez Capgemini Invent, nous croyons que l'innovation est le moteur du changement. En tant que consultants en Data Ingéniérie, nous combinons nos capacités techniques, créatives et scientifiques, en collaborant étroitement avec nos clients pour leur fournir des solutions de pointe. Rejoignez-nous pour construire des outils...

  • Data Scientist NLP

    il y a 4 semaines


    Paris, France Capgemini Temps plein

    Description de l'entreprise Chez Capgemini Invent, nous croyons que l'innovation est le moteur du changement. En tant que consultants en Data Ingéniérie, nous combinons nos capacités techniques, créatives et scientifiques, en collaborant étroitement avec nos clients pour leur fournir des solutions de pointe. Rejoignez-nous pour construire des...

  • Data Scientist Senior

    Il y a 3 mois


    Paris, France CHARLI GROUP Temps plein

    **Description**: Nous recherchons un Data Scientist Senior spécialisé en NLP (Natural Language Processing) et en Intelligence Artificielle Générative pour rejoindre une équipe innovante au sein d?un acteur majeur du secteur des mutuelles. Vous serez en charge de concevoir et de déployer des modèles IA avancés afin de transformer et optimiser les...

  • Data Scientist

    il y a 1 mois


    Paris, France Malakoff Humanis Temps plein

    **Société**: - ASSOCIATION DE MOYENS ASSURANCE DE PERSONNES Description du poste **Métier**: - DATA - DATA SCIENTIST **Intitulé du poste**: - DATA SCIENTIST - NLP et LLM pour la Génération de Contrats - Stage F/H **Contrat**: - Stage **Durée du contrat**: - 6 Mois **Finalité du poste**: - Au sein de la direction Innovation Data et Digital...

  • Senior NLP Data Scientist H/F

    il y a 4 semaines


    Paris, France Capgemini Temps plein

    Description de l'entreprise Chez Capgemini Invent, nous croyons que l'innovation est le moteur du changement. En tant que consultants en Data Ingéniérie, nous combinons nos capacités techniques, créatives et scientifiques, en collaborant étroitement avec nos clients pour leur fournir des solutions de pointe. Chez Capgemini Invent, notre vision est de...

  • Senior NLP Data Scientist H/F

    il y a 4 semaines


    Paris, France Capgemini Temps plein

    Description de l'entreprise Chez Capgemini Invent, nous croyons que l'innovation est le moteur du changement. En tant que consultants en Data Ingéniérie, nous combinons nos capacités techniques, créatives et scientifiques, en collaborant étroitement avec nos clients pour leur fournir des solutions de pointe. Chez Capgemini Invent, notre vision est de...


  • Paris, Île-de-France AXA Group Temps plein

    About AXA Group">AXA Group is a leading global insurance company undergoing transformation to become a sustainable tech-led organization. Our Governance and Security Data Hub Team plays a pivotal role in this evolution, leveraging cutting-edge technologies like GenAI to drive innovation and efficiency.">Job Summary">We are seeking an experienced Data...

  • Data Scientist

    Il y a 7 mois


    Paris, France MP DATA Temps plein

    MP DATA est une société spécialisée dans l’acquisition, le traitement, et la valorisation des données. Depuis sa création en 2015, MP DATA accompagne ses clients, majoritairement industriels, dans le management de leur performance, l’exploitation de leur données et leur décarbonation par des cas d'usage Data Science. Les collaborateurs, tous...

  • Data Scientist

    Il y a 6 mois


    Paris, France Harnham Temps plein

    INFO - SALARY: - €45000 - €50000 LOCATION Paris - JOB TYPE - Permanent **DATA SCIENTIST** **ÎLE DE FRANCE** **UP TO 50K EUROS FIXE** C'est une entreprise qui développe des solutions innovantes pour aider les entreprises dans leurs projets de transformation digitale. L'IA est au coeur de ses solutions et dans ce cadre, l'entreprise recherche un...


  • Paris 9e, France Urban Linker Temps plein

    En étroite collaboration avec les équipes Data et l’équipe Software Engineering tu auras pour missions de: - Développer et maintenir l’IA via les réseaux de neurones ainsi que le ML - Améliorer les sujets autour des problématiques NLP - Créer ou améliorer les algorithmes - Préconiser et exécuter la stratégie Data en lien avec la philosophie...