Stage R&d]
il y a 2 semaines
**Présentation d’Artefact**
Artefact est une société française spécialisée dans le déploiement de technologies d’IA et de solutions data dont la mission est d’accélérer l'adoption des données et de l'IA afin d’avoir un impact positif sur les individus et les organisations.
Spécialiste en transformation data et en digital & data marketing, Artefact transforme la donnée en impact business et délivre des résultats tangibles sur l’ensemble de la chaîne de valeur des entreprises. L’approche unique d’Artefact, qui fait le pont entre la donnée et le business, allie le meilleur de l’expertise technologique et de l’excellence opérationnelle, permettant ainsi à ses clients de devenir des champions de l’IA et d’atteindre leurs objectifs business de façon dédiée et efficace. La raison d’être d’Artefact_ “We accelerate data and AI adoption to positively impact people and organizations” _s’inscrit dans une vision plus large que l’entreprise souhaite porter en façonnant un futur dans lequel l'IA est non seulement un outil puissant, éthique et transparent mais également adapté aux besoins des individus et des entreprises.
Forts de dix ans d’expérience, plus de 300 entreprises internationales ont accordé leur confiance à Artefact depuis sa création. Couvrant l’Europe, l’Asie, l’Amérique du Nord, l’Amérique Latine et l’Afrique grâce à notre implantation locale dans 24 bureaux, nous travaillons avec des marques internationales de premier rang, telles que Orange, Samsung, L’Oréal, ou Sanofi à travers le monde.
**Contexte**
L’approche dominante repose sur la conversion des requêtes et des documents en représentations vectorielles via un encodeur, permettant ensuite de mesurer leur similarité (produit scalaire, cosinus, etc.). Cette étape de récupération est également un composant fondamental du paradigme RAG (Retrieval-Augmented Generation), où les documents retrouvés sont ensuite utilisés comme contexte pour générer une réponse à l’aide d’un modèle génératif [Lewis et al., 2020].
**Problématique**
Les systèmes de recherche actuels sont généralement entraînés à l’aide de jeux de données semi-supervisés contenant des paires requête-document labellisées positives. Ces modèles prédisent des scores de pertinence relatifs, utiles pour trier des documents, mais insuffisants pour discriminer ceux qui sont réellement pertinents de ceux qui ne le sont pas [Xiong et al., 2021]. Ce manque de seuil clair pose un problème critique en contexte RAG : si les documents récupérés ne sont pas pertinents, le modèle génératif peut tout de même tenter de produire une réponse, en s’appuyant sur un contenu hors sujet ou en « halluciner » des faits [Shuster et al., 2021]
**Objectif du stage**
L’objectif de ce stage est d’explorer des méthodes permettant de transformer les scores de pertinence continus en décisions binaires (pertinent / non pertinent), en vue d’un filtrage plus fiable des documents avant génération.
**Axes de travail suggérés**
- Méthodes de seuillage:
- _Développement d’heuristiques simples_ : définir des règles empiriques sur les scores (ex. : seuils fixes) pour classifier les documents.
- _Calibration par validation_ : utiliser un jeu de calibration pour apprendre des seuils adaptatifs à partir des distributions de scores (ex. : par requête, par corpus, etc.).
- _Méthodes d’apprentissage_ : s’inspirer d’approches comme SigLIP pour former un modèle à distinguer explicitement les documents pertinents des non-pertinents, et non seulement à les classer [Touvron et al., 2023].
- Evaluation des approches:
- _Métriques classiques_ : les différentes méthodes seront évaluées à l’aide de métriques standard (F1-score), sur des jeux de données de retrieval annotés.
- Dans une pipeline de RAG_ : En complément, les stratégies de seuillage pourront être intégrées dans une pipeline RAG complet, afin de mesurer leur impact sur la qualité des réponses générées [Izacard et al., 2021].
**Conditions du stage et profil attendu**
- Stage de césure ou de fin d’études
- Durée: 4 à 6 mois
- Début: rentrée 2025 (septembre ou octobre)
- BAC+4/BAC+5 : Formation en machine learning/statistiques au sein d’une université ou école d’ingénieur
**Bibliographie**
- _Attention Is All you Need_, Vaswani et al., 2017
- _BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding, Devlin et al., 2019_Dense Passage Retrieval for Open-Domain Question Answering, Karpukhin et al., 2020_
- _Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks_, Lewis et al., 2020
- _Approximate Nearest Neighbor Negative Contrastive Learning for Dense Text Retrieval_, Xiong et al., 2021
- _Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering_, Izacard & Grave, 2021
- _Retrieval Augmentation Reduces Hallucination in Conversation_, Shuster et al., 2021
- _SigLIP: Scaling and Improving Vision-Language Models with Sigmoid Loss_, Touvron et al., 2023
-
Stage R&D
il y a 2 semaines
Paris, Île-de-France groupe-bel Temps pleinVous recherchez l'excellence, des responsabilités, de l'autonomie ? Ce stage correspond exactement à ce que vous recherchez Lisez la suite de l'annonce et postulez.VOUS NOUS CONNAISSEZ DEJA, C'EST SÛRVous avez déjà consommé nos produits (peut-être) sans le savoir For All. For Good, notre signature d'entreprise, traduit l'engagement de Bel pour une...
-
Stage ingénieur R&D
il y a 2 jours
Paris, Île-de-France AEROPHILE Temps pleinEn 2020 AEROPHILE a lancé un système de dépollution de l'air extérieur appelé Para-PM. Ce système de filtration électrostatique a vocation à capter les particules fines de l'air des grands espaces ouverts ou semi-ouverts, luttant ainsi pour la santé publique. Aujourd'hui 16 appareils Para-PM sont en fonctionnement continu dans une station de métro...
-
Stage R&D BioTS: Biocalcification
il y a 2 semaines
Paris, France VINCI Temps pleinUne entreprise leader dans le secteur de la construction propose un stage en R&D pour développer la solution BioTS. Ce stage de 6 mois commence en janvier 2026 et est destiné aux étudiants préparant un Bac +5 en Agronomie ou un domaine similaire. Les missions incluent le développement de la solution, la maîtrise de la production et des essais sur site....
-
Stage R&D en Downstream Process
il y a 5 jours
Paris, Île-de-France Standing Ovation Temps pleinStanding Ovation est une entreprise de biotechnologie française à la pointe de l'innovation, spécialisée dans la production de protéines alternatives et lauréate du programme FrenchTech 2030.Grâce à notre technologie propriétaire de fermentation de précision, nous révolutionnons la production de protéines en développant une alternative à...
-
Stage R&D: Analyse biosignaux et données
il y a 3 jours
Paris, France EssilorLuxottica Temps pleinUne entreprise innovante dans l'optique recherche un stagiaire chargé d'études R&D à Paris. Le candidat idéal doit être en formation BAC +5 en bio-informatique et bio-statistique et posséder des compétences en traitement de signal et d'image. Les missions incluent la mise en place de protocoles expérimentaux, l'analyse de biosignaux, ainsi que la...
-
Stage - Javascript Developer - R&d (H/F)
il y a 2 jours
Paris, France Smile Temps pleinSmile est le leader du "sourire" au travail mais aussi du digital et de l’open source. Enthousiastes, agiles et performants, les Smiliens ont pour vocation de libérer le potentiel d'innovation des entreprises grâce au logiciel libre, et les accompagnent dans des domaines aussi variés que le Digital, les Business Apps, l'Embarqué & l'IoT et...
-
Financement de L’innovation Et de La R&d
il y a 2 jours
Paris, France Wavestone Temps plein**Description de l'entreprise**: Wavestone est un cabinet de conseil, qui a pour mission d'accompagner les entreprises et organisations dans leurs transformations stratégiques dans un monde en constante évolution, avec l’ambition de générer des impacts positifs et durables pour toutes ses parties prenantes. Forts de plus de 5 500 collaborateurs...
-
Financement de L’innovation Et de La R&d
il y a 10 heures
Paris, France Wavestone Temps plein**Description de l'entreprise**: Wavestone est un cabinet de conseil, qui a pour mission d'accompagner les entreprises et organisations dans leurs transformations stratégiques dans un monde en constante évolution, avec l’ambition de générer des impacts positifs et durables pour toutes ses parties prenantes. Forts de plus de 5 500 collaborateurs...
-
Stage R&d Développement Packaging
il y a 1 semaine
Paris 17e, France ASSOCIATION VOX POPULI Temps plein**PRÉSENTATION DE L’ASSOCIATION**: Vox Populi est une association loi 1901 qui œuvre pour le renforcement de l'employabilité des jeunes dans le cadre de sa mission d'égalité des chances. Nous allions exigence de résultats et accompagnement des jeunes issus de milieux défavorisés dans la définition de leur projet de vie, malgré un contexte...
-
Stage R&d/data
il y a 10 heures
Paris, France PMU Temps plein**Métier**: Systèmes d'information - Conception et développement **Intitulé du poste**: Stage R&D/Data H/F **Contrat**: STAGE **Statut du poste**: Stagiaire **Temps de travail**: Temps plein **Durée du contrat**: 6 mois **Description de poste**: Au sein de l'équipe Innovation & IA, nous cherchons un(e) Stagiaire R&D/Data pour accompagner notre...