Modèles à base d'arbres explicables et contrôlables, applications sur cas réels

il y a 22 heures

Paris, Île-de-France LinkedIn Job Wrapping Temps plein

Présentation d'Artefact

Artefact est une société internationale de services de données spécialisée dans le conseil en transformation des données. Sa mission est de transformer les données en produisant des résultats tangibles sur l'ensemble de la chaîne de valeur des entreprises. L'approche unique d'Artefact, qui relie les données aux activités, permet à nos clients d'atteindre leurs objectifs commerciaux avec dévouement et efficacité. Nos 1 500 collaborateurs répartis dans le monde entier combinent leurs compétences pluridisciplinaires pour accompagner les entreprises dans l'innovation. Nos technologies et méthodes d'intelligence artificielle de pointe garantissent la réussite des projets d'IA de nos clients, de la conception au déploiement, en passant par la formation et la conduite du changement.

Depuis plusieurs années, nous développons des solutions de supply chain pour de grands groupes de distribution tels que Carrefour, Orange, L'Oréal et Danone.

Contexte

L'intégration des grands modèles de langage (LLM) dans un nombre croissant d'applications met en évidence un défi majeur : leur fiabilité et leur fiabilité. En effet, si vous avez déjà utilisé ces outils, vous avez sûrement été confronté à une hallucination qui vous a depuis rendu méfiant quant à leurs résultats.

Ces hallucinations constituent des obstacles majeurs à l'adoption, en particulier pour les LLM spécialisés ou de petite taille déployés dans des environnements aux ressources limitées (par exemple, des environnements industriels hors ligne), où la surveillance continue ou l'accès à des modèles cloud de pointe sont impossibles. Alors que les LLM progressent rapidement, des méthodes robustes pour quantifier l'incertitude de leurs résultats sont essentielles pour un déploiement sûr et fiable.

Objectifs et livrables

Ce stage étudiera de nouvelles méthodes basées sur l'échantillonnage entropique par distribution logit, couplées à une approche d'apprentissage supervisé pour atténuer l'excès de confiance typique des réseaux de neurones profonds. L'idée centrale est qu'un modèle manquant d'informations spécifiques aura tendance à considérer un grand nombre de jetons différents comme probables, répartissant ainsi la distribution de probabilité sur l'ensemble du vocabulaire.

L'un des principaux objectifs et défis de ce travail est d'adapter ces méthodes de quantification de l'incertitude aux modèles LLM boîte noire (tels que GPT-4o via l'API OpenAI). Ces modèles n'offrent souvent qu'un accès limité aux états internes, généralement limité aux probabilités logarithmiques de quelques jetons candidats de premier plan à chaque étape de génération. Nous explorerons des stratégies permettant d'exploiter efficacement ces informations rares pour une estimation fiable de l'incertitude. Nous étudierons également l'influence d'un contexte externe supplémentaire sur les distributions de probabilité et l'entropie qui en résulte, dans un pipeline RAG par exemple.

Mettre en œuvre la méthode d'estimation de l'incertitude entropique supervisée proposée
Développer des stratégies pour son application aux modèles boîte noire avec un accès limité à la méthode logprob.
Évaluer rigoureusement les performances de notre méthode par rapport aux techniques de quantification de l'incertitude établies.
Intégrer les méthodologies développées dans une bibliothèque Python Open Source documentée, adaptée aux contributions à des publications dans des conférences.

Votre profil

Étudiant(e) de niveau bac+4 ou bac+5, en fin d'études ou césure, en université ou en école d'ingénieur, spécialisé(e) en ML, statistiques, mathématiques appliquées ou autre domaine pertinent
Début de stage : Septembre ou Octobre 2025
Vous maîtrisez Python, notamment en calcul scientifique et en traitement de données
Vous disposez de solides connaissances en théorie des probabilités, en statistique et en apprentissage automatique
Vous êtes capable de comprendre et d'implémenter des algorithmes issus de travaux de recherche
Vous vous intéressez aux défis de la fiabilité des LLM, de la quantification des incertitudes et de la contribution aux logiciels libres
Vous avez de l'expérience en rédaction d'articles/rapports scientifiques.

Ce stage offre une opportunité unique de travailler sur des recherches de pointe en LLM, d'approfondir vos connaissances sur les techniques de quantification des incertitudes, de développer des compétences pratiques dans l'application du ML aux contraintes du monde réel et d'apporter une contribution concrète à la recherche GenAI grâce à un projet libre.

Modèles à base d'arbres explicables et contrôlables, applications sur cas réels

il y a 19 heures

Paris, Île-de-France Artefact Temps plein

Présentation d'ArtefactArtefact est une société internationale de services autour de la data et l'IA, dont la mission est de transformer la donnée en délivrant des résultats tangibles sur l'ensemble de la chaîne de valeur des entreprises. L'approche unique d'Artefact, qui fait le pont entre la donnée et le business, permet à nos clients...
Modèles à base d'arbres explicables et contrôlables, applications sur cas réels

il y a 21 heures

Paris, Île-de-France Artefact Temps plein

ContexteOffre de stage de recherche de master d'une durée de 4 à 6 mois, débutant au printemps 2025. Ce document liste les possibles directions pour le stage, qui seront ajustées au fil du stage. L'étudiant aura accès à des données réelles et sera confronté à des cas concrets (qui seront précisées en début de stage). Ce stage aura lieu au sein...
Offre de stage – Projet de stage de recherche M2

il y a 20 heures

Paris, Île-de-France Association Bilan Carbone Temps plein

Exploration causale et explicabilité des relations entre variables dans les Bilans Carbone : vers une compréhension fine et vérifiable des émissions organisationnelles.Qui sommes-nous ?Le Laboratoire d'Informatique de Paris 6 (LIP6 – Sorbonne Université) est une unité de recherche de référence en intelligence artificielle explicable et en...
Administration Base de Données

il y a 1 semaine

Paris, Île-de-France ANDERSON RH Temps plein

Nous recherchons un Administration Base de Données de 8 ans d'expérience minimumavec des compétences ci-dessous :BanqueSQL ServerPostgres SQLMySQLIBM Db2Vos missionsDescription de la mission :Assister les squads dans la création et l'évolution de leurs modèles de données :Réaliser des contrôles afin de garantir l'application des normes...
Charge De Modelisation D'Un Portefeuille De Dettes

il y a 1 semaine

Paris 05 Ancien - Quartier Bon-Conseil, Île-de-France Banque de France Temps plein

Le CMA dispose d'un modèle de projection des intérêts futurs à payer sur un stock de dette qui se renouvelle régulièrement (cas d'usage déjà en place sur la dette des entreprises de chaque pays de la zone euro ou encore sur la dette gouvernementale française). L'objectif du stage est d'étendre le modèle à la dette publique d'autres pays pour...
Stage 2026 - Data Science et Machine Learning/AI practitionner - Sujet : Foundation models for tabular data (H/F/N)

il y a 6 jours

Paris, Île-de-France Ekimetrics Temps plein

Ekimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l'optimisation de performance marketing, business et de la transition vers une performance plus durable. Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d'être de votre avenir...
Machine Learning Engineer

il y a 6 jours

Paris, Île-de-France ec-0b91-4fd1-a05e-dc94127b83a9 Temps plein

En quelques motsCherry Pick est à la recherche d'un "Data Scientist" pour un client dans le secteur bancaireDescription? Le ContextePour le compte d?un grand groupe bancaire français, nous recherchons un expert en Data Science pour rejoindre une équipe pluridisciplinaire (Conformité, IT, Gestion de projet) en pleine transformation.Le groupe lance une...
Stage 2026 - Data Science et Machine Learning/AI practitionner - Sujet : Foundation models for tabular data (H/F/N)

il y a 6 jours

Paris, Île-de-France Ekimetrics Temps plein

Ekimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l'optimisation de performance marketing, business et de la transition vers une performance plus durable.Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d'être de votre avenir...
Business Analyst Applications partagées

il y a 6 jours

Paris, Île-de-France NEXORIS Temps plein

Notre client, un acteur financier, recherche un Business Analyst Applications partagées- Marchés financiers (H/F). Missions principales : Analyse fonctionnelle et modélisation des besoins.Rédaction de spécifications fonctionnelles et techniques.Production des livrables : RFP, cahiers de test, documentation applicative.Participation aux tests...
Post-doctorat - HED models development into the ESTHER code and experimental applications - H/F

il y a 3 jours

Paris, Île-de-France CEA Temps plein

Informations générales Entité de rattachement La Direction des Applications Militaires (DAM) du CEA, au cœur des enjeux de la dissuasion nucléaire Française, cherche ses futurs talents. Organisme inclusif, le CEA est handi-accueillant : nos emplois sont ouverts à toutes et tous. Associer les forces et les compétences de chacun pour atteindre nos...

Amériques

Europe

Asie / Océanie

Afrique

Modèles à base d'arbres explicables et contrôlables, applications sur cas réels