[Stage R&D pre-Thèse CIFRE]

il y a 4 jours


Paris, France VIVADATA Temps plein

[Stage R&D pre-Thèse CIFRE] : Modèles à base d’arbres explicables et contrôlables, applications sur cas réels Join to apply for the [Stage R&D pre-Thèse CIFRE] : Modèles à base d’arbres explicables et contrôlables, applications sur cas réels role at VIVADATA Présentation d’Artefact Artefact est une société internationale de services autour de la data et l’IA, dont la mission est de transformer la donnée en délivrant des résultats tangibles sur l’ensemble de la chaîne de valeur des entreprises. L’approche unique d’Artefact, qui fait le pont entre la donnée et le business, permet à nos clients d’atteindre leurs objectifs business de façon dédiée et efficace. Nos 1700 employés allient leurs compétences pluridisciplinaires au profit de l’innovation business des entreprises. Nos technologies de pointe en Intelligence Artificielle, nos méthodes agiles garantissent le succès des projets IA de nos clients, de la conception au déploiement, jusqu’à la formation et l’accompagnement au changement. Le centre de recherche d’Artefact comporte 20 membres et est dédié à améliorer les modèles de machine learning, afin de les rendre plus transparents et contrôlables. Sa recherche est intégralement open source, à travers des publications scientifiques et des packages en licence libre. Présentation du laboratoire académique – LPSM (Sorbonne Université) Le Laboratoire de Probabilités, Statistique et Modélisation (LPSM, UMR 8001) est une unité mixte de recherche dédiée aux mathématiques de l’aléatoire et des données. Les thèmes de recherche du LPSM concernent des domaines très variés et couvrent aussi bien des mathématiques fondamentales que des applications et des interactions dans de nombreuses disciplines : sciences des données, médecine, sciences humaines, sciences de la vie, physique, finance, actuariat, etc. Au total, le laboratoire compte environ 200 membres (env. 90 personnels permanents). L’étudiant sera encadré du côté académique par Erwan Scornet, enseignant-chercheur au LPSM depuis 2023, travaillant sur les thématiques des forêts aléatoires et de l’interprétabilité. Contexte Offre de stage de recherche de fin d’études d’une durée de 4 à 6 mois, débutant au printemps 2026, pouvant déboucher sur une thèse CIFRE, débutant en septembre 2026. Cette offre liste les possibles directions de recherche, qui seront affinées durant le stage. Ces directions constituent également les développements qui pourront être menés durant la thèse. Dès le stage, l’étudiant aura accès à des données entreprise et sera confronté à des cas concrets. L’objectif général est double : proposer une solution technique à un problème métier avéré; formaliser et publier les travaux sous la forme d’articles scientifiques et diffuser ses travaux lors de présentations en conférences internationales. Cas d’application Les travaux porteront sur un cas d’application récurrent du machine learning classique : l'utilisation des modèles à base d'arbre (forêt aléatoire, Gradient Boosting, XGBoost) pour la prédiction sur des séries temporelles. Le cadre métier et illustratif sont les modèles de forecasting, qui prédisent les ventes futures de différents produits, par exemple de la grande distribution. Les séries temporelles sont donc les ventes historiques, produit par produit. Une variable d'entrée particulièrement importante dans ce cadre est le prix, qui impacte fortement la prédiction, et qui fait l’objet de manipulations par des utilisateurs métier, voire est automatiquement optimisé pour un objectif donné (campagne de promotion, pricing). Le stage commencera par évaluer quantitativement les limites de l'existant sur un jeu de données de vente interne d'un grand groupe de distribution français. Dans l’hypothèse de la thèse, le cas d’application pourra évoluer, et ne sera pas strictement maintenu sur le forecasting. Problématiques Scientifiques Contrainte de monotonie: Garantir que les prédictions du modèle respectent strictement la croissance ou décroissance selon une variable d’entrée donnée. Méthodes existantes imposent des bornes supérieures et inférieures aux prédictions possibles, excluant les prédictions hors bornes lors de la recherche de la coupure optimale. Feature importance: Évaluer l’importance globale des variables d’entrée, en considérant la perte de précision du modèle lorsque les valeurs de la variable sont permutées aléatoirement sur des points de validation. Causality: Utiliser les forêts causales (Causal Forests) pour capturer les effets de causalité, notamment l’impact de la promotion ou du changement de prix sur les ventes, en identifiant les périodes de promotions ou de changements de prix. Missing data: Imputer les données manquantes (exemple: pénurie de produit) afin d’améliorer la prédiction des ventes futures, en traitant les données de type “missing at random” (MAR). Votre profil Le profil recherché pour ce poste est le suivant : BAC+5 : Formation en mathématiques appliquées, statistiques ou machine learning au sein d’une université ou école d’ingénieur Stage de fin d’études Date de début : printemps 2026 Durée : 4 à 6 mois Pour postuler, veuillez envoyer via email votre CV avec votre dernier relevé de notes à emmanuel.malherbe@artefact.com et anouk.joubert@artefact.com APPLY NOW #J-18808-Ljbffr



  • Paris, France Artefact Temps plein

    [Stage R&D pre-Thèse CIFRE] : Modèles à base d’arbres explicables et contrôlables, applications sur cas réels Join to apply for the [Stage R&D pre-Thèse CIFRE] : Modèles à base d’arbres explicables et contrôlables, applications sur cas réels role at Artefact. Artefact est une société internationale de services de données spécialisée dans...


  • Paris, France VIVADATA Temps plein

    [Stage R&D pre-Thèse CIFRE] : Modèles à base d’arbres explicables et contrôlables, applications sur cas réels Contexte Offre de stage de recherche pour master d’une durée de 4 à 6 mois, débutant au printemps 2025. Ce document liste les directions possibles pour le stage, qui seront ajustées au fil du stage. L’étudiant aura accès à des...


  • Paris, France the Jungle Temps plein

    [Stage R&D pre-Thèse CIFRE] : Modèles à base d’arbres explicables et contrôlables, applications sur cas réels Présentation d’Artefact Artefact est une société internationale de services de données spécialisée dans le conseil en transformation des données. Sa mission est de transformer les données en produisant des résultats tangibles sur...

  • CDD - These Cifre à l'Afd H/F

    il y a 2 semaines


    Paris, France Agence Française de Développement AFD Temps plein

    CDD - THESE CIFRE à l'AFD - F/H Quel sera votre rôle ? 1. Quel sera votre rôle ? La division Energie de l'AFD recrute un(e) doctorant(e) dans le cadre d'une thèse CIFRE (Convention Industrielle de Formation par la Recherche) adossée à un CDD de 3 ans. Le/la candidat(e) retenu(e) réalisera sa thèse au sein de la division Energie de l'AFD en étant...

  • THESE CIFRE à l’AFD

    il y a 2 semaines


    Paris, France AFD - Agence Française de développement Temps plein

    1. Quel sera votre rôle ?La division Energie de l’AFD recrute un(e) doctorant(e) dans le cadre d’une thèse CIFRE (Convention Industrielle de Formation par la Recherche) adossée à un CDD de 3 ans. Le/la candidat(e) retenu(e) réalisera sa thèse au sein de la division Energie de l’AFD en étant guidé(e) par un tuteur Responsable d’Equipe Projet...


  • Paris, France Inria Temps plein

    **Type de contrat **:CDD **Niveau de diplôme exigé **:Bac + 5 ou équivalent **Fonction **:Doctorant **Niveau d'expérience souhaité **:Jeune diplômé **Contexte et atouts du poste**: **Dans le cadre d'un partenariat Inria Safran on envisage un travail de** **thèse (Cifre) dans le domaine des FANETs ( Flying Adhoc NETworks )** **L'objectif est de...


  • Paris, Île-de-France Murex Temps plein

    Murex is a global fintech leader in trading, risk management and processing solutions for capital markets.Operating from our 19 offices, 3 400 Murexians from over 65 different nationalities ensure the development, implementation and support of our platform which is used by banks, asset managers, corporations and utilities, across the world. Join Murex and...


  • Paris, Île-de-France Agence Française de Développement Temps plein

    JOB.TITLE What will be your role? 1. Quel sera votre rôle ?La division Energie de l'AFDrecrute un(e) doctorant(e) dans le cadre d'une thèse CIFRE (ConventionIndustrielle de Formation par la Recherche) adossée à un CDD de 3 ans. Le/lacandidat(e) retenu(e) réalisera sa thèse au sein de la division Energie del'AFD en étant guidé(e) par un tuteur...


  • Paris, Île-de-France Agence Française de Développement Temps plein

    JOB.TITLE What will be your role? 1. Quel sera votre rôle ?La division Energie de l'AFDrecrute un(e) doctorant(e) dans le cadre d'une thèse CIFRE (ConventionIndustrielle de Formation par la Recherche) adossée à un CDD de 3 ans. Le/lacandidat(e) retenu(e) réalisera sa thèse au sein de la division Energie del'AFD en étant guidé(e) par un tuteur...


  • Paris, Île-de-France Murex Temps plein

    Murex is a global fintech leader in trading, risk management and processing solutions for capital markets.Operating from our 19 offices, 3 400 Murexians from over 65 different nationalities ensure the development, implementation and support of our platform which is used by banks, asset managers, corporations and utilities, across the world. Join Murex and...