Stage 2026 - Data Science et Machine Learning/AI practitionner - Sujet : Data attribution (H/F/N)
il y a 6 jours
• 400 expert.e.s en data science
• 1000 projets divers et variés pour plus de 350 clients
• 5 bureaux : Paris, Hong Kong, Shanghai, Londres et New York
• 1 milliard de $ de profits générés pour nos clients depuis Chez Ekimetrics nous avons l'ambition d'accompagner nos clients à repenser leur business model, en réconciliant performance économique et objectifs durables, grâce à la data science. C'est pourquoi nous avons en interne toutes les compétences nous permettant de répondre aux besoins de nos clients : Product Managers, Product Designers, Data Architects, Lead Tech, Data Engineers, DevOps Engineers, Data Scientists. L'équipe que vous pourriez rejoindre Pourquoi recrutons-nous ? Au sein d'Ekimetrics, le département Innovation travaille sur des sujets de recherche en IA en collaboration avec nos partenaires industriels et académiques. Le département regroupe plusieurs docteurs experts dans le domaine de l'IA générative, du deep learning, de la série temporelle, de l'explicabilité/interprétabilité, et de la causalité. Trois thèses CIFRE sont en cours. Autour de chaque expert des équipes sont constituées en charge de tester les algorithmes état de l'art et les adapter à des problématiques business spécifiques, de créer de nouvelles méthodologies ou algorithmes répondant à un problème relevé, et d'assurer la passation en vue d'une intégration dans l'écosystème industriel d'Ekimetrics. Le stream interprétabilité/explicabilité a vocation à développer des modèles ou des méthodes permettant une meilleure compréhension du comportement de modèles de machine learning/deep learning. Ce stage portera sur la data attribution [1,2]. Celle-ci consiste à évaluer dans quelle mesure chaque point de donnée d'entrainement a contribué à la performance du modèle, une fois entrainé. Il s'agira d'investiguer différentes méthodes de data attribution, appliquées à des modèles de machine learning classique (XGB, LGBM), des modèles de deep learning pour données tabulaires (TabPFN, TabICL) ou pour le texte (Mistral, Gemma). Dans un premier temps, le stagiaire réalisera une revue de littérature basée sur celles existantes [3, 4], puis testera les différentes librairies disponibles [5, 6] et méthodes ayant fait leurs preuves [7, 8, 9, 10]. Enfin, nous investiguerons différents cas d'usage liés à l'utilisation de la data attribution, comme la détection d'erreurs de labélisations, et le déploiement au sein de solutions existantes chez Ekimetrics. Le stage déboucher sur un poste de data scientist en IA pour les très bons profils. Dans ce contexte, vos responsabilités sont de : - Assurer une veille sur l'état de l'art dans le cadre du machine learning au global, et du deep learning en particulier. - Effectuer un travail de recherche au sein du département Innovation - Respecter les bonnes pratiques de code pour assurer l'industrialisation de ceux-ci avec nos experts Solution - Partager vos connaissances en interne en apportant un support d'expert Profile : - En stage de fin d'étude d'une grande école d'ingénieur ou de master 2, vous avez acquis de solides connaissances en machine learning - Expérience dans les méthodologies et bonnes pratiques de développement : Tests unitaires, versionning - Compétences approfondies en Python - Maitrise des librairies Pytorch, numpy, sklearn - Connaissances en deep learning - Connaissances approfondies en probabilités, mathématiques et statistiques - Des connaissances en interprétabilité/explicabilité sont un plus - Anglais courant. Pourquoi nous rejoindre ? Rejoindre Ekimetrics, c'est intégrer une entreprise dont les valeurs s'appliquent au quotidien :
• Evoluer dans un environnement type start-up et non traditionnel (#curiosité)
• Être capable de prendre le feedback pour s'améliorer (#excellence)
• Se former dès son arrivée et en continu grâce à une expérience apprenante unique et riche de nombreuses ressources (internes, externes, live et digital) alliant savoirs techniques, savoir-être et savoir-faire (#transmission)
• Faire partie d'une communauté accueillante et soudée (#plaisir)
• Imaginer des solutions inattendues & sortir de sa zone de confort (#créativité) En 2023, Ekimetrics a obtenu le statut d'entreprise à mission qui témoigne de notre ambition forte en matière de RSE. Nous sommes également certifiés Great Place to Work. Vous aurez accès à …
• Au catalogue de formation EkiA qui contient des programmes qui vous feront monter en compétences sur nos solutions et nos métiers, des parcours apprenants sur notre plateforme digitale ainsi que des programmes dédiés à nos enjeux prioritaires, dont la sensibilisation aux sujets environnementaux avec la Climate School AXA.
• Une vie sportive, artistique, musicale, ludique, caritative et engagée : de notre salle de sport privatisée à nos expositions d'art, en passant par des jeux vidéo et des concerts, ou encore les défis RSE sur la plateforme Vendredi ;
• De nombreux évènements et séminaires pour rester proche de votre communauté ;
• Des locaux modernes dans un quartier dynamique au cœur de Paris (Grands boulevards)
• Une politique de télétravail flexible. Notre processus recrutement Un test technique sur HackerRank Un entretien RH avec un(e) Talent Acquisition Une étude de cas avec un(e) Consultant(e) Un entretien final avec un(e) Consultant(e) Senior Nous serions ravi.e.s de vous donner de plus amples informations lors d'un entretien et attendons votre candidature avec impatience Références [1] Training Data Attribution: Examining Its Adoption & Use Cases: [2] SelfIE: Self-Interpretation of Large Language Model Embeddings [2] Data Attribution at Scale: https://ml-data- [3] Deng, J., Hu, Y., Hu, P., Li, T. W., Liu, S., Wang, J. T., ... & Ma, J. W A Survey of Data Attribution: Methods, Applications, and Evaluation in the Era of Generative AI. [4] Hammoudeh, Z., & Lowd, D Training data influence analysis and estimation: A survey. Machine Learning, 113(5), [5] Jiang, K. F., Liang, W., Zou, J., & Kwon, Y. (2023, December). OpenDataVal: a unified benchmark for data valuation. In Proceedings of the 37th International Conference on Neural Information Processing Systems (pp [6] Deng, J., Li, T. W., Zhang, S., Liu, S., Pan, Y., Huang, H., ... & Zhang, X dattri: A Library for Efficient Data Attribution. Advances in Neural Information Processing Systems, 37, [7] Ghorbani, A., & Zou, J. (2019, May). Data shapley: Equitable valuation of data for machine learning. In International conference on machine learning (pp PMLR. [8] Bae, J., Lin, W., Lorraine, J., & Grosse, R. B Training data attribution via approximate unrolling. Advances in Neural Information Processing Systems, 37, [9] Wang, J. T., Mittal, P., Song, D., & Jia, R. Data Shapley in One Training Run. In The Thirteenth International Conference on Learning Representations., 2025 [10] Pruthi, G., Liu, F., Kale, S., & Sundararajan, M Estimating training data influence by tracing gradient descent. Advances in Neural Information Processing Systems, 33,
En tant qu'employeur, Ekimetrics offre à tous les mêmes opportunités d'accès à l'emploi sans distinction de genre, ethnicité, religion, orientation sexuelle, statut social, handicap et d'âge. Ekimetrics veille à développer un environnement de travail inclusif qui reflète la diversité dans ses équipes. We may use artificial intelligence (AI) tools to support parts of the hiring process, such as reviewing applications, analyzing resumes, or assessing responses. These tools assist our recruitment team but do not replace human judgment. Final hiring decisions are ultimately made by humans. If you would like more information about how your data is processed, please contact us.
-
Paris, Île-de-France Ekimetrics Temps pleinEkimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l'optimisation de performance marketing, business et de la transition vers une performance plus durable.Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d'être de votre avenir...
-
Paris, Île-de-France Ekimetrics Temps pleinEkimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l'optimisation de performance marketing, business et de la transition vers une performance plus durable.Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d'être de votre avenir...
-
data science intern
il y a 1 semaine
Paris, Île-de-France STATION F Temps pleinAboutQantev is an AI company that helps health insurers deliver better healthcare to their members.They do that by leveraging insurers' historical health claims data and by applying Machine Learning techniques and Generative AI to predict patient journeys.They are backed by top investors and industry leaders, and have customers all across the world (Europe,...
-
Stage - Assistant Data Science (F/H) - Avril 2026
il y a 3 jours
Paris, Île-de-France Louis Vuitton Temps pleinAbout The JobDepuis plus de 150 ans, les femmes et les hommes de Louis Vuitton partagent le même esprit d'exigence, de passion et réinventent chaque jour leur métier, partout dans le monde. Chez nous, chaque parcours est un véritable voyage, nourri d'émotion et de conquête, d'envie et d'audace. La plus belle façon de vous révéler. Explorer,...
-
data scientist
il y a 4 jours
Paris, Île-de-France STATION F Temps pleinÀ proposNotre parcours a commencé en 2019, au Lloyd's Lab, le principal accélérateur InsurTech de Londres, et à Station F, Paris, où notre équipe de data scientists, d'ingénieurs logiciels et de chefs de produit a développé les solutions révolutionnaires d'Allphins pour les réassureurs. Notre solution est une plateforme SaaS permettant aux...
-
Stage Data Scientist
il y a 1 jour
Paris, Île-de-France un emploi de Stage Data Scientist chez Mirakl Temps pleinAbout MiraklMirakl is the leading provider of eCommerce software solutions. Mirakl's suite of solutions provides enterprises with a transformative way to drive significant growth and efficiency in their online business. Since 2012, Mirakl has been pioneering the platform economy, empowering retail and b2b enterprises with the most advanced, secure and...
-
Stage Quantitative Researcher
il y a 6 jours
Paris, Île-de-France ODDO Temps pleinActivitéODDO BHF est un groupe financier européen indépendant animé depuis 5 générations par la volonté de soutenir ceux qui entreprennent. Né du rapprochement d'une banque familiale et de la BHF Bank, la banque historique du Mittelstand, le Groupe se caractérise par des racines franco-allemandes et une présence stratégique en Suisse. Les 3000...
-
Data Scientist H/F
il y a 2 semaines
Paris, Île-de-France Data sea Temps pleinÀ propos du posteNous recherchons un(e) Data Scientist pour rejoindre notre équipe et participer activement à la valorisation de nos données. Votre rôle sera essentiel pour comprendre nos performances, anticiper les tendances et proposer des solutions basées sur la data.Vos responsabilitésExploiter et analyser de grands volumes de donnéesConstruire...
-
Machine Learning Engineer IA
il y a 1 jour
Paris, Île-de-France Collective Temps pleinBudget: 575Data Scientist / Machine Learning Engineer IA & GenAI – Expérimenté (H/F)Secteur :Banque / FinanceLocalisation :Paris (2 jours de TT)Durée :Mission longue (2 ans)Démarrage :Dès que possibleContexte De La MissionUn acteur international de premier plan dans la gestion d'actifs renforce son équipe Innovation au sein de sa DSI. Cette entité...
-
stage data science f/h
il y a 2 semaines
Paris, Île-de-France Galeries Lafayette Temps pleinS'émerveiller devant les vitrines, vivre des expériences surprenantes, découvrir les dernières tendances en ligne comme en magasin, cela résonne forcément en vous Intégrer le Groupe Galeries Lafayette, c'est évoluer dans un univers Lifestyle (Mode, Beauté, Maison, Joaillerie, Horlogerie et Food), reflet d'un commerce joyeux, créatif et...