Stage 2026 - Data Science et Machine Learning/AI practitionner - Sujet : Data attribution (H/F/N)

il y a 1 jour


Paris, Île-de-France Ekimetrics Temps plein

Ekimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l'optimisation de performance marketing, business et de la transition vers une performance plus durable.

Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d'être de votre avenir professionnel, votre place est sûrement chez Ekimetrics

Et si nous vous présentions quelques datas ?

  • 400 expert.e.s en data science
  • 1000 projets divers et variés pour plus de 350 clients
  • 5 bureaux : Paris, Hong Kong, Shanghai, Londres et New York
  • 1 milliard de $ de profits générés pour nos clients depuis 2006

Chez Ekimetrics nous avons l'ambition d'accompagner nos clients à repenser leur business model, en réconciliant performance économique et objectifs durables, grâce à la data science.

C'est pourquoi nous avons en interne toutes les compétences nous permettant de répondre aux besoins de nos clients : Product Managers, Product Designers, Data Architects, Lead Tech, Data Engineers, DevOps Engineers, Data Scientists.

L'équipe que vous pourriez rejoindre
Pourquoi recrutons-nous ?
Au sein d'Ekimetrics, le département Innovation travaille sur des sujets de recherche en IA en collaboration avec nos partenaires industriels et académiques. Le département regroupe plusieurs docteurs experts dans le domaine de l'IA générative, du deep learning, de la série temporelle, de l'explicabilité/interprétabilité, et de la causalité. Trois thèses CIFRE sont en cours. Autour de chaque expert des équipes sont constituées en charge de tester les algorithmes état de l'art et les adapter à des problématiques business spécifiques, de créer de nouvelles méthodologies ou algorithmes répondant à un problème relevé, et d'assurer la passation en vue d'une intégration dans l'écosystème industriel d'Ekimetrics.

Le stream interprétabilité/explicabilité a vocation à développer des modèles ou des méthodes permettant une meilleure compréhension du comportement de modèles de machine learning/deep learning.

Ce stage portera sur la
data attribution
[1,2]. Celle-ci consiste à évaluer dans quelle mesure chaque point de donnée d'entrainement a contribué à la performance du modèle, une fois entrainé. Il s'agira d'investiguer différentes méthodes de
data attribution
, appliquées à des modèles de machine learning classique (XGB, LGBM), des modèles de deep learning pour données tabulaires (TabPFN, TabICL) ou pour le texte (Mistral, Gemma).

Dans un premier temps, le stagiaire réalisera une revue de littérature basée sur celles existantes [3, 4], puis testera les différentes librairies disponibles [5, 6] et méthodes ayant fait leurs preuves [7, 8, 9, 10]. Enfin, nous investiguerons différents cas d'usage liés à l'utilisation de la data attribution, comme la détection d'erreurs de labélisations, et le déploiement au sein de solutions existantes chez Ekimetrics.

Le stage déboucher sur un poste de data scientist en IA pour les très bons profils.

Dans Ce Contexte, Vos Responsabilités Sont De

  • Assurer une veille sur l'état de l'art dans le cadre du machine learning au global, et du deep learning en particulier.
  • Effectuer un travail de recherche au sein du département Innovation
  • Respecter les bonnes pratiques de code pour assurer l'industrialisation de ceux-ci avec nos experts Solution
  • Partager vos connaissances en interne en apportant un support d'expert

Profile

  • En stage de fin d'étude d'une grande école d'ingénieur ou de master 2, vous avez acquis de solides connaissances en machine learning
  • Expérience dans les méthodologies et bonnes pratiques de développement : Tests unitaires, versionning
  • Compétences approfondies en Python
  • Maitrise des librairies Pytorch, numpy, sklearn
  • Connaissances en deep learning
  • Connaissances approfondies en probabilités, mathématiques et statistiques
  • Des connaissances en interprétabilité/explicabilité sont un plus
  • Anglais courant.

Pourquoi nous rejoindre ?
Rejoindre Ekimetrics, c'est intégrer une entreprise dont les valeurs s'appliquent au quotidien :

  • Evoluer dans un environnement type start-up et non traditionnel (#curiosité)
  • Être capable de prendre le feedback pour s'améliorer (#excellence)
  • Se former dès son arrivée et en continu grâce à une expérience apprenante unique et riche de nombreuses ressources (internes, externes, live et digital) alliant savoirs techniques, savoir-être et savoir-faire (#transmission)
  • Faire partie d'une communauté accueillante et soudée (#plaisir)
  • Imaginer des solutions inattendues & sortir de sa zone de confort (#créativité)

En 2023, Ekimetrics a obtenu le statut d'entreprise à mission qui témoigne de notre ambition forte en matière de RSE. Nous sommes également certifiés Great Place to Work.

Vous aurez accès à …

  • Au catalogue de formation EkiA qui contient des programmes qui vous feront monter en compétences sur nos solutions et nos métiers, des parcours apprenants sur notre plateforme digitale ainsi que des programmes dédiés à nos enjeux prioritaires, dont la sensibilisation aux sujets environnementaux avec la Climate School AXA.
  • Une vie sportive, artistique, musicale, ludique, caritative et engagée : de notre salle de sport privatisée à nos expositions d'art, en passant par des jeux vidéo et des concerts, ou encore les défis RSE sur la plateforme Vendredi ;
  • De nombreux évènements et séminaires pour rester proche de votre communauté ;
  • Des locaux modernes dans un quartier dynamique au cœur de Paris (Grands boulevards)
  • Une politique de télétravail flexible.

Notre processus recrutement

Un test technique sur HackerRank

Un entretien RH avec un(e) Talent Acquisition

Une étude de cas avec un(e) Consultant(e)

Un entretien final avec un(e) Consultant(e) Senior

Nous serions ravi.e.s de vous donner de plus amples informations lors d'un entretien et attendons votre candidature avec impatience

Références

[1] Training Data Attribution: Examining Its Adoption & Use Cases: [2] SelfIE: Self-Interpretation of Large Language Model Embeddings

[2] Data Attribution at Scale: https://ml-data-

[3] Deng, J., Hu, Y., Hu, P., Li, T. W., Liu, S., Wang, J. T., ... & Ma, J. W A Survey of Data Attribution: Methods, Applications, and Evaluation in the Era of Generative AI.

[4] Hammoudeh, Z., & Lowd, D Training data influence analysis and estimation: A survey.
Machine Learning
,
113
(5),

[5] Jiang, K. F., Liang, W., Zou, J., & Kwon, Y. (2023, December). OpenDataVal: a unified benchmark for data valuation. In
Proceedings of the 37th International Conference on Neural Information Processing Systems
(pp

[6] Deng, J., Li, T. W., Zhang, S., Liu, S., Pan, Y., Huang, H., ... & Zhang, X dattri: A Library for Efficient Data Attribution.
Advances in Neural Information Processing Systems
,
37
,

[7] Ghorbani, A., & Zou, J. (2019, May). Data shapley: Equitable valuation of data for machine learning. In
International conference on machine learning
(pp PMLR.

[8] Bae, J., Lin, W., Lorraine, J., & Grosse, R. B Training data attribution via approximate unrolling.
Advances in Neural Information Processing Systems
,
37
,

[9] Wang, J. T., Mittal, P., Song, D., & Jia, R. Data Shapley in One Training Run. In
The Thirteenth International Conference on Learning Representations
., 2025

[10] Pruthi, G., Liu, F., Kale, S., & Sundararajan, M Estimating training data influence by tracing gradient descent.
Advances in Neural Information Processing Systems
,
33
,

En tant qu'employeur, Ekimetrics offre à tous les mêmes opportunités d'accès à l'emploi sans distinction de genre, ethnicité, religion, orientation sexuelle, statut social, handicap et d'âge. Ekimetrics veille à développer un environnement de travail inclusif qui reflète la diversité dans ses équipes.
We may use artificial intelligence (AI) tools to support parts of the hiring process, such as reviewing applications, analyzing resumes, or assessing responses. These tools assist our recruitment team but do not replace human judgment. Final hiring decisions are ultimately made by humans. If you would like more information about how your data is processed, please contact us.



  • Paris, Île-de-France Ekimetrics Temps plein

    Ekimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l'optimisation de performance marketing, business et de la transition vers une performance plus durable.Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d'être de votre avenir...


  • Paris, Île-de-France Ekimetrics Temps plein

    Ekimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l'optimisation de performance marketing, business et de la transition vers une performance plus durable.   Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d'être de votre avenir...


  • Paris, Île-de-France Ekimetrics Temps plein

    Ekimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l'optimisation de performance marketing, business et de la transition vers une performance plus durable.Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d'être de votre avenir...


  • Paris, Île-de-France Ekimetrics Temps plein

    Ekimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l'optimisation de performance marketing, business et de la transition vers une performance plus durable.   Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d'être de votre avenir...

  • Stage Data Science, AI

    il y a 2 semaines


    Paris, Île-de-France ODDO Temps plein

    ActivitéVotre QuotidienAu sein du Groupe ODDO BHF, vous serez rattaché à l'équipe Data Excellence, équipe transverse en charge de la stratégie et des projets de transformation data. Vos principales missions sont les suivantes :Travailler et participer au développement d'algorithmes, comme par exemple de détection d'anomalies, de fraudes, ou...


  • Paris, Île-de-France Ekimetrics Temps plein

    Ekimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l'optimisation de performance marketing, business et de la transition vers une performance plus durable.Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d'être de votre avenir...

  • data science intern

    il y a 1 jour


    Paris, Île-de-France STATION F Temps plein

    AboutQantev is an AI company that helps health insurers deliver better healthcare to their members.They do that by leveraging insurers' historical health claims data and by applying Machine Learning techniques and Generative AI to predict patient journeys.They are backed by top investors and industry leaders, and have customers all across the world (Europe,...


  • Paris, Île-de-France Havas Data Business Intelligence Temps plein

    Dans le cadre de son hyper croissance, HAVAS DBi, l'agence conseil en data marketing du Groupe Havas, recherche un Data Science Director pour piloter et incarner son offre Data Science & IA.Ce rôle stratégique s'adresse à un profil senior, issu de la data science appliquée au marketing, souhaitant évoluer vers un poste de direction, combinant expertise...

  • Stage Machine Learning

    il y a 2 semaines


    Paris, Île-de-France La Javaness Temps plein

    Descriptif du posteIntégré(e) à notre Lab Data composé d'une vingtaine d'experts en Machine Learning, tes activités s'orienteront autour de plusieurs grands axes :Réaliser des missions avec de réelles données clients, où tu pourras très vite gagner en responsabilité Effectuer un travail de R&D autour de l'état de l'art technologique et...


  • Paris, Île-de-France Ekimetrics Temps plein

    Ekimetrics est un leader mondial de l'efficacité marketing et commerciale et des solutions d'IA à l'échelle. Depuis 2006, nous aidons les entreprises à optimiser leur marketing et leurs opérations en combinant IA avec expertise business et technologique dans 4 domaines : Marketing & commercial effectiveness, Customer analytics, Operational excellence,...