STAGIAIRE DATA SCIENTIST F/H
il y a 2 semaines
Informations générales
Structure hiérarchique
Malakoff Humanis est un groupe de protection sociale paritaire, mutualiste et à but non lucratif.
L'ensemble de nos bénéfices est donc réinvesti au profit de nos clients, en services, en accompagnement social ou pour soutenir des causes d'intérêt général que nous défendons.
L'innovation est depuis toujours au cœur de notre action.
Fier d'avoir obtenu le Label Alliance, notre Groupe porte une attention particulière à la diversité et s'engage à soutenir les personnes en situation de handicap. Chez Malakoff Humanis, nous sommes convaincus que notre force est la somme de toutes nos différences.
Le process de recrutement :
Postulez dès maintenant Notre équipe de recrutement s'engage à vous répondre dans un délai de 3 semaines.
Vos prochaines étapes :
1.Entretien RH si votre profil correspond aux compétences recherchées
2.Entretien avec votre futur manager
3.En cas de succès, onboarding digitalisé et personnalisé
Société
ASSOCIATION DE MOYENS ASSURANCE DE PERSONNES
Métier
DATA - DATA SCIENTIST
Intitulé du poste
STAGIAIRE DATA SCIENTIST F/H - Deep learning et IA documentaire
Contrat
Stage
Durée du contrat
6 Mois
Finalité du poste
Au sein de la direction Innovation Data et Digital (120 personnes, incubateur / accélérateur des projets pour tout le groupe Malakoff Humanis). Vous intégrerez l'équipe IA Documentaire en charge de développer des solutions IA autour du traitement automatique de documents numériques.
Malakoff Humanis reçoit de très grands volumes de documents de la part de ces assurés par exemple lors des affiliations ou pour des demandes de remboursement. Ces documents sont de formats et de natures très différents (image, pdf, word ; facture, devis, pièce d'identité). Ces documents ne sont pas exploitables directement car l'information présente dans ces derniers n'est pas structurée. Il convient donc d'utiliser des systèmes de parsing tels que les OCR pour détecter et extraire leurs contenus. Malheureusement ces systèmes sont très dépendants de la qualité de l'image (image retourné, présence de bruit, mauvais éclairage) et de leur contenu (manuscrit, tapuscrit, présence de tableau, langue du texte).
Notre ambition : développer de nouvelles approches d'extraction d'information en se passant d'OCR et en se basant sur des méthodes de Deep Learning tels que les CNN ou les Transformers. Dans cette optique, l'objectif de ce stage sera de développer d'améliorer les solutions déjà existantes pour traiter efficacement les documents numériques que reçoit Malakoff Humanis. Nous avons déjà des réalisations sur ce sujet et les résultats sont prometteurs. Ils ne vont pas sans nouveaux défis et nous vous
Missions
Au sein du département Data Science et IA, vous rejoignez l'équipe produit IA Documentaire, avec quatre Data Scientists et un Product Manager. Vous interviendrez à différents niveaux du projet :
· Faire une revue de l'état de l'art et des modèles les plus performants pour le Document Understanding (Dit, LayoutLM, Donut)
· Prendre en main la plateforme dataiku et les outils utilisés en interne pour le développement des projets.
· Participer au développement de dataset de références et de vérités terrain (synthétique et/ou réel) qui seront utilisés pour comparer les résultats des différentes approches.
· Pour la construction du dataset, il existe différentes stratégies comme l'utilisation de modèle de génération de données synthétiques (eg Stable diffusion pour les images) ou la génération de texte avec les modèles de langages eg ChatGPT).
· Prendre en main les modèles sélectionnés, calibrer sur le dataset en explorant différentes stratégies de fine tuning.
· Optimiser le meilleur modèle en fonction des indicateurs de performances retenus selon les cas d'usages (temps d'exécution, mémoire occupée, etc).
Profil recherché
Nous recherchons une personne capable de développer de nouvelles solutions en s'inspirant de méthodes existantes ou qui imaginera de nouveaux algorithmes adaptés.
Vous préparez un bac+5 (ingénieur, master) en vision par ordinateur, machine learning, traitement du signal ou mathématiques appliquées. Vous avez une connaissance minimale de frameworks du domaine (OpenCV, Scikit-Learn, TensorFlow, PyTorch, Keras, ...).
Vous développez vos propres scripts en autonomie (idéalement Python). Nous utilisons Dataiku pour le prototypage et la mise en production des premières versions des produits. Nous travaillons en mode agile. Vous êtes créatif et vous souhaitez travailler sur un des défis du moment en machine learning.
Vous êtes curieux, vous avez envie d'apprendre. Vous avez du plaisir à utiliser des algos pour tester vos idées. Vous n'avez pas peur d'essayer et vous êtes toujours à la recherche du bon équilibre entre rigueur et exploration. Vous êtes autonome et vous pensez que la partie est plus belle quand on joue avec les autres.
Localisation du poste
Ile-de-France, Paris (75)
Adresse
Paris (13ème)
Spécialisation
Statistiques
-
STAGIAIRE DATA SCIENTIST F/H
il y a 1 semaine
Paris 13 Gobelins, Île-de-France Malakoff Humanis Temps pleinInformations générales Structure hiérarchique Malakoff Humanis est un groupe de protection sociale paritaire, mutualiste et à but non lucratif.L'ensemble de nos bénéfices est donc réinvesti au profit de nos clients, en services, en accompagnement social ou pour soutenir des causes d'intérêt général que nous défendons.L'innovation est depuis...
-
Data Scientist F/H
il y a 3 jours
Paris, Île-de-France un emploi de Data Scientist FH Temps pleinData scientist F/H (Stage de 6 mois)Faire de la Data Science dans la musique, c'est analyser des millions d'écoutes quotidiennes, comprendre comment naissent les hits, comment évoluent les goûts et comment les artistes rencontrent leur public.Sony Music Entertainment France, un des leaders du secteur de la production, de la promotion et de la distribution...
-
biology data scientist i
il y a 4 jours
Paris, Île-de-France STATION F Temps pleinAboutAt WhiteLab Genomics, we believe that every patient deserves access to life-saving treatments. We won't rest until that belief becomes a reality.Driven by our commitment to transforming the future of healthcare, we've earned our place among the top innovators, includingY Combinator, French Tech 2030,andFuture 40 by Station F. We've also been recognized...
-
Consultant Data Scientist
il y a 4 jours
Paris, Île-de-France JICAP Performance Temps pleinStage (de mars à juillet 2026)Fondé en 2016, JICAP Performance est un cabinet de conseil spécialisé dans l'amélioration de la performance achats et la transformation des fonctions achats.Nous vous proposons de nous rejoindre en tant que stagiaire avec un quotidien et une feuille de route comparable à un Consultant Data ScientistEn rejoignant...
-
Data Scientist
il y a 1 jour
Paris, Île-de-France AP-HP Temps plein1. CONTEXTE ET SPÉCIFICITÉSL'URC (Unité de Recherche Clinique) de l'hôpital européen Georges-Pompidou (HEGP) est en charge de l'organisation et la mise en œuvre de la recherche hospitalière pour les sites HEGP, Corentin-Celton et Vaugirard. Elle est rattachée à la DRCI (Direction de la Recherche Clinique et de l'Innovation) située à l'Hôpital...
-
data scientist
il y a 4 jours
Paris, Île-de-France STATION F Temps pleinÀ proposPikkopay ambitionne de transformer le paiement en magasin. Notre solution est déjà adoptée par des enseignes majeures telles que Carrefour, Intermarché et Supermarchés Match, et soutenue par des investisseurs de renom. Classée parmi les 100 meilleures startups où investir en 2025, Pikkopay accélère son développement dans le Grand Est et...
-
energy data scientist
il y a 4 jours
Paris, Île-de-France STATION F Temps pleinÀ proposChez , Notre Mission Est SimpleAccélérer la transition énergétique en aidant les entreprises des énergies renouvelables en Europe à développer leur activité grâce à notre solution digitale qui centralise l'ensemble des étapes de vente des équipements énergétiques (panneau photovoltaïque, borne de recharge, pompe à chaleur etc.) dans...
-
Stage Data Scientist
il y a 2 semaines
Paris, Île-de-France un emploi de Stage Data Scientist chez Mirakl Temps pleinAbout MiraklMirakl is the leading provider of eCommerce software solutions. Mirakl's suite of solutions provides enterprises with a transformative way to drive significant growth and efficiency in their online business. Since 2012, Mirakl has been pioneering the platform economy, empowering retail and b2b enterprises with the most advanced, secure and...
-
Stage Data Scientist
il y a 2 semaines
Paris, Île-de-France un emploi de Stage Data Scientist chez Mirakl Temps pleinAbout MiraklMirakl is the leading provider of eCommerce software solutions. Mirakl's suite of solutions provides enterprises with a transformative way to drive significant growth and efficiency in their online business. Since 2012, Mirakl has been pioneering the platform economy, empowering retail and b2b enterprises with the most advanced, secure and...
-
Data Scientist NLP/LLM Engineer confirmé(e)
il y a 5 jours
Paris, Île-de-France Mp Data Temps pleinESN spécialisée Data & IA pour les environnements industriels. Pour l'un de nos clients, nous recherchons un LLM Engineer chargé d'industrialiser les POC GenAI développés par les équipes Data Science et de déployer des solutions robustes et scalables en production.Développement et Industrialisation des POC LLM / GenAI.Conception et optimisation de...