STAGIAIRE DATA SCIENTIST F/H

il y a 1 semaine


Paris Gobelins, Île-de-France Malakoff Humanis Temps plein


Informations générales

Structure hiérarchique

Malakoff Humanis est un groupe de protection sociale paritaire, mutualiste et à but non lucratif.

L'ensemble de nos bénéfices est donc réinvesti au profit de nos clients, en services, en accompagnement social ou pour soutenir des causes d'intérêt général que nous défendons.

L'innovation est depuis toujours au cœur de notre action.

Fier d'avoir obtenu le Label Alliance, notre Groupe porte une attention particulière à la diversité et s'engage à soutenir les personnes en situation de handicap. Chez Malakoff Humanis, nous sommes convaincus que notre force est la somme de toutes nos différences.

Le process de recrutement :

Postulez dès maintenant Notre équipe de recrutement s'engage à vous répondre dans un délai de 3 semaines.

Vos prochaines étapes :

1.Entretien RH si votre profil correspond aux compétences recherchées

2.Entretien avec votre futur manager

3.En cas de succès, onboarding digitalisé et personnalisé  

Critères candidat
Spécialisation

Statistiques


Métier

DATA - DATA SCIENTIST


Intitulé du poste

STAGIAIRE DATA SCIENTIST F/H - Deep learning et IA documentaire


Contrat

Stage


Durée du contrat

6 Mois


Finalité du poste

Au sein de la direction Innovation Data et Digital (120 personnes, incubateur / accélérateur des projets pour tout le groupe Malakoff Humanis). Vous intégrerez l'équipe IA Documentaire en charge de développer des solutions IA autour du traitement automatique de documents numériques.
Malakoff Humanis reçoit de très grands volumes de documents de la part de ces assurés par exemple lors des affiliations ou pour des demandes de remboursement. Ces documents sont de formats et de natures très différents (image, pdf, word ; facture, devis, pièce d'identité). Ces documents ne sont pas exploitables directement car l'information présente dans ces derniers n'est pas structurée. Il convient donc d'utiliser des systèmes de parsing tels que les OCR pour détecter et extraire leurs contenus. Malheureusement ces systèmes sont très dépendants de la qualité de l'image (image retourné, présence de bruit, mauvais éclairage) et de leur contenu (manuscrit, tapuscrit, présence de tableau, langue du texte).
Notre ambition : développer de nouvelles approches d'extraction d'information en se passant d'OCR et en se basant sur des méthodes de Deep Learning tels que les CNN ou les Transformers. Dans cette optique, l'objectif de ce stage sera de développer d'améliorer les solutions déjà existantes pour traiter efficacement les documents numériques que reçoit Malakoff Humanis. Nous avons déjà des réalisations sur ce sujet et les résultats sont prometteurs. Ils ne vont pas sans nouveaux défis et nous vous


Missions

Au sein du département Data Science et IA, vous rejoignez l'équipe produit IA Documentaire, avec quatre Data Scientists et un Product Manager. Vous interviendrez à différents niveaux du projet :

·       Faire une revue de l'état de l'art et des modèles les plus performants pour le Document Understanding (Dit, LayoutLM, Donut)

·       Prendre en main la plateforme dataiku et les outils utilisés en interne pour le développement des projets.

·       Participer au développement de dataset de références et de vérités terrain (synthétique et/ou réel) qui seront utilisés pour comparer les résultats des différentes approches.

·       Pour la construction du dataset, il existe différentes stratégies comme l'utilisation de modèle de génération de données synthétiques (eg Stable diffusion pour les images) ou la génération de texte avec les modèles de langages eg ChatGPT).

·       Prendre en main les modèles sélectionnés, calibrer sur le dataset en explorant différentes stratégies de fine tuning.

·       Optimiser le meilleur modèle en fonction des indicateurs de performances retenus selon les cas d'usages (temps d'exécution, mémoire occupée, etc).


Profil recherché

Nous recherchons une personne capable de développer de nouvelles solutions en s'inspirant de méthodes existantes ou qui imaginera de nouveaux algorithmes adaptés.

Vous préparez un bac+5 (ingénieur, master) en vision par ordinateur, machine learning, traitement du signal ou mathématiques appliquées. Vous avez une connaissance minimale de frameworks du domaine (OpenCV, Scikit-Learn, TensorFlow, PyTorch, Keras, ...).

Vous développez vos propres scripts en autonomie (idéalement Python). Nous utilisons Dataiku pour le prototypage et la mise en production des premières versions des produits. Nous travaillons en mode agile. Vous êtes créatif et vous souhaitez travailler sur un des défis du moment en machine learning.

Vous êtes curieux, vous avez envie d'apprendre. Vous avez du plaisir à utiliser des algos pour tester vos idées. Vous n'avez pas peur d'essayer et vous êtes toujours à la recherche du bon équilibre entre rigueur et exploration. Vous êtes autonome et vous pensez que la partie est plus belle quand on joue avec les autres.


Société

ASSOCIATION DE MOYENS ASSURANCE DE PERSONNES


Localisation du poste

Ile-de-France, Paris (75)


Adresse


Paris (13ème)


  • Data Scientist

    Il y a 29 minutes


    Paris, Île-de-France BlaBlaCar Temps plein

    About BlaBlaCar BlaBlaCar is the world's leading community-based travel app enabling 27 million members a year to carpool or travel by bus in 21 countries. Our team of 800 employees counts over 50 nationalities and is spread across our 5 global offices, 30% working fully remotely. Your mission We're seeking a passionate Data Scientist to join our data...

  • Data Scientist

    Il y a 28 minutes


    Paris, Île-de-France Qube Research & Technologies Temps plein

    Qube Research & Technologies (QRT) is a global quantitative and systematic investment manager, operating in all liquid asset classes across the world. We are a technology and data driven group implementing a scientific approach to investing. Combining data, research, technology and trading expertise has shaped QRT's collaborative mindset which enables us to...

  • Stage - Data Scientist H/F

    Il y a 30 minutes


    Paris 15 Vaugirard, Île-de-France MEESCHAERT Temps plein

    DescriptionMandarine Gestion, l'une des principales sociétés de gestion françaises, recherche un stagiaire H/F au sein de l'équipe Data.Mandarine Gestion est une des principales sociétés de gestion françaises. Sa mission est de proposer à ses clients des solutions d'investissement innovantes qui contribuent au financement responsable et durable de...

  • Data Scientist F/H

    il y a 4 jours


    Paris, Île-de-France Choisir le Service Public Temps plein

    Informations générales Organisme de rattachement Siège de l'AP-HP   Référence APHP_ Date de début de diffusion /01/2026 Date de parution /01/2026 Nature de l'emploiEmploi ouvert aux titulaires et aux contractuels Domaine / MétierNumérique - Spécialiste méthode et outils / qualité / sécurité Intitulé du posteData Scientist...

  • Data Scientist

    Il y a 29 minutes


    Paris, Île-de-France Dayuse Temps plein

    ÉVOLUEZ AVEC NOUSImaginez un monde où les hôtels ne sont plus seulement des lieux pour dormir, mais de véritables espaces de vie, accessibles quelques heures en journée. C'est cette vision que nous portons chez Dayuse. Nous rejoindre, c'est faire partie d'une équipe internationale, curieuse et passionnée, où chacun peut apporter ses idées, avoir un...


  • Paris, Île-de-France STATION F Temps plein

    AboutGreenly est une entreprise Tech certifiée B-corp fondée en 2019 par Alexis, Matthieu et Arnaud. Elle permet à chaque entreprise de suivre facilement son empreinte carbone, pour participer à la lutte contre le changement climatique. Plus de 2000 entreprises ont déjà fait confiance à Greenly pour réduire efficacement leurs émissions de gaz à...


  • Paris, Île-de-France STATION F Temps plein

    AboutGreenly est une entreprise Tech certifiée B-corp fondée en 2019 par Alexis, Matthieu et Arnaud. Elle permet à chaque entreprise de suivre facilement son empreinte carbone, pour participer à la lutte contre le changement climatique. Plus de 2000 entreprises ont déjà fait confiance à Greenly pour réduire efficacement leurs émissions de gaz à...

  • Data Scientist Intern

    il y a 1 semaine


    Paris, Île-de-France Moody's Corporation Temps plein

    At Moody's, we unite the brightest minds to turn today's risks into tomorrow's opportunities. We do this by striving to create an inclusive environment where everyone feels welcome to be who they are—with the freedom to exchange ideas, think innovatively, and listen to each other and customers in meaningful ways. Moody's is transforming how the world sees...

  • Lead Data Scientist

    il y a 4 jours


    Paris, Île-de-France RELX Temps plein

    Job Description In French (English Version At The Bottom)Lead Data ScientistLocalisation prioritaire : Paris, FranceLexisNexis Risk Solutions est un leader mondial dans le domaine de la technologie et de l'analyse de données, s'attaquant à certains des défis les plus complexes et les plus significatifs au monde — de la lutte contre la cybercriminalité...

  • Data Scientist

    Il y a 29 minutes


    Paris, Île-de-France Mistral AI Temps plein

    Role summaryWe are seeking skilled and motivated Data Scientists to join our team in Paris. You will work at the intersection of product, research, and engineering. You will analyze user behavior, optimize product performance, and design data-driven features that enhance our AI product suite.This role is ideal for someone who thrives in a dynamic...