Data Scientist, spécialiste de la fouille de données H/F

il y a 2 jours


Paris, Île-de-France IRD Temps plein


Informations générales

Date limite de candidature

22/02/2026


Type de recrutement

Mobilité interne/externe


Catégorie

Catégorie A (cadre)


Poste ouvert aux :

Titulaires


Domaine / métier

SCIENCE - BAP E : Informatique (scientifique), Statistiques et Calcul scientifique - E2D46 - Ingénieur-e statisticien-ne


Etat du poste

Vacant


CORPS

Ingénieur d'Etudes


BAP

E


Intitulé du poste

Data Scientist, spécialiste de la fouille de données H/F


Descriptif de l'employeur

L'IRD est un organisme de recherche public français pluridisciplinaire qui, depuis près de 80 ans, s'engage dans des partenariats équitables avec les pays du Sud et dans les Outre-mer français.

Acteur de l'agenda international pour le développement, ses priorités s'inscrivent dans la mise en œuvre des Objectifs de développement durable (ODD).

Ensemble, scientifiques et partenaires de l'Institut proposent des solutions concrètes pour répondre aux défis globaux auxquels les sociétés et la planète font face. Cette relation gagnante-gagnante fait de la science et de l'innovation des leviers majeurs du développement.

L'Institut est placé sous la double tutelle du ministère chargé de l'Enseignement supérieur et de la Recherche et de celui chargé de l'Europe et des Affaires Étrangères.


Descriptif de la structure

Rattaché au pôle science de l'IRD, la Mission Science Ouverte (MSO) coordonne et met en œuvre la feuille de route de l'IRD pour une science ouverte et partagée vers tous les scientifiques de l'institut et également vers leurs partenariats Sud. Déployée dans les délégations Occitanie (Montpellier), Île-de-France (Aubervilliers) et Sud-Est (Marseille), elle assure la gestion du fonds documentaire et patrimonial de l'institut, offre des services documentaires aux scientifiques et anime un réseau de centres de documentation à l'international. S'appuyant sur les dispositifs numériques de science ouverte, la MSO administre et accompagne les scientifiques dans l'utilisation de ces dispositifs pour assurer le partage et l'ouverture de leur production, notamment des données de recherche. Elle anime le réseau de référents données et développe des communautés de pratiques numériques en informatique scientifique afin de mutualiser les connaissances, outils et retours d'expérience au sein de l'Institut et auprès de ses partenaires.

Vous serez basé à Condorcet ou à Montpellier et vous intégrerez l'équipe EcosFAIR (Écosystème pour des productions scientifiques FAIR) de la MSO. Elle est composée de 7 ingénieurs et techniciens des métiers du numérique et des sciences de l'information. 


Une mission attractive

Sous la responsabilité de Caroline Doucouré, responsable de l'équipe « EcosFAIR » et en étroite relation avec la D-DUNI et la Groupe de travail Intelligence Artificielle de l'IRD, l'ingénieur ou l'ingénieure mettra en œuvre des méthodes et des outils de fouille de texte dans le but de valoriser le patrimoine documentaire de l'IRD. En coordination avec les ingénieurs de la science de l'information, il ou elle élaborera des prototypes de service pour répondre aux besoins des scientifiques, des partenaires et de la gouvernance. 

Les activités principales de l'ingénieur seront les suivantes : 

·       Organiser les corpus de documents dédiés pour les scientifiques, à partir du système d'information documentaire Horizon pleins textes

·       Mettre en place des protocoles et des méthodologies de créations automatisées des corpus pour répondre aux besoins des unités de recherche, des partenaires sud et de la gouvernance

·       Fouiller les informations dans les corpus de documents de la base Horizon

·       Mettre en œuvre l'apprentissage ou le fine-tuning (RAG) de modèles larges de langages (LLM) à partir de corpus de documents et de la base Horizon

·       Prototyper et tester les services auprès des scientifiques et de la gouvernance 

En lien avec l'équipe de gestion du patrimoine documentaire : 

·       Participation au maintien et enrichissement du fonds documentaire de l'IRD 

·       Participer à des communautés nationales et internationales de pratiques sur la fouille de texte dans les bibliothèques numériques

·       Participer aux développements des statistiques d'usage des documents numériques à l'IRD.

·       Participer à des réseaux métiers 


Conditions particulières d'exercice

L'IRD, au cours de votre parcours professionnel, vous accompagne dans le développement de vos compétences. 

L'institut met à votre disposition un panel d'outils tel que le parcours digital d'intégration, l'accès à la formation permanente, à la promotion et la mobilité.

L'IRD offre, en fonction des activités, la possibilité de télétravailler de 1 à 3 jours hebdomadaires. 

En rejoignant l'IRD, vous bénéficierez : 

·       De 32 jours de congés + 13 RTT (pour un temps plein à 38h30 hebdomadaire)

·       Tickets restaurants OU d'une restauration collective (en fonction du site) 

·       Souscription annuelle (facultative) à l'Association des Œuvres Sociales : prestations vacances-loisirs et sportives-culturelles

· Adhésion à la PSC (Protection Sociale Complémentaire)


Le profil que nous recherchons

Vous avez développé les compétences suivantes :

·       Compétences en programmation et bonne compréhension des structures de données,

·       Maîtrise des méthodes et outils de fouille de textes, et de traitement du langage naturel (NLP/TAL),

·       Maîtrise des méthodes d'apprentissage automatique et de l'analyse statistique,

·       Maîtrise de Linux

·       Connaissances des bases de données documentaires scientifiques

Vous faites preuve des qualités humaines suivantes :

·       Vous êtes rigoureux et savez organiser votre travail en autonomie.

·       Vous faites preuve de curiosité et vous avez de bonnes capacités d'adaptation.

·       Vous possédez un esprit d'analyse et de synthèse ainsi que des compétences rédactionnelles.

·       Vous disposez d'un bon relationnel.

·       Vous avez un goût prononcé pour le travail en équipe dans un environnement multiculturel.


Rémunération

Barème selon la réglementation


Localisation du poste

Europe, France


Ville d'affectation

Paris (Campus Condorcet) ou Montpellier

Informations complémentaires
Télétravail possible

Oui


Management

Non


Date de vacance de l'emploi

01/06/2026


Contact RH (mail)

  • Data Scientist F/H

    il y a 2 semaines


    Paris, Île-de-France un emploi de Data Scientist FH Temps plein

    Data scientist F/H (Stage de 6 mois)Faire de la Data Science dans la musique, c'est analyser des millions d'écoutes quotidiennes, comprendre comment naissent les hits, comment évoluent les goûts et comment les artistes rencontrent leur public.Sony Music Entertainment France, un des leaders du secteur de la production, de la promotion et de la distribution...

  • data scientist

    il y a 21 heures


    Paris, Île-de-France STATION F Temps plein

    À proposNotre parcours a commencé en 2019, au Lloyd's Lab, le principal accélérateur InsurTech de Londres, et à Station F, Paris, où notre équipe de data scientists, d'ingénieurs logiciels et de chefs de produit a développé les solutions révolutionnaires d'Allphins pour les réassureurs. Notre solution est une plateforme SaaS permettant aux...

  • Data Scientist H/F

    il y a 1 semaine


    Paris, Île-de-France Data sea Temps plein

    À propos du posteNous recherchons un(e) Data Scientist pour rejoindre notre équipe et participer activement à la valorisation de nos données. Votre rôle sera essentiel pour comprendre nos performances, anticiper les tendances et proposer des solutions basées sur la data.Vos responsabilitésExploiter et analyser de grands volumes de donnéesConstruire...

  • Data Scientist F/H

    il y a 2 semaines


    Paris, Île-de-France Groupe La Poste Temps plein

    Informations générales Branche / Entité Entité d'affectation : LA BANQUE POSTALE Référence Date limite de candidature /02/2026 Personne à contacter Manager : Piarrech CREPIN RRH : Ghania RAHALChargé de Recrutement : Mehdi AMZAL Intitulé du posteData Scientist F/H Nombre de postes à pourvoir1 Filière / MétierSYSTEME D INFORMATION -...

  • energy data scientist

    il y a 2 semaines


    Paris, Île-de-France STATION F Temps plein

    À proposChez , Notre Mission Est SimpleAccélérer la transition énergétique en aidant les entreprises des énergies renouvelables en Europe à développer leur activité grâce à notre solution digitale qui centralise l'ensemble des étapes de vente des équipements énergétiques (panneau photovoltaïque, borne de recharge, pompe à chaleur etc.) dans...

  • biology data scientist i

    il y a 2 semaines


    Paris, Île-de-France STATION F Temps plein

    AboutAt WhiteLab Genomics, we believe that every patient deserves access to life-saving treatments. We won't rest until that belief becomes a reality.Driven by our commitment to transforming the future of healthcare, we've earned our place among the top innovators, includingY Combinator, French Tech 2030,andFuture 40 by Station F. We've also been recognized...

  • Data Scientist

    il y a 2 semaines


    Paris, Île-de-France AP-HP Temps plein

    1. CONTEXTE ET SPÉCIFICITÉSL'URC (Unité de Recherche Clinique) de l'hôpital européen Georges-Pompidou (HEGP) est en charge de l'organisation et la mise en œuvre de la recherche hospitalière pour les sites HEGP, Corentin-Celton et Vaugirard. Elle est rattachée à la DRCI (Direction de la Recherche Clinique et de l'Innovation) située à l'Hôpital...

  • Data scientist

    il y a 1 semaine


    Paris, Île-de-France Choisir le Service Public Temps plein

    Informations générales Organisme de rattachement Siège de l'AP-HP   Référence APHP_ Date de début de diffusion /01/2026 Date de parution /01/2026 Domaine / MétierRecherche - Chercheuse / Chercheur Intitulé du poste Data scientist Description du poste La mission principale du data scientist dans les Unités de Recherche Clinique (URC) est...


  • Paris, Île-de-France Alternance Professionnelle Temps plein

    Entreprise :KaischoolType D'alternance :ApprentissageType De Contrat :CDDLieu :ParisDomaine D'activité :data scientistNiveau De Formation :Niveau Bac+3/4Date De Début :01/09/2024Description du PosteEn qualité d'alternant Data Scientist, vous intégrerez notre équipe de spécialistes en données. Vous serez encadré par nos Data Scientists seniors et...

  • Senior Data Scientist

    il y a 1 semaine


    Paris, Île-de-France DEAPDATA Temps plein

    DEAPDATA recherche un data Scientist Senior pour rejoindre son équipe data :En tant que Data Scientist Confirmé, vous serez responsable de l'analyse et de l'interprétation de données complexes pour aider l'entreprise à prendre des décisions éclairées. Vous travaillerez en étroite collaboration avec les équipes techniques et commerciales pour...