Stage de fin d'études – Ingénieur·e Data

il y a 3 jours


Caen, Normandie, France Emerit Science Temps plein

À propos d'Emerit Science

Chez Emerit Science, nous mettons l'intelligence artificielle au service de la recherche scientifique, de l'industrie et des institutions académiques.

Notre mission : rendre la connaissance scientifique massive, fiable et exploitable, en concevant des assistants conversationnels spécialisés s'appuyant sur des millions de références issues de données ouvertes (publications, brevets, données omiques, protocoles expérimentaux…).

Nous développons des technologies IA souveraines, exécutées localement, orientées performance, sobriété et reproductibilité.

Rejoindre Emerit Science, c'est intégrer une aventure entrepreneuriale à fort potentiel, où chaque contribution a un impact direct sur des produits réellement utilisés, dans un environnement exigeant, collaboratif et bienveillant.

Contexte du stage

Dans le cadre de notre roadmap technologique, nous construisons une infrastructure IA complète capable de :

  • traiter plusieurs centaines de téraoctets de données ouvertes,
  • enrichir ces données via des traitements IA propriétaires,
  • indexer et interroger des centaines de millions de vecteurs multimodaux (texte, images, données biologiques),
  • exploiter des moteurs de recherche vectorielle et des modèles de langage (LLM) exécutés en local.

L'objectif : bâtir un socle IA souverain, scalable et économiquement maîtrisé, au cœur de nos produits.

Ce stage est au centre de cette architecture.

Missions principales

Tu interviendras sur l'ensemble de la chaîne Data & IA, de l'acquisition au déploiement :

Traitement et ingestion de données massives

  • Conception et développement de pipelines d'acquisition de données scientifiques à grande échelle

(PubMed, PMC, brevets, GEO / GSE, protocoles expérimentaux, etc.).

  • Nettoyage, structuration, contrôle qualité et visualisation de données hétérogènes (structurées / non structurées).
  • Automatisation des traitements de vectorisation multimodale

(texte, images, métadonnées, protocoles).

IA appliquée & RAG

  • Utilisation de LLM pour l'extraction d'informations, l'enrichissement sémantique et l'analyse de corpus.
  • Contribution aux choix d'architectures RAG et aux paramétrages adaptés aux cas d'usage.
  • Optimisation des pipelines pour maîtriser coûts, performance et qualité.

Agents et outils IA

  • Conception d'architectures d'agents spécialisés métier.
  • Développement et intégration d'outils via API.
  • Mise en place de serveurs MCP spécifiques.
  • Tests, industrialisation et déploiement en production.

Documentation & reproductibilité

  • Documentation complète des travaux réalisés.
  • Garantie de la traçabilité, de la reproductibilité et de la maintenabilité des pipelines.

Compétences recherchées

  • Solide base en programmation Python et scripting (Shell/Bash).
  • Intérêt marqué pour les systèmes Data, l'IA appliquée et les architectures distribuées.
  • Connaissances ou curiosité pour :
  • LLM, embeddings, RAG
  • bases de données et moteurs de recherche
  • cloud, GPU, HPC

Les plus :

  • Expérience avec des données volumineuses ou scientifiques.
  • Sensibilité aux enjeux de souveraineté, de performance et de sobriété numérique.
  • Autonomie, rigueur et goût pour l'expérimentation.

Profil recherché

  • Étudiant·e en école d'ingénieur ou master (informatique, data, IA, systèmes, cloud, bio-informatique).
  • Stage de fin d'études (BAC+5).
  • Forte appétence pour la technique, les architectures complexes et la montée en compétence rapide.
  • Envie de s'investir dans un projet deep-tech avec possibilité d'embauche.

Ce que nous offrons

  • Un projet concret à fort impact, utilisé en production.
  • Un environnement technique de pointe :
  • Linux, vLLM, OpenSearch
  • GPU RTX / A100 / H100
  • infrastructures HPC
  • cloud souverain (AWS, OVH)
  • Une grande liberté d'expérimentation, d'automatisation et de conception.
  • Un accompagnement technique de haut niveau.
  • La possibilité de concevoir et opérer ton propre cluster IA.

Stack technique

  • Langages : Python, Shell/Bash, R, SQL
  • Outils : Bitbucket, Jira, Confluence
  • Data & IA : OpenSearch, MongoDB, Dataiku, Notebooks
  • Infrastructure : AWS, OVH, High Performance Computing (HPC)

Type d'emploi : Stage

Durée du contrat : 6 mois

Rémunération : 660,00€ par mois

Avantages :

  • Flextime
  • Travail à domicile occasionnel

Lieu du poste : Télétravail hybride Caen)


  • STAGE DE FIN D'ÉTUDES

    il y a 2 semaines


    Caen, Normandie, France NGE Temps plein

    Informations générales Entité de rattachement Participer à la construction et à la rénovation d'infrastructures au service des territoires. Rejoindre un Groupe en plein développement en France et à l'international (4 milliards d'euros de chiffre d'affaires). Intégrer une entreprise composée de près de femmes et hommes réunis autour de 3...


  • Caen, Normandie, France Université de Caen Normandie Temps plein

    À propos de nousL'université de Caen Normandie (UNICAEN) est un acteur majeur et un moteur de développement de l'enseignement supérieur et de la recherche en Normandie. UNICAEN est membre de la communauté d'universités et d'établissements Normandie Université. Pluridisciplinaire, elle accueille plus de étudiants au sein de 12 composantes (UFR,...

  • Stage Contrôle de gestion

    il y a 24 heures


    Caen, Normandie, France ENSICAEN Temps plein

    À propos de nousL'ENSICAEN est une école nationale publique d'ingénieurs disposant des responsabilités aux compétences élargies et un centre de recherche reconnu à l'échelle nationale. Elle héberge 6 unités de recherche, accueille près de 900 étudiants et gère environ 200 personnels.Notre établissement est fortement engagé dans une démarche...

  • Data Engineer Senior

    il y a 2 semaines


    Caen, Normandie, France JAKALA Temps plein

    JAKALAest une société leader européenne dans les métiers du conseil de la transformation data, IA et stratégies marketing.Fondée en Italie en 2000 par Matteo de Brabant, JAKALA se positionne dès ses débuts comme pionnière en combinant marketing et technologie pour révolutionner les domaines de l'engagement, de la fidélisation et des incentives...

  • Ingénieur d'études ESO H/F

    il y a 21 heures


    Caen, Normandie, France Université de Caen Normandie Temps plein

    À propos de nousL'université de Caen Normandie (UNICAEN) est un acteur majeur et un moteur de développement de l'enseignement supérieur et de la recherche en Normandie. UNICAEN est membre de la communauté d'universités et d'établissements Normandie Université.Pluridisciplinaire, elle accueille plus de étudiants au sein de 12 composantes (UFR,...

  • Stage marketing digital

    il y a 18 heures


    Caen, Normandie, France Agrial Temps plein

    Nos offres d'emploiStage marketing digital (F/H) – SAINT LORejoindre Agrial, c'est intégrer une coopérative d'agriculteurs, polyvalente, implantée en France et à l'international. C'est vivre une expérience humaine enrichissante et passionnante, au service du « bien manger » et du « plus durable ». C'est se sentir utile et donner un sens nouveau à...


  • Caen, Normandie, France Agence de Caen Temps plein

    L'entreprise NORMAN RECRUTEMENT 14 — Votre partenaire emploi engagé dans le Calvados Depuis plusieurs années, nous accompagnons nos talents avec bienveillance, réactivité et engagement. Formations, suivi personnalisé, postes adaptés : chez nous, c'est votre projet qui compte.Chez NORMAN RECRUTEMENT 14, ce sont vos talents qui font la différence....


  • Caen, Normandie, France I3P Temps plein

    Un poste stratégique pour ceux qui veulent piloter, structurer et avoir un impact technique réel. Basse Normandie – mobilité terrain requise | Travail hybride CDI – Poste à forte responsabilité Bureau d'études indépendant – Gestion des projets ENEDIS Pourquoi ce poste existeI3P poursuit son développement sur les marchés d'études ENEDIS en...


  • Caen, Normandie, France I3P Ingénierie et Projets Temps plein

    Un poste stratégique pour ceux qui veulent piloter, structurer et avoir un impact technique réel. Basse Normandie – mobilité terrain requise | Travail hybride CDI – Poste à forte responsabilité Bureau d'études indépendant – Gestion des projets ENEDIS Pourquoi ce poste existeI3P poursuit son développement sur lesmarchés d'études ENEDISen...


  • Caen, Normandie, France Stellantis Temps plein

    Job ID: Career Area: ManufacturingJob Category:Location: Caen, Calvados, FRDate Posted: November 17, 2025Dans le cadre des normes ISO, nous devons identifier formellement les besoins en compétences aux postes de travail ayant un impact sur la qualité, la sécurité ou la conformité. Nous proposons de mettre à jour ce processus dans nos ateliers,...