Stage de fin d'études – Ingénieur·e Data
il y a 3 jours
À propos d'Emerit Science
Chez Emerit Science, nous mettons l'intelligence artificielle au service de la recherche scientifique, de l'industrie et des institutions académiques.
Notre mission : rendre la connaissance scientifique massive, fiable et exploitable, en concevant des assistants conversationnels spécialisés s'appuyant sur des millions de références issues de données ouvertes (publications, brevets, données omiques, protocoles expérimentaux…).
Nous développons des technologies IA souveraines, exécutées localement, orientées performance, sobriété et reproductibilité.
Rejoindre Emerit Science, c'est intégrer une aventure entrepreneuriale à fort potentiel, où chaque contribution a un impact direct sur des produits réellement utilisés, dans un environnement exigeant, collaboratif et bienveillant.
Contexte du stage
Dans le cadre de notre roadmap technologique, nous construisons une infrastructure IA complète capable de :
- traiter plusieurs centaines de téraoctets de données ouvertes,
- enrichir ces données via des traitements IA propriétaires,
- indexer et interroger des centaines de millions de vecteurs multimodaux (texte, images, données biologiques),
- exploiter des moteurs de recherche vectorielle et des modèles de langage (LLM) exécutés en local.
L'objectif : bâtir un socle IA souverain, scalable et économiquement maîtrisé, au cœur de nos produits.
Ce stage est au centre de cette architecture.
Missions principales
Tu interviendras sur l'ensemble de la chaîne Data & IA, de l'acquisition au déploiement :
Traitement et ingestion de données massives
- Conception et développement de pipelines d'acquisition de données scientifiques à grande échelle
(PubMed, PMC, brevets, GEO / GSE, protocoles expérimentaux, etc.).
- Nettoyage, structuration, contrôle qualité et visualisation de données hétérogènes (structurées / non structurées).
- Automatisation des traitements de vectorisation multimodale
(texte, images, métadonnées, protocoles).
IA appliquée & RAG
- Utilisation de LLM pour l'extraction d'informations, l'enrichissement sémantique et l'analyse de corpus.
- Contribution aux choix d'architectures RAG et aux paramétrages adaptés aux cas d'usage.
- Optimisation des pipelines pour maîtriser coûts, performance et qualité.
Agents et outils IA
- Conception d'architectures d'agents spécialisés métier.
- Développement et intégration d'outils via API.
- Mise en place de serveurs MCP spécifiques.
- Tests, industrialisation et déploiement en production.
Documentation & reproductibilité
- Documentation complète des travaux réalisés.
- Garantie de la traçabilité, de la reproductibilité et de la maintenabilité des pipelines.
Compétences recherchées
- Solide base en programmation Python et scripting (Shell/Bash).
- Intérêt marqué pour les systèmes Data, l'IA appliquée et les architectures distribuées.
- Connaissances ou curiosité pour :
- LLM, embeddings, RAG
- bases de données et moteurs de recherche
- cloud, GPU, HPC
Les plus :
- Expérience avec des données volumineuses ou scientifiques.
- Sensibilité aux enjeux de souveraineté, de performance et de sobriété numérique.
- Autonomie, rigueur et goût pour l'expérimentation.
Profil recherché
- Étudiant·e en école d'ingénieur ou master (informatique, data, IA, systèmes, cloud, bio-informatique).
- Stage de fin d'études (BAC+5).
- Forte appétence pour la technique, les architectures complexes et la montée en compétence rapide.
- Envie de s'investir dans un projet deep-tech avec possibilité d'embauche.
Ce que nous offrons
- Un projet concret à fort impact, utilisé en production.
- Un environnement technique de pointe :
- Linux, vLLM, OpenSearch
- GPU RTX / A100 / H100
- infrastructures HPC
- cloud souverain (AWS, OVH)
- Une grande liberté d'expérimentation, d'automatisation et de conception.
- Un accompagnement technique de haut niveau.
- La possibilité de concevoir et opérer ton propre cluster IA.
Stack technique
- Langages : Python, Shell/Bash, R, SQL
- Outils : Bitbucket, Jira, Confluence
- Data & IA : OpenSearch, MongoDB, Dataiku, Notebooks
- Infrastructure : AWS, OVH, High Performance Computing (HPC)
Type d'emploi : Stage
Durée du contrat : 6 mois
Rémunération : 660,00€ par mois
Avantages :
- Flextime
- Travail à domicile occasionnel
Lieu du poste : Télétravail hybride Caen)
-
STAGE DE FIN D'ÉTUDES
il y a 2 semaines
Caen, Normandie, France NGE Temps pleinInformations générales Entité de rattachement Participer à la construction et à la rénovation d'infrastructures au service des territoires. Rejoindre un Groupe en plein développement en France et à l'international (4 milliards d'euros de chiffre d'affaires). Intégrer une entreprise composée de près de femmes et hommes réunis autour de 3...
-
Caen, Normandie, France Université de Caen Normandie Temps pleinÀ propos de nousL'université de Caen Normandie (UNICAEN) est un acteur majeur et un moteur de développement de l'enseignement supérieur et de la recherche en Normandie. UNICAEN est membre de la communauté d'universités et d'établissements Normandie Université. Pluridisciplinaire, elle accueille plus de étudiants au sein de 12 composantes (UFR,...
-
Stage Contrôle de gestion
il y a 24 heures
Caen, Normandie, France ENSICAEN Temps pleinÀ propos de nousL'ENSICAEN est une école nationale publique d'ingénieurs disposant des responsabilités aux compétences élargies et un centre de recherche reconnu à l'échelle nationale. Elle héberge 6 unités de recherche, accueille près de 900 étudiants et gère environ 200 personnels.Notre établissement est fortement engagé dans une démarche...
-
Data Engineer Senior
il y a 2 semaines
Caen, Normandie, France JAKALA Temps pleinJAKALAest une société leader européenne dans les métiers du conseil de la transformation data, IA et stratégies marketing.Fondée en Italie en 2000 par Matteo de Brabant, JAKALA se positionne dès ses débuts comme pionnière en combinant marketing et technologie pour révolutionner les domaines de l'engagement, de la fidélisation et des incentives...
-
Ingénieur d'études ESO H/F
il y a 21 heures
Caen, Normandie, France Université de Caen Normandie Temps pleinÀ propos de nousL'université de Caen Normandie (UNICAEN) est un acteur majeur et un moteur de développement de l'enseignement supérieur et de la recherche en Normandie. UNICAEN est membre de la communauté d'universités et d'établissements Normandie Université.Pluridisciplinaire, elle accueille plus de étudiants au sein de 12 composantes (UFR,...
-
Stage marketing digital
il y a 18 heures
Caen, Normandie, France Agrial Temps pleinNos offres d'emploiStage marketing digital (F/H) – SAINT LORejoindre Agrial, c'est intégrer une coopérative d'agriculteurs, polyvalente, implantée en France et à l'international. C'est vivre une expérience humaine enrichissante et passionnante, au service du « bien manger » et du « plus durable ». C'est se sentir utile et donner un sens nouveau à...
-
Responsable Bureau d'Études Techniques
il y a 6 jours
Caen, Normandie, France Agence de Caen Temps pleinL'entreprise NORMAN RECRUTEMENT 14 — Votre partenaire emploi engagé dans le Calvados Depuis plusieurs années, nous accompagnons nos talents avec bienveillance, réactivité et engagement. Formations, suivi personnalisé, postes adaptés : chez nous, c'est votre projet qui compte.Chez NORMAN RECRUTEMENT 14, ce sont vos talents qui font la différence....
-
Chargé de Projet Études Réseaux Électriques ENEDIS
il y a 6 jours
Caen, Normandie, France I3P Temps pleinUn poste stratégique pour ceux qui veulent piloter, structurer et avoir un impact technique réel. Basse Normandie – mobilité terrain requise | Travail hybride CDI – Poste à forte responsabilité Bureau d'études indépendant – Gestion des projets ENEDIS Pourquoi ce poste existeI3P poursuit son développement sur les marchés d'études ENEDIS en...
-
Chargé de Projet Études Réseaux Électriques ENEDIS
il y a 6 jours
Caen, Normandie, France I3P Ingénierie et Projets Temps pleinUn poste stratégique pour ceux qui veulent piloter, structurer et avoir un impact technique réel. Basse Normandie – mobilité terrain requise | Travail hybride CDI – Poste à forte responsabilité Bureau d'études indépendant – Gestion des projets ENEDIS Pourquoi ce poste existeI3P poursuit son développement sur lesmarchés d'études ENEDISen...
-
Stage : HSE Gestion et identification des formations aux postes
il y a 2 semaines
Caen, Normandie, France Stellantis Temps pleinJob ID: Career Area: ManufacturingJob Category:Location: Caen, Calvados, FRDate Posted: November 17, 2025Dans le cadre des normes ISO, nous devons identifier formellement les besoins en compétences aux postes de travail ayant un impact sur la qualité, la sécurité ou la conformité. Nous proposons de mettre à jour ce processus dans nos ateliers,...