Stage Data Scientist H/F

il y a 1 semaine


AncenisSaintGéréon, France Manitou Group Temps plein

Stage Data Scientist Offre ID45315Date 3 décembre 2025 Famille d'offre - Recherche & développement Type of contract - Stage, De 0 à 6 mois Pourquoi rejoindre Manitou Group ? Manitou s'engage résolument envers ses collaborateurs. Avec une approche One United Team, nous cultivons à l'échelle internationale un environnement de travail dynamique et orienté résultats. Nous garantissons l'égalité des chances et valorisons la diversité de plus de 6000 employés dans plus de 30 pays (6 principaux sites en France, aux USA, en Inde, en Italie et plus de 30 filiales à travers le monde). Êtes-vous prêt à relever de nouveaux défis ? Rejoignez-nous et participez à notre succès continu. Le Groupe MANITOU dispose d'une vaste base documentaire technique. L'accès rapide et précis à ces informations est un enjeu important tant dans les activités de développement produit que pour l'usage futur des produits. Suite à une phase d'expérimentation approfondie, la faisabilité d'un assistant conversationnel (chatbot) basé sur l'architecture RAG (Retrieval-Augmented Generation) a été validée. Ce prototype permet d'interroger nos documents en langage naturel et d'obtenir des réponses factuelles, générées par un LLM en se basant sur les extraits pertinents, et intègre une interaction vocale (Whisper/Coqui TTS). Nous recherchons un(e) stagiaire pour rejoindre l'équipe R&D de Recherche Avancée afin de consolider, évaluer, optimiser et étendre ce démonstrateur. Vos Missions Sous la supervision de l'équipe, vous prendrez en charge le cycle d'amélioration du pipeline RAG. Vos missions principales seront : 1. Prise en main et consolidation : - Vous approprier les travaux d'expérimentation existants (rapport de capitalisation, code source). - Nettoyer, documenter et structurer la base de code pour mettre en place un environnement de développement stable et reproductible. 2. Évaluation du pipeline : - Définir et mettre en oeuvre un framework d'évaluation pertinent (ex: RAGAs, TruLens) pour mesurer objectivement la performance : pertinence des chunks récupérés, fidélité des réponses, temps de latence, etc. - Constituer un jeu de questions/réponses de référence pour les tests. 3. Optimisation fondamentale : - Parsing & Chunking : Ré-évaluer et implémenter les meilleures stratégies (ex: pymupdf4llm, MarkdownHeaderTextSplitter) pour gérer les documents complexes (notamment les tableaux). Comparer l'impact des documents «aplatis» vs. originaux. - Retrieval : Expérimenter pour améliorer la pertinence de la recherche (paramètres FAISS, hybridation sémantique/mots-clés, re-ranking). - Génération : Mener des campagnes de «Prompt Engineering» et évaluer l'impact de différents LLMs locaux (via Ollama) sur la qualité des réponses et les performances. 4. Amélioration de l'Interaction Vocale : - Tester différents modèles et paramètres pour la reconnaissance vocale (Whisper) en environnement bruyant. - Évaluer différentes voix et options pour la synthèse vocale (Coqui TTS), y compris le clonage vocal. 5. Exploration et extensions : - Interface : Développer une interface graphique simple (Streamlit ou Gradio) pour faciliter la démonstration. - Sources : Améliorer la citation précise des sources (document, page) utilisées par le LLM. - Multimodalité : Étudier la faisabilité d'intégrer des modèles multimodaux (ex: LLaVA) pour répondre aux questions portant sur les images et schémas des manuels. 6. Documentation et capitalisation : - Maintenir une documentation technique claire et rédiger un rapport de stage détaillé présentant votre démarche, vos résultats et vos préconisations. Profil Recherché - Étudiant(e) en dernière année d'école d'ingénieur ou Master 2 (Bac +5) en Informatique. - Spécialisation en Intelligence Artificielle, Data Science ou Traitement du Langage Naturel (NLP). Compétences techniques nécessaires: - Excellente maîtrise du langage Python et de son écosystème scientifique. - Solide compréhension théorique et pratique du Machine Learning, Deep Learning et NLP (embeddings, LLMs). - Connaissance des concepts de l'architecture RAG. Compétences souhaitables : - Expérience avec des frameworks comme LangChain. - Connaissance des bases de données vectorielles (ex: FAISS). - Utilisation de LLMs locaux (ex: via Ollama) ou Cloud (API). - Notions en parsing PDF (ex: PyMuPDF) et en interaction vocale (Whisper, Coqui TTS). - Expérience avec Streamlit ou Gradio. Vous: - Curiosité technique et goût prononcé pour l'expérimentation. - Autonomie, rigueur et capacité à résoudre des problèmes complexes. - Bonnes capacités d'analyse et de synthèse. - Bonne communication (écrite et orale) et anglais technique (lecture de documentation). Environnement Technique Vous évoluerez principalement avec les outils suivants : - Langage : Python 3.x - Frameworks IA/RAG : LangChain - LLMs / Embeddings Locaux : Ollama (Llama 3.1, Mistral, bge-m3) - Vector Store : FAISS - Parsing PDF : PyMuPDF (pymupdf4llm), Unstructured - Voix (STT/TTS) : Whisper (OpenAI), Coqui TTS (xtts\_v2) - Outils : Jupyter Notebooks, Docker, Git Qu'est-ce que MANITOU Group peut vous apporter ? Poste à pourvoir à compter de: Avril 2026 Durée : 6 mois Rémunération : selon niveau de formation + Restaurant d'entreprise + Aiide au logement de 100€ par mois dans le cadre d'un déménagement spécifique au stage Prise en charge des transports en commun (50% ou forfait vélo) + Navette gratuite de la gare d'Ancenis au site de Manitou matin et soir Accessibilité : Le site est basé à Ancenis (44) VOUS ÊTES CONVAINCU(E) Transmettez directement votre candidatureau format PDF(CV et lettre de motivation) en cliquant sur «Postuler«. Lien copié Localisation(s) - France - Ancenis Pour afficher cette carte interactive, vous devez autoriser le service Google Maps.


  • Stage - Data Scientist

    il y a 1 semaine


    Saint-Denis, France Generali France Temps plein

    **Date**:6 nov. 2024 **Lieu de travail**: ST DENIS, FR, 93210 **Entreprise**:GENERALI VIE **STAGE - DATA SCIENTIST - F/H** Référence : 11658 STAGIAIRE SAINT DENIS **Generali** Avec plus de 70 millions de clients et un chiffre d’affaires de 82,5 milliards d’euros en 2023, Generali est l’un des leaders de l’assurance et de la gestion...


  • Saint-Denis, France Generali France Temps plein

    **Date**:11 déc. 2024 **Lieu de travail**: ST DENIS, FR, 93210 **Entreprise**:GENERALI VIE **STAGE - DATA SCIENTIST / DATA ENGINEER** - **F/H** Référence : 11818 STAGIAIRE Saint Denis ou Nantes **Generali** Avec plus de 70 millions de clients et un chiffre d’affaires de 82,5 milliards d’euros en 2023, Generali est l’un des leaders de...


  • Saint-Denis, France Generali France Temps plein

    **STAGE - DATA SCIENTIST / ACTUAIRE F/H**: - Référence: 13496- - STAGIAIRE- - ST DENIS, FR, 93210- - **Generali**- Generali, leader européen de l’assurance, accompagne plus de 71 millions de clients à travers le monde. Qu’ils soient particuliers, professionnels ou entreprises, nous proposons à nos clients une gamme de solutions d’assurance...

  • Data Scientist

    il y a 4 jours


    Ancenis, France Manitou Group Temps plein

    Référence: 41443- Fonction: Recherche & développement- Localisation: Ancenis, 44158, FR- Type de contrat: CDI**POURQUOI TRAVAILLER CHEZ MANITOU GROUP ?** Vous souhaitez évoluer dans un environnement où vous pouvez exprimer vos talents ? Vivre une aventure professionnelle en équipe et à l'international ? Entreprendre et relever des défis au quotidien...

  • Stage - Data Scientist - (F/H)

    il y a 2 semaines


    Saint-Denis, France Generali France Temps plein

    **STAGE - DATA SCIENTIST - F/H**: - Référence: 13552- - STAGIAIRE- - ST DENIS, FR, 93210- - **Generali**- Avec plus de 71 millions de clients et un chiffre d’affaires de 95,2 milliards d’euros en 2024, Generali est l’un des leaders de l’assurance et de la gestion d’actifs dans le monde. Assureur responsable, nous plaçons la durabilité au cœur...

  • Data Scientist

    il y a 2 semaines


    Ancenis, France Manitou Group Temps plein

    Référence: 44731 - Fonction: Service après vente - Localisation: Ancenis, 44, FR, 44150 - Type de contrat: CDI **POURQUOI TRAVAILLER CHEZ MANITOU GROUP ?** Vous souhaitez évoluer dans un environnement où vous pouvez exprimer vos talents ? Vivre une aventure professionnelle en équipe et à l'international ? Entreprendre et relever des défis au...

  • Data Scientist Junior

    il y a 12 heures


    Saint-Denis, France Showroomprive.com Temps plein

    Company Description Les salariés de Showroomprivé se retrouvent autour de 4 valeurs communes qui sont l’Agilité, l’Accessibilité, l’Innovation et la Confiance. Rejoindre le Groupe Showroomprivé, c’est aussi partager les convictions de son programme Move Forward, valorisant ses engagements relatifs à trois axes majeurs à savoir...

  • Stage Data Scientist

    il y a 2 jours


    Ancenis, Pays de la Loire, France MANITOU Group Temps plein

    Offre ID45315Date3 décembre 2025Famille d'offreRecherche & développementType of contractStage, De 0 à 6 moisPourquoi rejoindre Manitou Group ?Manitou s'engage résolument envers ses collaborateurs. Avec une approche "One United Team", nous cultivons à l'échelle internationale un environnement de travail dynamique et orienté résultats. Nous...


  • Saint-Denis, Île-de-France Generali Temps plein

    STAGE - DATA SCIENTIST/ DATA ENGINEER H/FRéférence: 13636STAGIAIREST DENIS, FR, 93210GeneraliAvec plus de 71 millions de clients et un chiffre d'affaires de 95,2 milliards d'euros en 2024, Generali est l'un des leaders de l'assurance et de la gestion d'actifs dans le monde. Assureur responsable, nous plaçons la durabilité au cœur de notre...


  • Saint-Denis, Île-de-France Generali Temps plein

    STAGE - DATA SCIENTIST F/HRéférence: 13676STAGIAIREST DENIS, FR, 93210GeneraliAvec plus de 70 millions de clients et un chiffre d'affaires de 82,5 milliards d'euros en 2023, Generali est l'un des leaders de l'assurance et de la gestion d'actifs dans le monde. Assureur responsable, nous plaçons la durabilité au cœur de notre stratégie.Notre directionAu...