Stage - Data Scientist Spécialisé en Apprentissage Par Renforcement (Rl) (F/H)/n
il y a 2 semaines
**Description de l'entreprise** OCTO**
Premier cabinet d’architectes IT fondé en 1998, pionnier du delivery agile et véritable concentrateur de talents. Nous incarnons les nouvelles façons de faire du conseil et du Delivery. Digital Doers & Thinkers est notre marque de fabrique.
Nous privilégions aujourd'hui notre positionnement Agile & DeepTech et sommes engagés quant à notre responsabilité sociale et environnementale.
**Description du poste** Le sujet du stage**: Optimisation et industrialisation des agents (LLMs) en entreprise
Comment améliorer l'efficacité et la performance des LLMs en utilisant l'apprentissage par renforcement (RL) ? En s'inspirant d'innovations récentes comme celles de Kimi K2, nous explorerons différentes stratégies d'optimisation pour créer des solutions industrialisables et adaptables.
**Le Why du stage**:
Le marché optimise les workflows d'agents, mais les vrais gains viennent de l'optimisation directe via RL. Récemment : des modèles 1.5B surpassent o1-preview avec $42 de coût d'entraînement, un modèle 7B bat un modèle de 671B sur des tâches spécialisées (Sakana AI, 2025).
Nous recherchons un profil motivé pour apprendre à industrialiser ces techniques en quantifiant leur robustesse multi-domaines.
**Les missions du stage**:
- Recherche et approfondissement de la littérature
- Développer et valider expérimentalement de nouveaux algorithmes d'optimisation pour agents LLMs.
- Entrainer des modèles pour des métiers spécialisés.
- Écriture d’un article sur la méthodologie développée durant le stage.
**Le déroulement du stage**:
**Étape 1 : Découverte et cadrage**
- Faire de la veille bibliographique.
- Choisir les algorithmes à explorer.
- Définir la roadmap avec les objectifs à réaliser.
**Étape 2 : Exploration**
- Exploration des possibilités existantes de package proposant d'implémenter ce genre de solution.
**Étape 3 : Contribution**
- Contribution à l’outil OpenSource répondant aux besoins.
**Étape 4 : Partage**
- Partage aux autres Octos pendant et à la fin du stage, rédaction d’un article.
Livrable : Stack technique : Python, Git
**Qualifications** OCTO Wanted**
- Vous préparez un BAC+5 et vous êtes à la recherche d'un stage de fin d'études.
- Vous avez une appétence pour les sujets de Data Science et pour l’exploration de l’état de l’art.
- Vous savez expliquer comme marche un modèle complexe et êtes intéressé par le Reinforcement Learning.
- Vous souhaitez approfondir vos compétences en participant à des sujets open-source.
- Vous êtes curieux, ambitieux et autonome.
**Informations supplémentaires** OCTO Rewards**
**Et parce que nous savons qu’un stage n’est pas “juste” un stage, on vous partage aussi quelques petits + qui font notre différence**:
- 6 participations, 6 podiums au palmarès « Great Place To Work », **le bien-être** et la progression des Octos est vraiment au cœur de nos préoccupations et nous venons de renouveler notre certification pour la 7e fois cette année
- “There is always a better way” : nous encourageons et soutenons **l’innovation par la R&D.** Au-delà d’une direction Scientifique dédiée, nous valorisons le temps hors mission pour partager ses connaissances : blog OCTO, talks, meet-up, livre blanc, BBLen bref de l’open source alimenté par tous les Octos ;
- Parce que ce ne sont pas que des mots, nous marquons au quotidien notre engagement en matière de numérique responsable : depuis 2021 OCTO est Certifié BCorp. Nous **formons les Octos** et nos clients à la **fresque du climat** et œuvrons pour **la sobriété numérique** en interne et auprès de nos clients ;
- Le management est un point central de notre culture. Les Octos tuteurs sont **formés** pour vous **accompagner** dans le **développement de vos compétences**;
- ** Parce qu’on n’a jamais fini d’apprendre**, vous pourrez tirer parti de nos formations, apprendre avec des OCTOs plus expérimentés, et faire parti d'un collectif de passionnés
- Signataire, en 2023, de la charte de la diversité et de l'accord Handicap, et depuis 2022, de la Charte de l’Autre Cercle concernant l’inclusion des personnes LGBTQI+ en entreprise.
**Sans oublier les fondamentaux**:
- Matériel au choix : ordinateur (PC ou Mac) ;
- Télétravail ;
- Et bien sûr : carte Swile, absences autorisées payées, CSE
**OCTO priority**
Collaborer avec des personnes talentueuses issues de différents horizons. Aussi, ce que nous cherchons avant tout, ce sont des personnalités qui enrichiront OCTO.
-
Data Scientist F/H
il y a 1 semaine
Paris, Île-de-France un emploi de Data Scientist FH Temps pleinData scientist F/H (Stage de 6 mois)Faire de la Data Science dans la musique, c'est analyser des millions d'écoutes quotidiennes, comprendre comment naissent les hits, comment évoluent les goûts et comment les artistes rencontrent leur public.Sony Music Entertainment France, un des leaders du secteur de la production, de la promotion et de la distribution...
-
Data Scientist
il y a 3 jours
Paris, France MP Data Temps pleinBonjour, MP DATA est une Société de Conseil à taille humaine spécialisée dans le traitement et la valorisation des données des entreprises depuis 2015. Partenaire de confiance d'entreprises du CAC40 sur leur transformation Data / IA, notre société accompagne ses clients sur tout le territoire français (bientôt Européen) sur des projets...
-
Data Scientist LLM/ GCP confirmé
il y a 2 semaines
Paris, France MP Data Temps pleinNous recrutons : Data Scientist LLM / GCP Confirmé(e) Boulogne-Billancourt (92100) | Secteur : Industrie CDI - Équipe Data Nous renforçons notre équipe Data et recherchons un(e) Data Scientist confirmé(e) spécialisé(e) en LLM et GCP. Vous interviendrez sur toutes les étapes clés de nos projets d'Intelligence Artificielle, de l'exploration à la mise...
-
Stage - Data Scientist : Modélisation Des
il y a 3 jours
Paris, France BNP Paribas Temps plein**Stage - Data Scientist : Modélisation des remboursements anticipés H/F - 6 Mois** Poste à Paris à pourvoir à Partir de Janvier 2025 **Missions, équipe et environnement de travail, ça donne quoi ?** Parmi ses mandats, l’ALM Treasury (ALMT) de BNP Paribas est en charge de la gestion et de la couverture du risque de taux associé à l’ensemble...
-
Consultant Data Scientist
il y a 6 jours
Paris, Île-de-France JICAP Performance Temps pleinStage (de mars à juillet 2026)Fondé en 2016, JICAP Performance est un cabinet de conseil spécialisé dans l'amélioration de la performance achats et la transformation des fonctions achats.Nous vous proposons de nous rejoindre en tant que stagiaire avec un quotidien et une feuille de route comparable à un Consultant Data ScientistEn rejoignant...
-
energy data scientist
il y a 6 jours
Paris, Île-de-France STATION F Temps pleinÀ proposChez , Notre Mission Est SimpleAccélérer la transition énergétique en aidant les entreprises des énergies renouvelables en Europe à développer leur activité grâce à notre solution digitale qui centralise l'ensemble des étapes de vente des équipements énergétiques (panneau photovoltaïque, borne de recharge, pompe à chaleur etc.) dans...
-
Data Scientist Llm
il y a 2 semaines
Paris, France MP Data Temps pleinNous recrutons : Data Scientist LLM / GCP Confirmé(e) Boulogne-Billancourt (92100) Secteur : Industrie CDI - Équipe Data Nous renforçons notre équipe Data et recherchons un(e) Data Scientist confirmé(e) spécialisé(e) en LLM et GCP. Vous interviendrez sur toutes les étapes clés de nos projets d'Intelligence Artificielle, de l'exploration à la mise...
-
Stage - Data Scientist
il y a 3 jours
Paris, France Group onePoint Temps pleinLA COMMUNAUTÉ DATA.IA Onepoint regroupe plus de 200 experts data sur toutes les dimensions (datascience, ML engineering, data engineering, data strategy ). Dans ce cadre, votre mission alliera recherche et réalisation de projets concrets. Vous découvrirez ainsi différents rôles autour de la Data, soulevant des enjeux à la fois techniques et...
-
Data Scientist
il y a 1 semaine
Paris, France HomeExchange Temps pleinAfin de répondre à nos ambitions et challenges, l'équipe Data est à la recherche d’un-e stagiaire Data Scientist. L'équipe est actuellement composée de: Quentin & Vincent - Data Engineer Christopher, Leeroy & Guillaume - Data Analyst Alexandre & Alexandre - Data Scientist Soizic - Chief Data Officer Nous cherchons donc une nouvelle pépite pour...
-
Data Scientist
il y a 6 jours
Paris, France VusionGroup Temps pleinAre you ready to develop the future of retail?As the world’s leader in IoT and data technologies for commerce, our mission is to help retailers and brands use digitalization to become more efficient, more intelligent, and more sustainable—and in doing so, enable more positive commerce.VusionGroup is a fast-growing, fast-paced retail tech company. We...