Stage - Data Scientist #CEDID - F/H
il y a 1 heure
Au sein de la Direction Transformation et Efficacité Opérationnelle (DTEO), le CEDID (Centre d'Excellence Data IA & Développement) du Groupe EDF impulse, accompagne, contribue à la Transformation Numérique du Groupe. Elle communique et élabore la vision globale des systèmes d'informations en lien avec la stratégie du Groupe EDF. Au service de tous les métiers du Groupe, elle contribue à développer la performance du Groupe par la Data et l'IA. Dans ce cadre, la Data IA & Factory du CEDID conçoit des solutions sur-mesure pour répondre aux besoins complexes des métiers de la production et du transverse, en s'appuyant sur des approches avancées d'intelligence artificielle.
L'équipe Data & IA Factory regroupe une trentaine de personnes, composée de data scientists, de data analysts, de data engineers, et de chefs de projet. Le mode de travail est en mode projet agile, avec nos clients internes, à savoir les producteurs d'énergie des filières nucléaire, hydraulique, thermique et énergies renouvelables ainsi que les filières transverses. Les travaux réalisés sont des travaux d'études, sédentaires, mais nécessitent de rencontrer régulièrement les donneurs d'ordre métier et/ou les maitrises d'oeuvre SI qui nous fournissent les données et exploitent notre data lake (réunions en région parisienne principalement).
Objet du stage :
La Data & IA Factory mène de nombreux projets en traitement du langage naturel (NLP), notamment autour des moteurs de recherche et des systèmes RAG. Ces projets concernent la production d'électricité et s'appuient sur des documents riches en vocabulaire technique propre à EDF. Des termes comme "tranche", "palier" ou "chaussette" y ont des significations très spécifiques, différentes du langage courant.
Or, les modèles d'embeddings open source, peu exposés à ce jargon, produisent souvent des résultats peu pertinents. Jusqu'à présent, chaque projet nécessitait donc un finetuning supervisé spécifique, avec annotation par les experts métiers — une approche efficace mais chronophage.
Des travaux ont été entrepris pour entraîner un premier modèle d'embeddings entraîné sur un corpus interne. Le stage proposé s'inscrit dans la continuité de ces travaux et vise à faire évoluer le modèle d'embeddings, afin de constuire un modèle d'embeddings interne réutilisable dans l'ensemble des cas d'usage de l'entreprise.
La durée de stage envisagée pour ce poste est de 6 mois.
Vous percevrez une gratification mensuelle dont le montant dépend de votre niveau d'étude ainsi que du diplôme préparé.
Ce qu'EDF peut vous offrir :
Vous profitez des activités sociales de l'entreprise
Vous bénéficiez d'un remboursement minimum de 50% de votre titre de transport
Une prise en charge de vos dépenses d'hébergements peut vous être proposée sous conditions.
Chez EDF, notre objectif est d'ouvrir nos portes à toutes les compétences, toutes les énergies et toutes les personnalités sans exclusion. Le poste proposé est donc ouvert à toutes et à tous.
Objectifs du stage :
Poursuivre l'entraînement et l'évaluation d'un modèle d'embeddings EDF, spécialisé sur notre vocabulaire technique, en menant les actions suivantes:
Construire un corpus EDF enrichi : intégration de nouvelles sources de données, nettoyage, normalisation et mise en forme ;
Réaliser un état de l'art sur les principales architectures et approches d'entraînement de modèles d'embeddings et identifier les plus adaptées au contexte ;
Entraîner le modèle sur de nouvelles architectures et entraîner le tokenizer
Évaluer le modèle de manière approfondie : comparaison avec l'état de l'art, analyse par domaine (nucléaire, thermique, hydraulique…), définition de nouvelles métriques de performance ;
Documenter les résultats et proposer des pistes d'amélioration pour les futures itérations du modèle ;
Partager les apprentissages en animant des retours d'expérience techniques au sein de l'équipe Data IA Factory.
Ce modèle servira ensuite de socle commun à l'ensemble des projets NLP de la Data & IA Factory permettant des gains de performance et une réduction des besoins en annotation.
Spécialisation du diplôme : Data Science – Mathématiques appliquées – Statistiques – Machine Learning – programmation Python – bibliothèques NLP : Hugging Face Transformers, PyTorch, Datasets.
Soft skills : rigueur, esprit critique, esprit de synthèse, esprit d'équipe.
Dans le groupe EDF, accueillir des personnes en situation de handicap fait partie de notre ADN.
Notre objectif est d'ouvrir nos portes à toutes les compétences, toutes les énergies et toutes les personnalités sans exclusion. Le poste proposé est donc ouvert à toutes et à tous.
Rejoindre EDF c'est intégrer :
Un Groupe international, qui innove pour développer des énergies neutres en CO2.
Avec 230 métiers différents il y en a forcément un pour vous
Une entreprise engagée dans l'accueil et la formation des étudiant. Plus de 90% des étudiants recommandent EDF l'issue de leur alternance ou de leur stage
(source : enquête Happy Trainees 2024).
Une opportunité vers une embauche : en 2023, 38% des recrutements de jeunes diplômés étaient issus de l'alternance et du stage.
-
Data Scientist H/F
il y a 1 heure
Puteaux, Île-de-France OVENTI Consulting Temps pleinOVENTI Consulting,cabinet de conseil en Data et Intelligence Artificielle qui allieexpertise technique de pointe, vision stratégique et accompagnement sur mesure. Nous couvrons tout le cycle de vie des projets Data/IA, de la stratégie à l'implémentation de solutions personnalisées (ML, BI, automatisation intelligente).Nos équipes, issues desmeilleures...
-
Stage Assistant(e) Data
il y a 1 heure
Puteaux, Île-de-France ALTRAD ENDEL Temps pleinMaitrise avancée d'Excel, expert de la gestion de base de données, vous avez envie d'enrichir votre parcours de formation avec un stage passionnant ? Rejoignez nos équipes Assistant(e) Data / Gestion base de données(H/F)La Défense (92) – Stage 3 à 6 moisActeur majeur dans le secteur de la maintenance industrielle, ALTRAD ENDEL, et notamment sa...
-
Consultant Data Analyst H/F – Stage de fin d'études
il y a 1 heure
Puteaux, Île-de-France Primexis | Expertise-comptable et conseil opérationnel Temps pleinDescriptionDescription de Primexis :Cabinet indépendant deconseil opérationnel et d'expertise comptablespécialisée, situé à La Défense,Primexisaccompagne dans la durée lesdirections financières des grandes entrepriseset organisations dans l'amélioration continue de leur performance.Nos clients, grands groupes français, filiales françaises de...
-
Data Lifecycle Management
il y a 1 heure
Puteaux, Île-de-France Wavestone Temps pleinDescription de l'entrepriseRejoignez un cabinet de conseil international qui accompagne les grandes transformations stratégiques.Nous sommes Wavestone : des expert·es passionné·es et orienté·es solutions, qui placent l'humain au cœur de la performance et de la croissance. Ambitieux·ses et en pleine expansion, nous développons sans cesse notre...
-
stage - analyste de la performance des ventes f/h
il y a 1 heure
Puteaux, Île-de-France ICADE Temps pleinDans le cadre du développement de nos activités commerciales et marketing, nous recherchons un·e stagiaire pour accompagner la Directrice Commerciale, Marketing et Expérience Client, ainsi que son équipe, dans le suivi opérationnel et l'analyse de la performance.PRINCIPALES ACTIVITESRattaché(e) à la Direction Commerciale et Expérience client, vous...
-
Responsable Avant Vente de projets IA H/F/NB
il y a 1 heure
Puteaux, Île-de-France TRIMANE | Expert BI et Big Data Temps pleinFondée en 2005, TRIMANE est un cabinet de conseil et une société de services spécialisée en Data Intelligence (Data & IA). Notre mission : créer de la valeur à partir des données disponibles dans les entreprises, en s'appuyant sur des approches algorithmiques innovantes, des méthodologies éprouvées et de nombreuses technologies de pointe.En tant...
-
Data Analyst
il y a 1 heure
Puteaux, Île-de-France Allianz Insurance Temps pleinVous souhaitez jouer un rôle clé dans la gestion des actifs financiers ?Au sein de l'Unité Investissement d'Allianz France, vous rejoindrez l'équipe AIM Finance & Opérations sur des missions d'analyse, de fiabilisation et d'automatisation des données d'investissement. Vous contribuerez à des projets concrets au cœur des enjeux financiers du groupe,...
-
Ingénieur Data H/F CDI
il y a 1 heure
Puteaux, Île-de-France WTW Temps pleinDescriptionLe rôleEn tant que Data Ingénieur, sous la responsabilité de la Directrice Data du département H&B France, votre mission principale est de concevoir, développer et maintenir des pipelines de données robustes et sécurisés sur l'écosystème Azure afin de fournir des données fiables, gouvernées et prêtes pour l'analyse. L'ingénieur Data...
-
Stage Analyste Junior
il y a 1 semaine
Puteaux, Île-de-France AGL transport & logistics Temps pleinInformations générales Stage Analyste Junior Informations Générales AGL (Africa Global Logistics) est l'opérateur logistique multimodal (portuaire, logistique, maritime et ferroviaire) de référence en Afrique. L'entreprise fait désormais partie du Groupe MSC, compagnie maritime et logistique de premier plan. Grâce à son expertise développée...
-
Stage Assistant chef de projet H/F
il y a 4 jours
Puteaux, Île-de-France AGL Groupe Temps pleinInformations générales Stage Assistant chef de projet H/F Informations Générales AGL (Africa Global Logistics) est l'opérateur logistique multimodal (portuaire, logistique, maritime et ferroviaire) de référence en Afrique. L'entreprise fait désormais partie du Groupe MSC, compagnie maritime et logistique de premier plan. Grâce à son expertise...