Stage - Data Scientist - Nlp Embeddings
il y a 7 jours
**About the role**:
1 Contexte
Néanmoins, ces modèles, capables de représenter des mots ou des phrases, ne donnent pas forcément des résultats optimaux dans les situations où le domaine est restreint et le vocabulaire spécifique. En effet, s'il est relativement facile pour ces méthodes de différencier une question sur une voiture d'une demande de résolution de problème TV, il leur est en revanche plus compliqué de distinguer les subtilités entre deux problèmes TV distincts.
2 Objectifs
L'objectif principal de ce stage est d'élaborer un modèle de langue spécifique au domaine des télécommunications et de le comparer aux méthodes plus généralistes de l'état de l'art sur une sélection de tâches réelles (ex: clustering/classification de phrases, classification de dialogues).
Les étapes de ce stage se décomposent de la façon suivante. Dans un premier temps, une prise en main de l'environnement sera réalisée : état de l'art des modèles pour la représentation du texte et des conversations, présentation des tâches et baselines, manipulation des librairies associées (huggingface, PyTorch, etc.).
Ensuite, le travail se portera sur l'adaptation d'un ou plusieurs modèles sur des données spécifiques au domaine des télécommunication, en utilisant notamment les techniques de finetuning. Chaque expérience devra se comparer rigoureusement aux baselines précédentes.
Selon les résultats, il est possible que le meilleur modèle soit partagé dans d'autres équipes d'Orange afin qu'elles puissent le comparer à leurs méthodes actuelles.
**About you**:
Vous êtes étudiant.e en master 2, et vous vous retrouvez dans le profil suivant, en terme de compétences et connaissances:
- Compétences requises
- Intelligence artificielle, machine/deep learning
- Python (numpy, pandas, sklearn), shell
- Connaissances en NLP
- Les plus:
- Transformers, PyTorch
- Travail sur GPU
**Additional information**:
Le stage se déroulera dans les locaux d’Orange Labs à Lannion (22), au sein de la direction DATA-IA d'Orange Innovation, et de l'équipe NADIA.
L’équipe est spécialisée dans le dialogue en langage naturel, et travaille sur des projets à la fois en recherche et en opérationnel. Elle est constituée d'une quinzaine de personnes : chercheurs, doctorants, alternants, data scientists, ingénieurs logiciel.
Le site de Lannion est l’un des plus importants d’Orange, avec environ 1100 employés.
**Department**:
Le Big Data et l'intelligence artificielle constituent aujourd'hui de puissants leviers pour le groupe Orange, permettant à la fois de réinventer la relation client mais également d'optimiser et d'automatiser la gestion de nos réseaux, d'améliorer l'expérience client et d'apporter un avantage différenciant vis-à-vis de nos clients.
Dans ce cadre, la direction Data & AI a pour principale mission de faire d'Orange une entreprise « data driven », qui définit les standards du Groupe en matière de Data & AI, et qui facilite le développement des cas d'usage, des produits et services de données. Cette direction est appelée à accompagner l'ensemble du groupe Orange.
**Contract**:
Internship
Level : Bac+5
-
ML Data Scientist
il y a 2 semaines
Lannion, France OpenClassrooms Temps pleinUne entreprise d'éducation en ligne recherche un Data Scientist Machine Learning en alternance. Le candidat doit concevoir et déployer des outils d'apprentissage automatique tout en participant à l'optimisation des processus. Il est essentiel d'avoir un profil d'ingénieur en data engineering avec des compétences en Python et un intérêt pour l'IA. Le...
-
Data Scientist
il y a 1 semaine
Lannion, France Cooperl Temps plein**Descriptif de poste**: **Descriptif de poste**: Vous souhaitez rejoindre un groupe innovant avec de nombreuses perspectives d'évolutions ? Notre coopérative offre un panel de plus de 600 métiers, pas moins de 7700 collaborateurs, 2950 adhérents et des valeurs authentiques ancrées dans notre ADN ! Dans le cadre de la montée en puissance de son pôle...
-
Data Scientist Machine Learning
il y a 2 semaines
Lannion, France OpenClassrooms Temps pleinDescription du poste Vos missions en tant que Data Scientist Machine Learning (H/F) en alternance : Concevoir, développer, et déployer des outils et systèmes d'apprentissage automatique pour résoudre des problèmes complexes et réaliser des tâches intelligentes. Participer au développement et à l'optimisation d'outils permettant la conduite et la...
-
Stage en Ia
il y a 7 jours
Lannion, France Orange Temps plein**About the role**: En particulier, on peut extraire des informations pertinentes dans un texte. Certaines méthodes comme l’analyse en sentiment, la classification de documents, la reconnaissance d’entités nommées, etc. nécessitent des corpus de textes annotés. La tâche d’annotation, qui est effectuée par des humains, est longue et coûteuse ;...
-
Stage - Chercheur Ia (F/H)
il y a 1 semaine
Lannion, France Orange Temps plein**About the role**: Stage de développement en machine learning F/H pour économie d’énergie via mise en œuvre d’intelligence-artificielle coopérative entre différents acteurs du numérique **About you**: De formation supérieure, vous avez une expérience confirmée dans le machine learning. Vous avez un bon niveau en langage de Programmation tel...
-
Stage Data Analyst
il y a 2 semaines
Lannion, France Eco Compteur Temps plein**_Toi aussi tu veux avoir un impact dans la transformation des villes de demain et participer au développement du tourisme durable ? Rejoins-nous et deviens acteur dans le développement des villes intelligentes et la préservation des espaces naturels ! - ** Chez Eco Compteur, nous accompagnons les villes dans leur transition vers le développement des...
-
Stage - Chercheur - Process Mining (F/H)
il y a 1 semaine
Lannion, France Orange Temps plein**About the role**: - Contexte Les jumeaux numériques de Processus, conçus à partir des technologies de Data/Process Mining et de Traitements Automatique des Langues, nous permettent de mieux comprendre l’entreprise et d’identifier des leviers d’amélioration de son efficacité de production. Néanmoins les outils actuels n’offrent pas de vues...
-
Post Doc
il y a 2 semaines
Lannion, France Orange Temps plein**About the role**: Context: The field of Weakly Supervised Learning (WSL) has recently seen a surge of popularity, with numerous papers addressing different types of ''supervision deficiencies'', namely: poor quality, non-adaptability, and insufficient quantity of labels. Regarding quality, label noise can be of different kinds, including...