Stage recherche- Data Scientist/Linguist NLP F/H

il y a 1 mois


Lannion, France Orange Business Services Temps plein

Profil

Chez Orange Innovation, la direction Data AI vise à promouvoir l'utilisation des données et de l'Intelligence Artificielle, en collaborant étroitement avec les pays où Orange est présent, afin de répondre à leurs besoins métier. Dans cette dynamique, l’équipe DESKIN crée des produits et services basés sur des technologies d’IA, incluant l’IA générative pour le traitement automatique du langage naturel. Expert en traitement automatique du langage naturel Tu es passionné.e par les différentes façons d’exprimer une idée ou un concept Tu es capable d'analyser en profondeur les solutions proposées, et tu fais preuve d'une grande curiosité pour explorer de nouvelles technologies et approches innovantes Tu as un bon relationnel et tu aimes échanger avec des interlocuteurs variés

Mission

Plus précisément, les missions de l'équipe DESKIN sont : 1 : Développer des outils d’IA multilingues, concevoir des solutions complètes de traitement, de manipulation, d’évaluation et visualisation de données textuelles à destination des directions métiers d’Orange, en utilisant les dernières technologies et modèles d’IA Génératives. 2 : Accompagner les équipes métiers pays dans l’analyse de données textuelles et conversationnelles, pour des besoins Orange ou des besoins de clients externes. 3 : Mener des travaux de recherche et d’anticipation pour développer ou adapter de nouvelles technologies d’IA adaptées aux contenus textuels. L’équipe rassemble des compétences et métiers complémentaires : chercheur.e, doctorant.e, architecte, ingénieur.e logiciel, data scientist, intégrateur.

"Titre du stage : Il est mort de rire. Est-ce qu'il vit encore ?" Étude et création d'un corpus d'expressions idiomatiques en plusieurs langues. Ce travail s’inscrit dans le cadre des recherches d'Orange sur l'Abstract Meaning Representation (AMR). Nous analysons des phrases pour générer des structures sémantiques (graphes) qui capturent leur sens. Cependant, l’analyse AMR ne traite généralement pas les expressions idiomatiques, car elles sont rarement présentes dans les corpus d'apprentissage AMR ou dans les modèles de langage pré-entraînés. Expert en traitement automatique du langage naturel Le sujet du stage est de créer un corpus d'expressions idiomatiques dans quelques langues (Anglais, Français, autre si la personne a une autre langue natale), pour faire apprendre à l'analyseur AMR de ne pas les "comprendre" littéralement.

Compétences

Tu prépares actuellement un Bac+5 universitaire ou équivalent dans le domaine de l’apprentissage automatique ou d’un domaine technique connexe Tu as des connaissances en informatique linguistique (computational linguistics) et en linguistique Tu as une bonne connaissance de Linux, Python Tu as un bon niveau d'anglais (au vu du contexte international du stage) Un plus: tu as des connaissances en sémantique formelle (comme par exemple AMR)

Votre équipe : Une team multi-disciplinaire et multilingue

Tu seras accueilli.e dans une équipe dynamique, avec des ée nationale voire internationale dans le domaine du Traitement Automatique du Langage Naturel et tu seras amené.e à travailler avec d'autres stagiaires, apprentis, doctorants présents au sein de l'équipe et du déègreras un collectif de plus de 20 personnes dont des experts en IA, soucieux d’accompagner les ééveloppement tout au long de la durée du stage.  Expert en traitement automatique du langage naturel

Localisation/Information

Tu seras à Lannion dans une ville à taille humaine, située dans l'une des plus belles régions de France, en Bretagne

Stage de fin d'études de master universitaire ou d’école d’ingénieur (Bac+5)

Perspectives

Ce stage est une véritable passerelle vers la recherche, vous permettant de tester le terrain sans vous y engager pleinement. Il offre l'opportunité d'explorer si c'est vraiment ce que vous souhaitez poursuivre. C'est une occasion unique de découvrir et d'affiner votre intérêt pour ce domaine. L'ambiance du stage est proche de celle d'un laboratoire de recherche, tout en étant liée au monde de l'entreprise.

contract

Internship

Duration : 6 mois

Start date : 03 Feb 2025

Niveau d’études préparé pendant le stage Indemnité brute selon école Bac+5 de 1572 € à 2096 € / mois

  • Lannion, Bretagne, France Orange Business Services Temps plein

    ProfilChez Orange Innovation, nous recherchons un Data Scientist/Linguist NLP F/H pour rejoindre notre équipe DESKIN, spécialisée dans la création de produits et services basés sur des technologies d'IA.MissionL'objectif principal de ce poste est de développer des outils d'IA multilingues et de concevoir des solutions complètes de traitement, de...


  • Lannion, France Orange Business Services Temps plein

    about the role *Sujet du stage  : Conception d'une métrique automatique pour l'évaluation des textes générés. *Contexte : De nombreuses mesures automatiques ont été proposées pour évaluer les capacités génératives des modèles de langage [1, 4-6, entre autres]. Cependant, la plupart de ces études se concentrent principalement sur...


  • Lannion, Bretagne, France Orange Business Services Temps plein

    ProfilOrange Innovation, la direction Data AI, vise à promouvoir l'utilisation des données et de l'Intelligence Artificielle, en collaborant étroitement avec les pays où Orange est présent, afin de répondre à leurs besoins métier.L'équipe DESKIN crée des produits et services basés sur des technologies d'IA, incluant l'IA...


  • Lannion, Bretagne, France Orange Business Services Temps plein

    Objectif du stageVous rejoignez l'équipe DESKIN de la direction Data AI d'Orange Innovation pour participer à la conception d'une métrique automatique pour l'évaluation des textes générés. Cette mission est intégrée à un programme de recherche visant à développer des outils d'IA multilingues pour le traitement, la...


  • Lannion, Bretagne, France Orange Business Services Temps plein

    ContexteLa direction Data AI d'Orange Innovation ambitionne de développer l'usage de la Data et de l'Intelligence Artificielle en étroite collaboration avec les pays dans lesquels Orange est implanté. Dans ce contexte, l'équipe DESKIN développe des produits et des services à base de technologies d'Intelligence Artificielle (IA) et...


  • Lannion, Bretagne, France Domino RH Care Saint Malo Temps plein

    About the Role: We are seeking a highly skilled Data Scientist to join our team and drive business growth through data-driven insights.Key Responsibilities:Design and implement data analytics solutions to inform business strategyCollaborate with cross-functional teams to integrate data into business operationsDevelop and maintain data visualizations to...


  • Lannion, Bretagne, France Orange Business Services Temps plein

    ProfilNous recherchons un spécialiste en apprentissage automatique et traitement linguistique pour rejoindre notre équipe de Data AI à Orange Innovation.Vous serez en charge de développer des outils IA multilingues et de concevoir des solutions complètes de traitement, de manipulation, d'évaluation et de visualisation de données textuelles à...

  • Stage recherche

    il y a 1 mois


    Lannion, France Orange Business Services Temps plein

    about the role #fullstack #Nodejs #Vue #Flutter #Devops #Gitlab #CI/CD #Kubernetes #fraudprevention L’objectif du stage est de concevoir et de développer un dashboard pour animer un outil de prévention des risques numériques. A partir de données issues de l'observation des risques numériques, il s'agit d'automatiser l'animation d'une...


  • Lannion, France Orange Business Services Temps plein

    about the role #DevAndroïd #Front-end #Automation #Python #Shell #soutenabilité #réseaumobile La dépendance entre la qualité d’expérience de l’Internet mobile et le niveau de congestion du réseau cellulaire est encore mal connue. L’objectif d’émission carbone « Net Zero 2040 » conduit à envisager des réseaux cellulaires mieux...

  • Stage recherche

    il y a 1 mois


    Lannion, Bretagne, France Orange Business Services Temps plein

    A propos du rôle#Flexibilitéénergétique #réseau #modelisation #recherche #soutenabilitéL'énergie électrique non pilotable (solaire, éolien) a vocation à prendre une part importante de la production d'énergie électrique. Par ailleurs, les scénarios de transition énergétique prévoient des niveaux de tension entre l'offre et la...


  • Lannion, France Orange Business Services Temps plein

    about the role Tu as envie de développer une Intelligence Artificielle pour aider les habitants d’une maison à mieux vivre ? Tu as envie d’être dans une équipe de 15 personnes avec des profils diversifiées (Chercheurs, Chefs de Projet, Data Scientists, Développeurs Seniors) et de t’enrichir auprès d’un Développeur Expérimenté ? ...


  • Lannion, France Orange Business Services Temps plein

    about the role #Flexibilitéénergétique #réseau #modelisation #recherche #soutenabilité L’énergie électrique non pilotable (solaire, éolien) a vocation à prendre une part importante de la production d’énergie électrique. Par ailleurs, les scénarios de transition énergétique prévoient des niveaux de tension entre l’offre et la...


  • Lannion, Bretagne, France Orange Business Services Temps plein

    ContexteL'équipe NADIA « NAtural DIAlogue interaction » travaille au sein de la direction DATA-IA dans la division Innovation – sur les systèmes de dialogue en langage naturel et sur l'analyse de conversations et de parcours.Nous sommes à la recherche d'un stagiaire pour collaborer aux activités de recherche axées sur le dialogue...

  • Stage de recherche

    il y a 1 mois


    Lannion, France Orange Business Services Temps plein

    about the role #python #scikit-learn #machinelearning Ce stage a pour objectif d'explorer l'intégration du concept drift dans le cadre de la classification de données temporelles multi-table, en utilisant des données relationnelles fournies par Orange. Ces données couvrent divers domaines, tels que l'expérience client, la satisfaction et la...


  • Lannion, France Orange Business Services Temps plein

    about the role Contexte: Dans de nombreuses situations réelles, l'imprécision, l'incertitude ou la variabilité peuvent être présentes dans certaines données collectées. Dans ce cas les données utilisées ne sont pas des valeurs précises, ponctuelles (la température est de 10.23 degrés) mais des données à valeur d'intervalle (la...

  • Stage recherche

    il y a 1 mois


    Lannion, France Orange Business Services Temps plein

    about the role #watermarking #privacy #modèlegénératif Contexte : Que ce soit sous forme de tableaux de données marketing ou de logs réseau/machines, les données tabulaires sont omniprésentes chez Orange. Mais une grande part de ces données contient des informations privées (noms, adresses, numéros de téléphones etc.)....

  • Intervalle de données

    il y a 4 semaines


    Lannion, Bretagne, France Orange Business Services Temps plein

    ContexteL'imprécision, l'incertitude ou la variabilité peuvent être présentes dans certaines données collectées. Dans ce cas, les données utilisées ne sont pas des valeurs précises, ponctuelles, mais des données à valeur d'intervalle. On parle de « Interval-Valued Data » (IVD).Apprendre un modèle de machine learning qui se base sur...


  • Lannion, Bretagne, France Orange Business Services Temps plein

    ProfilOrange Innovation recherche un spécialiste en traitement automatique du langage naturel pour rejoindre son équipe de Data AI. Cette équipe vise à promouvoir l'utilisation des données et de l'intelligence artificielle pour répondre aux besoins métier des pays où Orange est présent.Vous serez chargé de développer des outils d'IA multilingues,...


  • Lannion, Bretagne, France Orange Business Services Temps plein

    Objectif du stageLe stage a pour objectif de développer des approches robustes et adaptatives pour détecter et s'ajuster aux changements dans les données multi-table, afin d'optimiser les performances des analyses prédictives et détecter les nouveaux comportements sur la durée.MissionsPlacer le concept drift dans la cadre de la classification sur...


  • Lannion, France Orange Temps plein

    **votre rôle**: **Contexte global et problématique du sujet** Orange traite de grandes quantités de conversations humain-machine (via diverses solutions de bots) et humain-humain pour la relation client. Souvent ces conversations ne sont pas rigoureusement évaluées. Dans le cas de bots, l’émergence récente des grands modèles de langage ou LLMs...