Thèse 'Codage audio multicanal par réseau de neurones'

il y a 4 semaines


CessonSévigné, France Orange Sa Temps plein
Votre rôle est d'effectuer un travail de thèse sur le codage audio multicanal par réseaux de neurones.
Contexte global et problématique du sujet
Après MPEG-H pour le streaming, le standard 3GPP IVAS (Immersive Voice and Audio Services) auquel Orange a contribué inaugure la capacité d'un codec conversationnel à adresser des services immersifs avec même une part d'interaction utilisateur sur le plan spatial. Il y a une convergence avec les téléréunions (en y apportant le naturel des réunions physiques et même plus d'interactivité) et le concept de collaborateur augmenté (incl. réalité augmenté) . Les approches de type " spatial paramétrique " semblent appropriées aux besoins d'interaction, ainsi que le format High Order Ambisonics (HOA) .
Ces dernières années et encore tout récemment, les approches neuronales appliquées au codage audio monocanal ont fait des progrès énormes en termes de rapport qualité-débit. Ce sont en particulier les réseaux antagonistes génératifs (GAN) qui ont permis un tel gain de performances. Ces derniers ont parfois une complexité algorithmique trop importante pour être utilisés en pratique.
En revanche, les travaux sur le codage audio spatial (multicanal) en neuronal de bout-en-bout sont encore balbutiant.
Le codage de la voix et de l'audio est dans l'ADN d'Orange, la qualité de ses services en dépend.
Objectif scientifique
  • résultats et verrous à lever
L'objectif de la thèse est de concevoir un codeur audio spatialisé basé sur un réseau de neurones offrant des possibilités de restitution interactive.
Pour obtenir de l'interactivité au décodage, il est nécessaire de progresser dans la conception de réseaux de neurones interprétables. Pour cela, il est envisagé de croiser des tâches généralement séparées jusqu'à présent : codage, séparation de sources, rehaussement, analyse spatiale, déréverbération. C'est une pratique courante en neuronal mais encore trop partiellement appliquée sur ces tâches.
Il faudra exploiter ou concurrencer des modèles représentatifs de l'état de l'art, tout en visant une complexité / consommation réduite.
Un aspect critique de la thèse est l'exploitation (voire la constitution) des bases de données audio 3D pour l'apprentissage et l'évaluation des algorithmes développés

Profil recherché


Compétences (scientifiques et techniques) et qualités personnelles exigées par le posteMaitrise des techniques d'apprentissage automatique, réseaux de neurones profonds
Maitrise des techniques de traitement du signal, audio. Compréhension des propriétés spatiales de l'acoustique
Connaissance des principes du codage
Autonomie et prise d'initiatives
Capacité de synthèse et vulgarisation
Formation demandée (master, diplôme d'ingénieur, doctorat, domaine scientifique et technique …) Diplôme niveau bac+5 (master, diplôme d'ingénieur, etc.) dans le domaine du traitement du signal ou de l'apprentissage automatique ou de l'acoustique.
Une connaissance du domaine de l'audio est un plus
Connaissance du langage Python (bibliothèque Pytorch)
Expériences souhaitées (stages, …)

Présentation de Orange Sa


L'ambition de la Division Innovation est de porter plus loin l'innovation d'Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l'humain, éclairer les choix stratégiques du Groupe à long terme et influencer l'écosystème digital mondial.
Nous formons les expertes et les experts des technologies d'aujourd'hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité. La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l'innovation dont 740 chercheurs. Porteurs d'une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité…) , les femmes et les hommes de Innovation sont à l'écoute et au service des pays, des régions et des business units pour faire d'Orange un opérateur multiservices de confiance.

Au sein d'Innovation, vous serez intégré(e) dans une équipe à la pointe de l'innovation et de l'expertise sur les systèmes de télécommunications audio (prise de son, débruitage, analyse de scène, spatialisation, codage/compression etc.) . Vous ferez partie d'un écosystème de recherche côtoyant des chercheurs et ingénieurs permettant la mise en oeuvre concrète des concepts, ainsi que des systèmes audio à l'état de l'art pour la prise de son, la diffusion et la transmission

  • Cesson-Sévigné, Bretagne, France Orange Sa Temps plein

    Votre rôle est d'effectuer un travail de thèse sur le codage audio multicanal par réseaux de neurones.Contexte global et problématique du sujetAprès MPEG-H pour le streaming, le standard 3GPP IVAS (Immersive Voice and Audio Services) auquel Orange a contribué inaugure la capacité d'un codec conversationnel à adresser des services immersifs avec même...


  • Cesson-Sévigné, France Orange Sa Temps plein

    Votre rôle est d'effectuer un travail de thèse sur le codage audio multicanal par réseaux de neurones. Contexte global et problématique du sujet Après MPEG-H pour le streaming, le standard 3GPP IVAS (Immersive Voice and Audio Services) auquel Orange a contribué inaugure la capacité d'un codec conversationnel à adresser des services immersifs avec...


  • Cesson-Sévigné, Bretagne, France Orange Sa Temps plein

    Votre rôle est d'effectuer un travail de thèse sur la : " Séparation de sources par IA générative. Application à des contenus ambisoniques " Contexte global et problématique du sujetLes récents progrès de la reconnaissance automatique de la parole, portés par les avancées en deep learning, ont grandement participé à mettre en avant les services...


  • Cesson-Sévigné, France Orange Business Services Temps plein

    about the role Your role is to conduct PhD work on multichannel audio coding using deep neural networks (DNN). Background and problem After MPEG-H for streaming, the 3GPP IVAS (Immersive Voice and Audio Services) standard, to which Orange has contributed, inaugurates the ability of a conversational codec to address immersive services, with some...


  • Cesson-Sévigné, France Orange Business Services Temps plein

    about the role Your role is to conduct PhD work on multichannel audio coding using deep neural networks (DNN). Background and problem After MPEG-H for streaming, the 3GPP IVAS (Immersive Voice and Audio Services) standard, to which Orange has contributed, inaugurates the ability of a conversational codec to address immersive services, with some...


  • Cesson-Sévigné, Bretagne, France Orange Sa Temps plein

    Votre rôle est d'effectuer un travail de thèse sur : " Reconfiguration et orchestration de jumeaux numériques des réseaux" Contexte global et problématique du sujetLe jumeau numérique fait partie des grandes tendances technologiques stratégiques [1]. Les jumeaux numériques maintiennent à jour une représentation numérique d'entités d'intérêt du...


  • Cesson-Sévigné, France Orange Sa Temps plein

    Votre rôle est d'effectuer un travail de thèse sur : " Reconfiguration et orchestration de jumeaux numériques des réseaux" Contexte global et problématique du sujet Le jumeau numérique fait partie des grandes tendances technologiques stratégiques [1]. Les jumeaux numériques maintiennent à jour une représentation numérique d'entités...


  • Cesson-Sévigné, France Orange Sa Temps plein

    Votre rôle est d'effectuer un travail de thèse sur : " Reconfiguration et orchestration de jumeaux numériques des réseaux" Contexte global et problématique du sujet Le jumeau numérique fait partie des grandes tendances technologiques stratégiques [1]. Les jumeaux numériques maintiennent à jour une représentation numérique d'entités...


  • Cesson-Sévigné, France Orange Business Services Temps plein

    about the role Your role is to carry out a thesis on: "Source separation using generative AI. Application to ambisonic content".    Overall context and problem of the subject Recent advances in automatic speech recognition, driven by advances in deep learning, have played a major role in bringing voice services to the fore. However, who hasn't...


  • Cesson-Sévigné, France Orange Business Services Temps plein

    about the role Your role is to carry out a thesis on: "Source separation using generative AI. Application to ambisonic content".    Overall context and problem of the subject Recent advances in automatic speech recognition, driven by advances in deep learning, have played a major role in bringing voice services to the fore. However, who hasn't...


  • Cesson-Sévigné, France Kantar Media Temps plein

    Ce rôle nécessitera des compétences en communication écrite en anglais pour les communications internes et externes.Ingénieur Tests Automatiques et Validation (Python)Kantar Media Audiences (KMA) recrute un ingénieur test et validation pour son équipe Mesure d’Audience basée à Rennes.SociétéLe marché de la mesure d’audience est en pleine...


  • Cesson-Sévigné, Rennes, France Kantar Media Temps plein

    Ce rôle nécessitera des compétences en communication écrite en anglais pour les communications internes et externes.Ingénieur Tests Automatiques et Validation (Python)Kantar Media Audiences (KMA) recrute un ingénieur test et validation pour son équipe Mesure d’Audience basée à Rennes.SociétéLe marché de la mesure d’audience est en pleine...


  • Cesson-Sévigné, France Kantar Media Temps plein

    Ce rôle nécessitera des compétences en communication écrite en anglais pour les communications internes et externes.Ingénieur Tests Automatiques et Validation (Python)Kantar Media Audiences (KMA) recrute un ingénieur test et validation pour son équipe Mesure d’Audience basée à Rennes.SociétéLe marché de la mesure d’audience est en pleine...


  • Cesson-Sévigné, France Kantar Media Temps plein

    Ce rôle nécessitera des compétences en communication écrite en anglais pour les communications internes et externes.Ingénieur Tests Automatiques et Validation (Python)Kantar Media Audiences (KMA) recrute un ingénieur test et validation pour son équipe Mesure d’Audience basée à Rennes.SociétéLe marché de la mesure d’audience est en pleine...


  • Canton of Cesson-Sévigné, France Orange Business Temps plein

    L'ambition d'Orange Business est de devenir l'intégrateur réseaux et numérique de référence en Europe, en nous appuyant sur nos forces autour des solutions de connectivité nouvelle génération, du cloud et de la cybersécurité.Nos 30 000 femmes et hommes présents dans 65 pays, dont chaque voix compte, sont tous animés par la même...


  • Canton of Cesson-Sévigné, FR Orange Business Temps plein

    L'ambition d'Orange Business est de devenir l'intégrateur réseaux et numérique de référence en Europe, en nous appuyant sur nos forces autour des solutions de connectivité nouvelle génération, du cloud et de la cybersécurité.Nos 30 000 femmes et hommes présents dans 65 pays, dont chaque voix compte, sont tous animés par la même...


  • Canton of Cesson-Sévigné, France Harmonic Temps plein

    Nous recherchons notre futur(e) technicien(ne) systèmes et réseaux confirmé(e) pour gérer notre nouveau lab R&D sur notre site de Cesson-Sévigné.Il s'agit d'une création de poste liée à la croissance de notre activité Broadband en France.Vous contribuerez à la création et à la configuration de ce nouveau lab R&D et serez le garant de son...


  • Canton of Cesson-Sévigné, FR Harmonic Temps plein

    Nous recherchons notre futur(e) technicien(ne) systèmes et réseaux confirmé(e) pour gérer notre nouveau lab R&D sur notre site de Cesson-Sévigné.Il s'agit d'une création de poste liée à la croissance de notre activité Broadband en France.Vous contribuerez à la création et à la configuration de ce nouveau lab R&D et serez le garant de son...


  • Cesson-Sévigné, Ille-et-Vilaine, France Randstad Digital France Temps plein

    Randstad Digital est un partenaire technologique de référence qui facilite la transformation numérique des entreprises en fournissant des talents, des capacités de production et des solutions packagées dans des domaines spécialisés. Nos services s'articulent autour des quatre domaines d'expertise suivants : l'expérience client (UX/UI),...


  • Cesson-Sévigné, Ille-et-Vilaine, France Randstad Digital France Temps plein

    Randstad Digital est un partenaire technologique de référence qui facilite la transformation numérique des entreprises en fournissant des talents, des capacités de production et des solutions packagées dans des domaines spécialisés. Nos services s'articulent autour des quatre domaines d'expertise suivants : l'expérience client (UX/UI),...