Doctorant (F/H) Inversion Acoustique Articulatoire Du Conduit Vocal Complet Et Indépendante Du Locuteur
il y a 1 semaine
**Type de contrat**: CDD
**Niveau de diplôme exigé**: Bac + 5 ou équivalent
**Fonction**: Doctorant
**Contexte et atouts du poste**:
**Thématique/Contexte**
Nous avons déjà développé une approche de l’inversion acoustique articulatoire monolocuteur en entraînant l’inversion à partir de données d’IRM temps réel et du signal de parole débruité [1].
**Objectif**
L’objectif est maintenant de développer une inversion multilocuteur complète du conduit vocal. Pour cela nous disposons de données concernant une vingtaine de locuteurs. Ces données sont moins complètes mais elles permettront d’élaborer une procédure de normalisation anatomique pour adapter l’inversion à un nouveau locuteur et de réaliser une adaptation acoustique.
**Environnement**
Nos deux équipes travaillent déjà ensemble étroitement depuis plusieurs années sur la modélisation articulatoire en utilisant intensivement les données de l’IRM dynamique. Nous sommes l’une des équipes les plus en pointe dans l’utilisation de l’IRM temps réel pour le traitement automatique de la parole. Le doctorant pourra disposer des bases de données déjà acquises dans le cadre des projets ANR ArtSpeech (de l’ordre de 10 minutes de parole pour 10 locuteurs) et de celles beaucoup plus de l’ANR Full3DTalkingHead (de l’ordre de 3 heures de parole pour 3 locuteurs). Il sera aussi possible d’acquérir des données complémentaires à l’aide du système d’IRM disponible au laboratoire IADI. Ce projet de doctorat s’appuiera donc sur la coopération actuelle, et bien sûr sur les données et les outils de segmentation que nous avons développés et que nous continuons à améliorer.
L’environnement scientifique des deux équipes est très complémentaire avec une très forte compétence dans tous les domaines de l’IRM et de l’anatomie au sein du laboratoire IADI et de l’apprentissage profond au sein de l’équipe MultiSpeech du Loria. Les deux équipes sont proches géographiquement (1,5 km). Le doctorant aura accès à des moyens techniques (ordinateur, accès aux clusters de calcul) lui permettant de travailler dans de très bonnes conditions. Une réunion de suivi aura lieu chaque semaine et chacune des deux équipes organise un séminaire scientifique hebdomadaire. Le doctorant aura aussi l’occasion de participer à une ou deux écoles d’été et aux conférences en IRM et en traitement automatique de la parole. Il sera aussi aidé pour la rédaction des articles de conférence ou de revue.
Une partie des données concernant l’allemand il est prévu de coopérer avec deux équipes en Allemagne (Universität des Saarlandes et TU Dresden).
**Mission confiée**:
**Travail**
Le travail comportera quatre aspects : (i) l’adaptation anatomique avec ou sans une image IRM statique du nouveau locuteur, (ii) l’adaptation des données acoustiques d’un nouveau locuteur de manière à pour inverser le signal de parole par rapport au modèle construit sur les autres locuteurs, (iii) l’inversion acoustique articulatoire proprement dite (ii) l’évaluation géométrique en mesurant l’écart aux formes du conduit vocal attendues ou l’évaluation à l’aide de variables articulatoires qui correspondent mieux aux informations phonétiques.
La seconde partie du travail portera sur l’adaptation acoustique pour que l’inversion puisse prendre en compte les données acoustiques d’un nouveau locuteur de manière optimale. Cette adaptation doit aussi compenser le fait que les données acoustiques utilisées pour l’apprentissage de l’inversion ont été enregistrées dans un bruit intense (celui de la machine IRM) et qu’elles ont dû être débruitées. L’adaptation acoustique est un thème qui a donné lieu à de nombreux travaux en traitement automatique de la parole et il existe donc plusieurs pistes pour aborder cette question efficacement.
Pour l’inversion elle-même l’approche actuelle repose souvent sur des LSTM bidirectionnels et consiste à retrouver le contour des articulateurs. Il sera possible d’ajouter une information d’attention concernant l’impact phonétique de tel ou tel articulateur pour améliorer la cohérence des résultats de l’inversion.
Le dernier aspect concerne l’évaluation. Il peut s’agir d’une évaluation purement géométrique entre la position du contour attendu et celle du contour retrouvé par inversion. Il peut aussi s’agir d’une évaluation à l’aide de variables articulatoires moins précises mais qui reflètent les propriétés acoustiques attendues.
**Bibliographie**
[1] Azzouz, S., Vuissoz, P.A. and Laprie, Y. 2024. Complete reconstruction of the tongue contour through acoustic to articulatory inversion using real-time MRI data.
[2] Oura, A., Kikuchi, H. and Kobayashi, T. 2024. Preprocessing for acoustic-to-articulatory inversion using real-time MRI movies of Japanese speech. (2024), 1550-1554.
[3] Parrot, M., Millet, J. and Dunbar, E. 2020. Independent and Automatic Evaluation of Speaker-Independent Acoustic-to-Articulatory Reconstruction. _Proceedings of INTERSPEECH 2020, 21st Annual Conference of the International Speech Commun
-
Villers-lès-Nancy, France Inria Temps plein**Type de contrat**: CDD **Niveau de diplôme exigé**: Bac + 5 ou équivalent **Fonction**: Doctorant **Contexte et atouts du poste**: **Contexte** Les méthodes actuelles de synthèse acoustique de la parole multilingue [1] s'appuient sur des représentations statiques des phonèmes, en utilisant des bases de données phonologiques. Bien qu'elles...
-
Doctorant (F/H) Synthèse de La Parole Multilingue
il y a 1 semaine
54600 Villers-lès-Nancy, France Inria Temps plein**Type de contrat **:CDD **Niveau de diplôme exigé **:Bac + 5 ou équivalent **Fonction **:Doctorant **Contexte et atouts du poste**: Cette thèse se place dans le cadre du Défi Inria COLaF "Corpus et Outils pour les Langues de France", dont l’objectif est de créer des corpus, des modèles et des logiciels ouverts et inclusifs pour les langues de...
-
Préparateur de Commande Vocale
il y a 1 semaine
Villers-Bocage, France Samsic Emploi - Villers-Bocage Temps pleinNous recherchons pour société de transport **_, _** **des préparateurs de commandes vocales** à temps complet sur le secteur de Villers-Bocage (14). Voici les tâches qui vont seront demandés: - Traiter les commandes vocales - Monter les produits sur palettes - Filmer les palettes - Reporter les quantités sur bordereaux informatiques - Ranger les...
-
Post-doctorant (F/H) Contrôle Bilinéaire Des Edps
il y a 5 jours
Villers-lès-Nancy, France Inria Temps plein**Type de contrat**: CDD **Contrat renouvelable**: Oui **Niveau de diplôme exigé**: Thèse ou équivalent **Fonction**: Post-Doctorant **Mission confiée**: **Lieu** : Centre Inria de l'Université de Lorraine, Institut Élie Cartan de Lorraine, Nancy, France **Financement** : Projet ANR _QuBiCCs_ **Durée** : 10 mois, renouvelable jusqu’à un total...
-
Enseignant de la Conduite Indépendant
il y a 1 semaine
Nancy, France STYCH Temps pleinSTYCH, c'est le 1 employeur de France d'enseignants de la conduite et de la sécurité routière en France. Nous avons conservé le meilleur de l'auto-école traditionnelle en investissant sur la qualité de notre pédagogie par le biais du digital. Aujourd'hui, nous souhaitons renforcer notre réseau d'enseignants partenaires indépendants en Boîte...
-
Enseignant de la Conduite Indépendant
il y a 1 semaine
Nancy, France STYCH Temps pleinSTYCH est la 1 auto-école digitale de France, avec plus de 70 agences et 560 villes couvertes. Nous avons su garder le meilleur de l'auto-école traditionnelle, tout en modernisant la pédagogie grâce au digital. Aujourd'hui, nous souhaitons renforcer notre réseau d'enseignants partenaires indépendants en Boîte Automatique pour accompagner notre...
-
Chercheur Post Doctorant
il y a 1 semaine
Nancy, France Université de Lorraine Temps plein**À propos de nous**: Et si vous contribuiez au rayonnement d’une université classée dans le top10 des universités françaises ? L’Université de Lorraine forme plus de 62 000 étudiants implantés sur des campus répartis sur 2 métropoles ainsi que 10 villes et agglomérations de son territoire. 7 000 personnels œuvrent à la réussite de ses...
-
Doctorant (F/H) Cifre - Apprentissage Faiblement
il y a 2 semaines
54600 Villers-lès-Nancy, France Inria Temps plein**Type de contrat **:CDD **Niveau de diplôme exigé **:Bac + 5 ou équivalent **Fonction **:Doctorant **Contexte et atouts du poste**: Cette thèse CIFRE s'inscrit dans le cadre d'une collaboration interdisciplinaire entre la société ECHO et les équipes Multispeech et Sémagramme du Centre Inria de l'Université de Lorraine. La mission d'ECHO est...
-
Post-doctorant-e en Géologie
il y a 1 semaine
Nancy, France Université de Lorraine Temps plein**À propos de nous**: L’Université de Lorraine forme plus de 62 000 étudiants implantés sur des campus répartis sur 2 métropoles ainsi que 10 villes et agglomérations de son territoire. 7 000 personnels œuvrent à la réussite de ses missions dont 4000 personnels d’enseignement et de recherche, au sein de 60 unités de recherche structurées et...
-
Villers-lès-Nancy, Grand Est, France Inria Temps pleinType de contrat : CDDNiveau de diplôme exigé : Bac + 5 ou équivalentFonction : DoctorantContexte et atouts du posteThis 3-year PhD position is funded by the prestigious Programme Inria Quadrant (PIQ) for the project DynaNova, which aims to advance our understanding of conformational dynamics and allosteric communication in macromolecular complexes. The...