Doctorat détection automatique multimodale des disfluences typiques du bégaiement
il y a 7 jours
1. Introduction Le bégaiement, trouble de la fluence affectant des millions de personnes, se caractérise par des disfluences spécifiques (blocages, prolongations, répétitions) liées à un dysfonctionnement du contrôle moteur de la parole. Leur détection automatique, bien que déjà explorée via des modèles audios, reste limitée par une faible robustesse, une difficulté à identifier certaines disfluences comme les blocages silencieux, et une dépendance à des données rares. Cette thèse propose une approche multimodale (audio, vidéo, texte) pour améliorer la précision et la robustesse de la détection, en s’appuyant sur un corpus audiovisuel de locuteurs francophones bègues. L'analyse reposera sur des techniques d'encodage spécifiques à chaque modalité, suivies d'une fusion stratégique de leurs représentations pour une classification finale. 2. Missions L’objectif de cette thèse est de concevoir, développer et évaluer une approche multimodale d’apprentissage profond pour la détection automatique des disfluences typiques du bégaiement en français, en combinant les modalités audio, vidéo et textuelle. Le travail s’appuiera sur un corpus audiovisuel annoté de locuteurs francophones bègues, avec une attention particulière portée aux disfluences difficiles à détecter par l’audio seul, comme les blocages silencieux, et à la robustesse face à la variabilité individuelle. Les missions du doctorant s’articuleront autour des axes suivants : Encodage audio : Implémenter et adapter Stutternet (Sheikh, S. A., Sahidullah, M., Hirsch, F., & Ouni, S. – 2021- Stutternet: Stuttering detection using time delay neural network. In EUSIPCO) pour extraire des caractéristiques acoustiques pertinentes à la détection de disfluences, en capturant les dépendances temporelles. Encodage vidéo : Développer et entraîner des modèles de vision (par exemple C3D ou Transformers) pour analyser les séquences vidéos à la recherche d’indices visuels du bégaiement (tensions faciales, clignements, mouvements atypiques). L’extraction de landmarks faciaux (avec OpenFace ou MediaPipe) sera également explorée comme source complémentaire ou alternative de caractéristiques. Encodage texte : Générer des transcriptions automatiques (via Whisper) et les encoder à l’aide de modèles de langage pré-entraînés (BERT, RoBERTa) afin d’extraire le contexte linguistique et de repérer des schémas textuels caractéristiques des disfluences. Fusion multimodale : Mettre en œuvre et comparer plusieurs stratégies de fusion des représentations issues des trois modalités, telles que la concaténation, les mécanismes d’attention adaptatifs ou d’autres approches exploitant la complémentarité des données. Classification et évaluation : Développer un classifieur opérant sur la représentation fusionnée pour prédire la présence ou l’absence de bégaiement dans une fenêtre temporelle donnée. L’évaluation s’appuiera sur des métriques standards (précision, rappel, F1-score, AUC), avec une comparaison aux annotations manuelles expertes. Des analyses qualitatives seront également menées pour interpréter les erreurs du modèle et affiner l’approche. Au-delà de la détection, la thèse vise à apporter une contribution méthodologique au domaine de la fusion multimodale appliquée à la parole pathologique, avec un potentiel impact en contexte clinique. 3. Compétences attendues Le candidat devra avoir un master en informatique, de solides compétences en apprentissage automatique et profond, une bonne maîtrise de Python et des frameworks comme PyTorch ou TensorFlow, ainsi qu’un intérêt pour le traitement du signal (audio/vidéo) et, idéalement, pour le NLP. Autonomie, rigueur, esprit critique et capacités d’analyse sont indispensables, tout comme de bonnes compétences en communication pour évoluer dans un environnement pluridisciplinaire. Un intérêt pour la phonétique, la linguistique et les troubles de la parole, en particulier le bégaiement, sera un plus. Contexte de travail Le doctorant sera impliqué dans un projet de recherche pluridisciplinaire associant deux laboratoires complémentaires : le LORIA, spécialisé en informatique, avec une expertise en traitement de la parole et en apprentissage profond, et PRAXILING, laboratoire en sciences du langage reconnu pour ses travaux en phonétique et sur le bégaiement. La recherche s’appuiera sur un corpus audiovisuel existant et annoté de locuteurs francophones présentant des troubles de la fluence. La thèse sera encadrée conjointement par des chercheurs en informatique et en sciences du langage, assurant une co-supervision interdisciplinaire. Elle se déroulera principalement au LORIA, à Nancy, avec des séjours réguliers au laboratoire Praxiling, à Montpellier, pour avoir des échanges scientifiques et enrichir l’approche de la problématique par une double expertise. Contraintes et risques Déplacements (pris en charge) à prévoir entre les deux laboratoires porteurs du projet.
-
Vanduvre-lès-Nancy, Grand Est, France Choisir le Service Public Temps pleinInformations générales Organisme de rattachement CNRS Référence UMR5267-IVADID-002 Date de début de diffusion /12/2025 Date de parution /12/2025 Date de fin de diffusion /01/2026 VersantFonction Publique de l'Etat CatégorieCatégorie A (cadre) Nature de l'emploiEmploi ouvert uniquement aux contractuels Domaine / MétierRecherche -...
-
Villers-lès-Nancy, Grand Est, France Inria Temps pleinType de contrat : CDDNiveau de diplôme exigé : Bac + 5 ou équivalentFonction : DoctorantContexte et atouts du posteIntroductionLe bégaiement, trouble de la fluence affectant des millions de personnes, se caractérise par des disfluences spécifiques (blocages, prolongations, répétitions) liées à un dysfonctionnement du contrôle moteur de la parole....
-
Saint-Paul-lès-Durance, Provence-Alpes-Côte d'Azur, France CEA Temps pleinInformations générales Entité de rattachement Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un...
-
Nancy, Grand Est, France Centre de Recherche en Automatique de Nancy ( CRAN ) Temps pleinHow to ensure sufficient data richness for the estimation of stochastic dynamical systems in finite time?Réf ABG-134446Sujet de Thèse18/11/2025Contrat doctoralCentre de Recherche en Automatique de Nancy ( CRAN )Lieu de travailNancy - Grand Est - FranceIntitulé du sujetHow to ensure sufficient data richness for the estimation of stochastic dynamical...
-
Postdoc (H/F)
il y a 2 semaines
Vanduvre-lès-Nancy, Grand Est, France Choisir le Service Public Temps pleinInformations générales Organisme de rattachement CNRS Référence UMR7503-JEAMAR-003 Date de début de diffusion /12/2025 Date de parution /12/2025 Date de fin de diffusion /12/2025 VersantFonction Publique de l'Etat CatégorieCatégorie A (cadre) Nature de l'emploiEmploi ouvert uniquement aux contractuels Domaine / MétierRecherche -...
-
Stagiaire équipe R&d
il y a 1 semaine
Nancy, France Zhortech Temps pleinNous avons obtenu plusieurs distinctions lors de salons comme le CES à Las Vegas ou l’ISPO à Munich qui ont récompensé nos innovations : semelle chauffante, smartshoe, semelle connectée pour la course et le cyclisme,... Notre croissance rapide nous permet d’être présents dans plus de 20 pays. Dans le cadre de nos activités nous proposons...
-
Saint-Paul-lès-Durance, France Cea Temps pleinLe groupe expertise (GEX) du DCET de la DIMP a notamment pour mission le soutien aux installations du CEA de Cadarache sur les problématiques incendie. Les installations du CEA sont équipées de système détection automatique d’incendie. La réglementation requière que le niveau de performance d’une installation de détection automatique incendie...
-
Technicien Assurance Qualité
il y a 2 jours
Laneuveville-devant-Nancy, France NOVACARB (du groupe Humens) Temps pleinDans le cadre d'un remplacement pour congé maternité / parental, nous recherchons un(e) Coordinateur / Coordinatrice Qualité pour rejoindre notre service Qualité Produit. Rattaché(e) à la Responsable Qualité et intégré(e) à une équipe de 5 personnes, vous prenez en charge un périmètre de (multi)produits destinés notamment au secteur...
-
Analyste N3 SOC
il y a 4 heures
Nancy, France EDF Temps plein**Description de l'offre**: Au croisement d’enjeux essentiels et captivants, rejoignez un groupe à la dimension internationale, champion de la croissance bas carbone et activement engagé dans la lutte contre le réchauffement climatique ! Rejoindre EDF, c’est également travailler dans un Groupe porteur de valeurs fortes, qui innove avec de solides...
-
Stagiaire R&d
il y a 1 semaine
Nancy, France Zhortech Temps pleinStage : Estimation de l'âge et détection de pathologies basée sur l'analyse de la marche à l'aide d'approches d'apprentissage automatique L’entreprise Zhortech, basée à Nancy, développe des solutions intégrant des capteurs positionnés au sein des chaussures. Les algorithmes embarqués ont pour objectif de mesurer l’activité des utilisateurs au...