Obfuscation de Données Parole Multi-utilisateurs Pour La Science Reproductible

il y a 1 jour


SaintMartind'Hères, France Université Grenoble Alpes Temps plein

**Obfuscation de données parole multi-utilisateurs pour la science reproductible // Multi-User Speech Data Obfuscation for Reproducible Science**:

- Réf **ABG-132152**
**ADUM-66214**
- Sujet de Thèse
- 23/05/2025
- Université Grenoble Alpes
- Lieu de travail- Saint-Martin-d'Hères - Auvergne-Rhône-Alpes - France
- Intitulé du sujet- Obfuscation de données parole multi-utilisateurs pour la science reproductible // Multi-User Speech Data Obfuscation for Reproducible Science
- Champs scientifiques- Informatique
- Mots clés- Confidentialité de la voix, Intelligence Artificielle, Deep Learning, Modèles à diffusion, Modèles Flow-Matching
Voice Privacy, Artificial Intelligence, Deep Learning, Diffusion models, Flow-matching models

**Description du sujet**:

- La science reproductible est un enjeu majeur actuel, permettant une contribution plus impactante dans la communauté scientifique, avec vérification et reproduction des résultats, accélérant ainsi les connaissances. Cela est important en intelligence artificielle mais également pour les recherches en sciences humaines et sociales. Aujourd'hui, la science reproductible se limite souvent au partage de codes, de modèles pré-entrainés ou aux publications, ce qui est insuffisant. En Europe et en France, la mise à disposition de données scientifiques à la communauté fait face à des problématiques éthiques et légales liées aux données personnelles régies par le RGPD et la CNIL. Les données audio/vidéo sont identifiantes par nature, soumises à un protocole avec le DPO pour leur stockage et partage. Sur ces données, la pseudonymisation insuffisante ou impossible, l'anonymisation est complexe et manuelle. Sans anonymisation, le partage nécessite l'accord de tous les participants, avec traçabilité et possibilité de suppression sur demande. La conservation des données est limitée dans le temps, nécessitant un nouvel accord ou destruction après expiration. Ces garde-fous, bien que nécessaires, compliquent fortement le partage des données audiovisuelles et impactent la reproductibilité de la science.
Dans le cadre de nos actions autour de nos salles de classe sensibles au contexte, le Teaching Lab, et de nos collaboration entre des équipes de recherche de laboratoires de Mathématiques Appliquées, de Sciences Sociales et d'lnformatique que sont les Laboratoires LaRAC, et Techné (Poitiers), et de nos partenaires à l'International (CADT au Cambodge, MICA au Vietnam), nous nous intéressons à analyser les événements pédagogiques en traitant des séquences audiovisuelles enregistrées lors de cours à l'Université. Ces enregistrements contiennent donc des informations identifiantes sur les étudiants et les enseignants présents, principalementleurs visages et leurs voix. Ce projet vise à collecter des enregistrements longitudinaux de cours permettant une analyse (semi)automatique des pratiques pédagogiques et de l'engament des étudiants,analyse qui sera corréléeà leur progressionlors d'évaluations régulières. Plus que nos besoins de recherche, ces enregistrements contiennent des informationsprécieusespour d'autres chercheurs dans d'autres domaines en Intelligence Artificielle mais également en Sciences Sociales.
Fort de ce constat, pour pouvoir partager ces données, cette étude doctorale s'intéresse à l'anonymisation automatique de la voix («Voice Privacy») pour développer à terme un réseau de neurones open-source pour la communauté. Pour partager nos données en conservant la richesse de celles-ci, il est important de ne pas altérer ni les intonations, ni les émotions dans la voix, la pertinence de l'analyse réalisées sur ces données anonymisées étant conditionnée à la présence de ces informations.Ces recherches s'apparentent à un outil de substitution des informations personnelles par des informations similaires mais, dans notre cas, non identifiantes. Les verrous scientifiques à lever résident dans l'approche «in the wild», c'est-à-dire des enregistrements faits à distance dans des conditions réelles et comprenant plusieurs locuteurs (jusqu'à une classe entière) là où les systèmes actuels ne sont entraînés que sur une seule voix à anonymiser.

Within the framework of our context-aware classroom initiatives, the Teaching Lab, and collaborations between research teams in Applied Mathematics, Social Sciences, and Computer Science, specifically the LaRAC and Techné laboratories (Poitiers), as well as international partners (CADT in Cambodia, MICA in Vietnam), we focus on analyzing educational events through the processing of audiovisual sequences recorded during university lectures. These recordings inherently contain identifying information about students and instructors, primarily their faces and voices. This project aims to collect longitudinal lecture recordings to enable (semi-)automatic analysis of teaching practices and student engagement, which will be correlated with their progress during regular assessments. Beyond our own research needs, these recordings contain valuable in



  • 38400 Saint-Martin-d'Hères, France Université Grenoble Alpes Temps plein

    Type de recrutement: Poste ouvert en CDD - Quotité de travail: 100% - Niveau d'emploi: A - IGE - Ingénieur d'études - Durée du contrat: 1 an - Localisation: GRICAD IMAG 700 Avenue centrale 38400 Saint Martin d'Hères Présentation de la structure Grâce au projet ANR ExcellencES intitulé GATES (Grenoble ATtractiveness and ExcellenceS/Attractivité et...


  • Saint-Martin-d'Hères, France INRAE Temps plein

    38402 Saint Martin d' Hères _ **RETOUR À LA LISTE DES RÉSULTATS** **Présentation INRAE**: L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et...


  • Saint-Martin-d’Hères, Auvergne-Rhône-Alpes, France Choisir le Service Public Temps plein

    Informations générales Organisme de rattachement CNRS   Référence UMR5216-CHRROM-038   Date de début de diffusion /01/2026 Date de parution /01/2026 Date de fin de diffusion /02/2026 VersantFonction Publique de l'Etat CatégorieCatégorie A (cadre) Nature de l'emploiEmploi ouvert uniquement aux contractuels Domaine / MétierNumérique -...


  • Saint-Martin-d'Hères, France Université Grenoble Alpes Temps plein

    Type de recrutement: Poste ouvert en CDD - Quotité de travail: 100% - Durée du contrat: Du 01 octobre 2025 au 30 septembre 2026 - Localisation: LIG 700 Avenue centrale 38400 Saint Martin d'Hères Présentation de la structure Les 450 membres du LIG (enseignants, chercheurs permanents, doctorants, personnel administratif et technique) sont répartis sur...


  • Saint-Martin-d'Hères, France Grenoble-INP Temps plein

    **À propos de nous**: L’OSUG est une structure fédérative assurant des missions d’observation, de recherche, de formation et de diffusion des savoirs, et œuvre dans tous des domaines des Sciences de l’Univers, de la Terre et de l’Environnement - de l’écologie alpine à l’astronomie en passant par la géophysique, l’hydrologie, la...


  • Saint-Martin-d'Hères, France INRAE Temps plein

    Présentation INRAE Présentation INRAEL’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE...


  • La Celle-Saint-Cloud, France EIB de La Jonchère Temps plein

    **A propos de l'EIB Le Jonchère**: La mission de l'école EIB La Jonchère est de joindre la rigueur académique ligne du programme national français dans un enseignement bilingue français-anglais. Les sciences et la technologie sont enseignées en anglais tout en suivant le programme français. L'EIB La Jonchère fait partie du groupe Glodeducate. L'EIB...


  • Saint-Denis, France Haute autorité de Santé Temps plein

    **Emploi repère**: Chef de projet **Type de contrat**: Contrat à durée indéterminée - temps complet **Localisation**: Saint-Denis (93), au pied du RER B La Plaine-Stade de France **Description du poste à pourvoir**: **Direction et service d'affectation**: Direction générale Mission Data Rattachée au directeur général, la mission data est une...


  • Saint-Martin-d'Hères, France INRAE Temps plein

    Présentation INRAE — L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement — est un établissement public de recherche regroupant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi...


  • Saint-Martin-d'Hères, France Ville de Saint-Martin-d'Hères Temps plein

    La commune de Saint-Martin-d’Hères est la 2ème ville du département de l’Isère (38500 habitants). Elle est au cœur du développement de nombreux projets et accueille le Domaine Universitaire avec près de 50 000 étudiants et employés. Ville dynamique, innovante et solidaire, attachée à un service public de qualité, efficiente et ancrée dans la...