Emplois actuels liés à Doctorant F/H Description automatisée de scènes audio explicable et frugale - Paris - INRIA

Post-doctorant (F/H) Traitement Automatique de La Parole, Deep Learning, Ia Frugale

il y a 2 semaines

Paris, France Inria Temps plein

**Type de contrat**: CDD **Contrat renouvelable**: Oui **Niveau de diplôme exigé**: Thèse ou équivalent **Fonction**: Post-Doctorant **Niveau d'expérience souhaité**: De 3 à 5 ans **Mission confiée**: Ce poste concerne le groupe de recherche Parole&Audio d’Inria Défense&Sécurité. Il est composé d’une dizaine de personnes, réparties...
Doctorant (F/H) Détection Et Clustering de La

Il y a 7 mois

Paris, France Inria Temps plein

**Type de contrat **:CDD **Niveau de diplôme exigé **:Bac + 5 ou équivalent **Fonction **:Doctorant **Contexte et atouts du poste**: Inria Défense&Sécurité (Inria D&S) a été créé en 2020 pour fédérer les actions d’Inria répondant aux besoins numériques des forces armées et forces de l’intérieur. La thèse sera réalisée au sein de...
Chief Audio Transactions Lawyer

il y a 4 semaines

Paris, Île-de-France Audio Temps plein

Job DescriptionWe are seeking a highly skilled and experienced lawyer to join our team as a Chief Audio Transactions Lawyer. This role will play a crucial part in shaping the future of sound innovation and excellence in product design.The ideal candidate will have a strong academic background in civil and business law, with substantial experience in handling...
Senior Legal Advisor for Audio Solutions

il y a 4 semaines

Paris, Île-de-France Audio Temps plein

Job DescriptionWe are seeking a highly skilled Senior Legal Advisor to join our team at Audio, where you will play a crucial role in ensuring the successful implementation of our audio solutions. Your expertise in contract management and employment law will be invaluable in navigating complex legal matters.About UsAuditory innovation meets artistic...
Place Audio Recherche Un Assistant Administratif

il y a 5 jours

Paris, France Place Audio Paris Temps plein

Place Audio recherche un Assistant administratif H/F ! **VOS MISSIONS** - Accueil des clients, des prestataires et des collaborateurs - Gestion du standard téléphonique (transfert, prise de rendez-vous, message, filtrage des appels) - Traitement du courrier et des colis, et affranchissement - Saisie de données administratives - Rédactions de documents...
Audio Lead

Il y a 3 mois

Paris, France Lionbridge Temps plein

Paris, Île-de-France, France**Job Title**: Audio Lead **Location**: Paris, France **Salary**: 25,000 - 35,000 EUR per month **Audio Lead** As an Audio Lead at Lionbridge Games, you will be responsible for managing and coordinating all aspects of audio production for video games, focusing on dubbing and voiceover work. You will oversee casting,...
Audio Project Manager

il y a 4 jours

Paris, France Lionbridge Technologies Temps plein

**Audio Project Manager** Lionbridge Game Services is currently seeking to find an Audio Production **Responsibilities**: - Creating casting selections from our database or organize live castings in collaboration with the audio team and artistic directors - Creating and distributing recording schedules related to ongoing productions - Booking artists and...
Stage en Caractérisation de Scènes Et

il y a 1 mois

Paris, France Inria Temps plein

**Type de contrat **:Stage **Niveau de diplôme exigé **:Bac + 4 ou équivalent **Autre diplôme apprécié **:de M2 en IA, mathématiques, mathématiques appliquée ou informatique ou équivalent, avec une forte motivation pour la recherche appliquée. **Fonction **:Stagiaire des fonctions support **Contexte et atouts du poste**: L’objectif du stage...
Doctorant (H/F)

Il y a 4 mois

Paris 5e, France CNRS Temps plein

Cette offre est disponible dans les langues suivantes: - Français - Anglais Date Limite Candidature : jeudi 3 octobre 2024 23:59:00 heure de Paris **Informations générales**: **Intitulé de l'offre **:doctorant (H/F) au PMMH** Référence : UMR7636-FREAUG-051 Nombre de Postes : 1 Lieu de travail : PARIS 05 Date de publication : jeudi 12 septembre...
[CDI] Le Groupe Paradiso Media – Binge Audio recrute un·e directeur·ice de clientèle

il y a 2 jours

Paris, France BINGE AUDIO Temps plein

Quand ? Poste à pourvoir à partir d’avril 2024Où ? Paris, 6 Villa Marcel Lods (19e)Comment ? CDI ー Convention collective de la production audiovisuelleCombien ? Rémunération en part fixe et part variable ー Avantages : forfait mobilités durables, carte titres restaurants Swile, mutuelle AlanDescription de l’entrepriseLe groupe Paradiso Media –...
Doctorant (H/F)

Il y a 4 mois

Paris 13e, France CNRS Temps plein

Cette offre est disponible dans les langues suivantes: - Français - Anglais Date Limite Candidature : mardi 17 septembre 2024 23:59:00 heure de Paris **Informations générales**: **Intitulé de l'offre **:Doctorant (H/F) - Mécanisme moléculaire de la régulation de l’AMPK par le signal « glucose » chez la levure S. cerevisiae** Référence :...
(H/F) Doctorant en Biologie

Il y a 3 mois

Paris 5e, France CNRS Temps plein

Cette offre est disponible dans les langues suivantes: - Français - Anglais Date Limite Candidature : vendredi 25 octobre 2024 23:59:00 heure de Paris **Informations générales**: **Intitulé de l'offre **:H/F Doctorant en Biologie** Référence : UMR8197-VALHER-134 Nombre de Postes : 1 Lieu de travail : PARIS 05 Date de publication : vendredi 4 octobre...
Post-doctorant ou Post-doctorante en Informatique

Il y a 6 mois

Paris, France Institut Mines-Télécom Temps plein

**Présentation de Télécom SudParis**: Télécom SudParis est une grande école publique d'ingénieurs reconnue au meilleur niveau des sciences et technologies du numérique. La qualité de ses formations est basée sur l’excellence scientifique de son corps professoral et une pédagogie mettant l’accent sur les projets d’équipes, l’innovation de...
Doctorant en Biologie Cellulaire

Il y a 4 mois

Paris 13e, France CNRS Temps plein

Cette offre est disponible dans les langues suivantes: - Français - Anglais Date Limite Candidature : mercredi 25 septembre 2024 23:59:00 heure de Paris **Informations générales**: **Intitulé de l'offre **:Doctorant en biologie cellulaire (H/F)** Référence : UMR7592-PAUCON-008 Nombre de Postes : 1 Lieu de travail : PARIS 13 Date de publication :...
Doctorant (H/F)

il y a 1 mois

Paris 6e, France CNRS Temps plein

Cette offre est disponible dans les langues suivantes: - Français - Anglais Date Limite Candidature : vendredi 20 décembre 2024 23:59:00 heure de Paris **Informations générales**: **Intitulé de l'offre **:Doctorant (H/F) en biologie structurale in-cell par RMN** Référence : UMR8038-FRATHE-002 Nombre de Postes : 1 Lieu de travail : PARIS 06 Date de...
Audio Tech Lead

Il y a 6 mois

Paris, France Enchanted Tools Temps plein

**Change the face of robotics with us.** At Enchanted Tools, we are bringing a new generation of robots to life. Combining world-class engineering expertise and the power of imagination, we plan to make everyone’s life better with robotic characters, by tackling concrete issues and needs. Why you should join us: - You will have a unique opportunity to...
Localisation Et Estimation de La Taille de Dommages Dans Des Structures Composites Via L’apprentissage Profond Explicable Et Physiquement Interprétable

il y a 4 semaines

Paris, France Arts et Metiers ParisTech Temps plein

**Localisation et estimation de la taille de dommages dans des structures composites via l’apprentissage profond explicable et physiquement interprétable**: - Réf **ABG-127501** - Stage master 2 / Ingénieur - Durée 6 mois - Salaire net mensuel 609 € - 10/12/2024 - Arts et Metiers ParisTech - Lieu de travail- Paris Ile-de-France France - Champs...
Conseiller de Vente Audio/son

Il y a 3 mois

Paris, France Impact Sales & Marketing Temps plein

Entreprise: **Athéna**, filiale du groupe MARVESTING, un des leaders du Field Marketing en Europe, poursuit son développement avec les hommes et les femmes de talent qui l’accompagnent. Au service de grandes entreprises et des jeunes pousses en devenir, nous mettons en place des solutions assurant la performance commerciale et marketing...
Conseiller de Vente Audio/son

Il y a 6 mois

Paris, France Impact Sales & Marketing Temps plein

Entreprise: **Athéna**, filiale du groupe MARVESTING, un des leaders du Field Marketing en Europe, poursuit son développement avec les hommes et les femmes de talent qui l’accompagnent. Au service de grandes entreprises et des jeunes pousses en devenir, nous mettons en place des solutions assurant la performance commerciale et marketing...
Conseiller de Vente Audio/son

Il y a 7 mois

Paris, France Impact Sales & Marketing Temps plein

Entreprise: **Athéna**, filiale du groupe MARVESTING, un des leaders du Field Marketing en Europe, poursuit son développement avec les hommes et les femmes de talent qui l’accompagnent. Au service de grandes entreprises et des jeunes pousses en devenir, nous mettons en place des solutions assurant la performance commerciale et marketing...

Doctorant F/H Description automatisée de scènes audio explicable et frugale

Il y a 7 mois

Paris, France INRIA Temps plein

Contexte et atouts du poste

Inria Défense&Sécurité (Inria D&S) a été créé en 2020 pour fédérer les actions d’Inria répondant aux besoins numériques des forces armées et forces de l’intérieur. La thèse sera réalisée au sein de l’équipe de recherche en traitement de l’audio de Inria D&S, sous la direction de Jean-François Bonastre et co-encadrée par Raphaël Duroselle.

La description automatisée de scènes audio consiste à présenter aux opérateurs un condensé des informations présentes dans la scène en question, sous la forme d’un texte augmenté. Ce condensé permet de faire ressortir de façon synthétique et visuelle les informations les plus importantes, tout en structurant efficacement l’accès aux informations précises. Pour illustrer ce point, un condensé pourrait prendre la forme suivante : « Dans cet enregistrement d’une durée de cinq minutes, trois locuteurs différents sont présents. Le locuteur A correspond à une identité connue dans la base de données et s’exprime en Français avec un fort accent du Monawa, les locuteurs B et C sont inconnus dans la base de données et s’expriment en Français dans leurs interactions avec A et dans une langue non identifiée lorsqu’ils parlent ensemble. Les voix de B et C présentent de fortes similitudes avec les locuteurs de la région du Quabar oriental. Le thème général de l’enregistrement concerne un transfert de marchandises entre les villes de Orienta et de Flagrance. La date du 8 Juillet 2023 est citée à trois reprises ». En cliquant sur A, l’opérateur disposera des informations sur A et sur les détails de l’identification vocale réalisée. L’accès aux segments temporels pendant lesquels A a parlé et à la transcription de ceux-ci sera direct. Dans cette transcription, les noms de personnes, de lieux ou les dates (les entités nommées) seront mises en évidence.

Mission confiée

Objectif

La thèse vise à proposer un cadre général pour le traitement des enregistrements audio dans le cadre du renseignement. Elle consiste à définir une application de haut niveau adaptée aux besoins des utilisateurs finaux promouvant la présentation d’un enregistrement sous la forme d’un rapport synthétique pour mettre en évidence les points saillants.

Approche

L’approche visée s’inspire à la fois de la description textuelle de scènes vidéo [1] et sur les systèmes de dialogue reposant sur des scènes audio-visuelle [2]. Le système reposera sur l’extraction de représentations du signal de parole à différentes échelles (trame, segment de parole ou événement sonore, enregistrement complet), éventuellement dédiées à des tâches différentes. Les représentations, utiles aux différentes briques technologiques du système seront des embeddings extraits de réseaux de neurones profonds, génériques [3] ou dédiés à chaque tâche. La fusion entre les différents niveaux d’information pourra être réalisée avec une architecture s’inspirant du schéma « Encodeur-Decodeur » multi-stream [4], avec plusieurs encodeurs produisant des séquences de représentations et un ou plusieurs décodeurs réalisant les tâches ou sous-tâches nécessaires au système. Un de ces décodeurs produira un descriptif textuel de la scène.

Des directions de recherche potentielles, visant à dépasser un système de description de scènes audio par assemblage de briques existantes, pourront être discutées et affinées avec le candidat.

Principales activités

Etat de l’art, constitution d’un système de description de scènes audio par assemblage des outils existants ; Définition de la tâche, élaboration d’un corpus et d’un protocole d’évaluation ; Travail sur l’alignement entre des représentations auto-supervisées du signal de parole et des grands modèles de langage ; Entraînement faiblement supervisé du système ; Evaluation des systèmes et confiance dans les prédictions.

Compétences

Master 2 ou diplôme d’école d’ingénieur en informatique, mathématiques appliquées ou phonétique, Intérêt marqué pour la recherche appliquée, Maîtrise de l’anglais parlé et écrit, Connaissances en traitement du signal, Connaissances en apprentissage automatique de manière générale et dans les approches neuronales (deep learning) en particulier, Connaissance pratique d’outils comme Pytorch, Keras ou Scikit-learn, Expérience en traitement automatique de la parole, dont la connaissance de plateformes open-source comme Kaldi ou Speechbrain.

Références

[1] Aafaq, N., Mian, A., Liu, W., Gilani, S. Z., & Shah, M. . Video description: A survey of methods, datasets, and evaluation metrics. ACM Computing Surveys (CSUR), 52, 1-37.

[2] Hori, Chiori, Huda Alamri, Jue Wang, Gordon Wichern, Takaaki Hori, Anoop Cherian, Tim K. Marks, et al. « End-to-End Audio Visual Scene-Aware Dialog Using Multimodal Attention-Based Video Features ». In ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2352‑56. Brighton, United Kingdom: IEEE, 2019. [3] Zhang, C., & Tian, Y. (2016, December). Automatic video description generation via lstm with joint two-stream encoding. In 2016 23rd International Conference on Pattern Recognition (ICPR) (pp. 2924-2929). IEEE.

[4] Pratap, Vineel, Andros Tjandra, Bowen Shi, Paden Tomasello, Arun Babu, Sayani Kundu, Ali Elkahky, et al. 2023. « Scaling Speech Technology to 1,000+ Languages ». arXiv.

Avantages

Restauration subventionnée, Transports publics remboursés partiellement, Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement), Possibilité de télétravail (2 jours par semaine) et aménagement du temps de travail, Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.), Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria), Accès à la formation professionnelle,

Rémunération

Année 1 & 2 = 2082 € bruts mensuels

Année 3 = 2190 € bruts mensuels

Amériques

Europe

Asie / Océanie

Afrique

Emplois actuels liés à Doctorant F/H Description automatisée de scènes audio explicable et frugale - Paris - INRIA

Doctorant F/H Description automatisée de scènes audio explicable et frugale