Stage en Apprentissage Automatique Et Web Sémantique Pour La Découverte de Jeux de Données

il y a 20 heures


Sophia Antipolis, France Inria Temps plein

**Type de contrat**: Stage

**Niveau de diplôme exigé**: Bac + 4 ou équivalent

**Fonction**: Stagiaire de la recherche

**A propos du centre ou de la direction fonctionnelle**:
L’Inria est l’Institut national de recherche en sciences du numérique, dont le centre Inria d’Université Côte d’Azur fait partie. Avec une forte expertise en informatique et mathématiques appliquées, les projets de recherche du centre Inria d’Université Côte d’Azur touchent toutes les dimensions des sciences et technologies du numérique, et génèrent de l’innovation. Implanté principalement à Sophia Antipolis, mais également à Nice ou Montpellier, il regroupe 47 équipes de recherche et neuf services d’appui. Il est présent dans les domaines de l’intelligence artificielle, la science des données, la sécurité des systèmes informatiques, la robotique, l’ingénierie de réseaux, la prévention des risques naturels, la transition écologique, la biologie numérique, les neurosciences computationnelles, les données de santéLe Centre Inria d’Université Côte d’Azur est un acteur majeur en termes d'excellence scientifique par les résultats obtenus et les collaborations tant au niveau européen qu'international.

**Contexte et atouts du poste**:
Une multitude de jeux de données en libre accès — qu’ils soient textuels, audio, vidéo ou tabulaires — est aujourd’hui disponible pour un large éventail de tâches en apprentissage automatique, et leur nombre ne cesse de croître à un rythme soutenu. Si cette abondance représente une véritable opportunité, elle soulève également des difficultés croissantes pour les praticiens — qu’ils soient issus du monde académique ou industriel — qui peinent à identifier les ressources les plus adaptées à leurs besoins, faute d’outils de navigation suffisamment performants.

Cette complexité résulte à la fois de la diversité des formats et contenus disponibles, et du manque de dispositifs capables d’orienter efficacement les utilisateurs dans un écosystème en constante expansion. La situation est d’autant plus critique que les systèmes d’intelligence artificielle (IA), en plein essor, s’appuient largement sur ces jeux de données pour leur entraînement et leur évaluation.

Actuellement, deux principaux obstacles freinent l’accès à l’information pertinente:
D’une part, les jeux de données sont souvent décrits par des métadonnées incomplètes, hétérogènes ou mal normalisées, rendant leur contenu difficile à évaluer.
- D’autre part, les moteurs de recherche disponibles reposent principalement sur des requêtes par mots-clés, ce qui suppose une connaissance préalable du domaine et produit des résultats souvent peu contextualisés.

Dans le cadre du projet **DataLens**, des résultats préliminaires ont été obtenus, notamment en matière de normalisation, de structuration et d’exploration des jeux de données. Un premier aboutissement concerne le développement d’un prototype dédié à la découverte de jeux de données, combinant une approche de recherche à facettes avec des techniques de visualisation interactive. Un second résultat porte sur l’harmonisation et la structuration des données issues du dépôt HuggingFace, à travers l’alignement des métadonnées avec des vocabulaires standards. Cela a conduit à la conception et à la mise en place d’un graphe de connaissances (CG), visant à faciliter l’intégration interopérable des métadonnées provenant de sources hétérogènes.

**Mission confiée**:
Le stage a pour objectif d’**enrichir et d’étendre un graphe de connaissances (CG)** existant, en y intégrant des informations relatives aux **jeux de données** et aux **modèles d’apprentissage automatique** associés (issus notamment de **HuggingFace**, **Kaggle**, ou **PapersWithCode**).
L’enjeu est de **renforcer l’interopérabilité**, la **structuration** et la **découvrabilité** des ressources, en combinant des approches de **web sémantique**, de **normalisation de métadonnées**, et d’**apprentissage automatique**.

**Principales activités**:

- Étudier la structure actuelle du graphe de connaissances développé dans le cadre du projet DataLens.
- Intégrer les informations relatives aux modèles d’IA associés aux jeux de données du catalogue HuggingFace.
- Définir et implémenter les relations pertinentes entre modèles et jeux de données (ex. _isTrainedOn_, _hasEvaluationDataset_, _usesArchitecture_).
- Concevoir une taxonomie des tâches d’apprentissage automatique (classification, génération, traduction, etc.) selon un schéma SKOS.
- Intégrer cette taxonomie au graphe de connaissances pour améliorer la recherche par type de tâche.
- Mettre en œuvre des techniques de normalisation des étiquettes via des méthodes d’entity linking (Wikidata, DBpedia).
- Développer un pipeline automatique de correspondance entre champs et sources de données hétérogènes.
- Expérimenter des modèles d’apprentissage automatique (réseaux neuronaux, transformers) pour compléter les métadonnées manquantes.
- Concevoir des tests d’évaluation de la complétion (précision, rappel, F



  • Sophia Antipolis, France Inria Temps plein

    **Type de contrat **:CDD **Niveau de diplôme exigé **:Bac + 5 ou équivalent **Fonction **:Doctorant **A propos du centre ou de la direction fonctionnelle**: Le centre Inria d'Université Côte d'Azur regroupe 37 équipes de recherche et 8 services d’appui. Le personnel du centre (500 personnes environ) est composé de scientifiques de différentes...


  • Sophia Antipolis, Provence-Alpes-Côte d'Azur, France Ampere Software Technology Temps plein

    Contexte Et Environnement De TravailRenault poursuit son engagement au travers de la formation par l'alternance et les stages. Cette politique volontariste positionne Renault comme un des contributeurs majeurs au développement de l'apprentissage en France. Dans le cadre de votre stage, vous serez suivi pat le service Emploi, compétences et Poitique Jeunes...

  • Rédacteur Web

    il y a 1 semaine


    Sophia Antipolis, France Feel and clic Temps plein

    **Lieu** : Sophia-Antipolis (06) **Durée** : 6 mois **Niveau** : Bac+3 à Bac+5 (Communication, Marketing, Journalisme, Lettres, Web) **Disponibilité** : Dès que possible **Gratification** : 800 - 1000€ / mois en fonction du profil **À propos de Feel and Clic** Feel and Clic est une agence digitale spécialisée en création de sites web, SEO, UX/UI...


  • Sophia Antipolis, France Inria Temps plein

    **Type de contrat**: CDD **Niveau de diplôme exigé**: Bac + 5 ou équivalent **Fonction**: Doctorant **Niveau d'expérience souhaité**: Jeune diplômé A propos du centre ou de la direction fonctionnelle Le centre Inria d'Université Côte d'Azur regroupe 37 équipes de recherche et 8 services d’appui. Le personnel du centre (500 personnes environ)...


  • Sophia Antipolis, France Thales Temps plein

    **QUI SOMMES-NOUS ?** L’activité Systèmes de missions de défense fournit des équipements, des solutions et des services liés aux systèmes de combat électroniques, de surveillance et de reconnaissance, de combat naval, de surface et de lutte sous la mer. Le site de Sophia-Antipolis développe des sonars à destination des sous-marins et des...


  • Sophia Antipolis, Provence-Alpes-Côte d'Azur, France Thales Temps plein

    Lieu : Sophia Antipolis, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et...


  • Sophia Antipolis, France Centre de Mise en Forme des Matériaux (CEMEF) Temps plein

    **Stage ArcelorMittal Maizières Research SA Modélisation des transformations de phase multiples en présence de liquide**: - Réf **ABG-126741** - Stage master 2 / Ingénieur- Durée 6 mois- Salaire net mensuel SMIC- 07/11/2024- Centre de Mise en Forme des Matériaux (CEMEF)- Lieu de travail- Sophia Antipolis Provence-Alpes-Côte d'Azur France- Champs...


  • Sophia Antipolis, France Inria Temps plein

    **Type de contrat**: CDD **Niveau de diplôme exigé**: Bac + 5 ou équivalent **Fonction**: Doctorant **A propos du centre ou de la direction fonctionnelle**: L’Inria est l’Institut national de recherche en sciences du numérique, dont le centre Inria d’Université Côte d’Azur fait partie. Avec une forte expertise en informatique et...


  • Sophia Antipolis, France Centre de Mise en Forme des Matériaux (CEMEF) Temps plein

    **Stage: Modélisation des évolutions microstructurales dans les lingots réalisés par procédé VAR**: - Réf **ABG-126740** - Stage master 2 / Ingénieur- Durée 6 mois- Salaire net mensuel SMIC- 07/11/2024- Centre de Mise en Forme des Matériaux (CEMEF)- Lieu de travail- Sophia Antipolis Provence-Alpes-Côte d'Azur France- Champs scientifiques-...


  • Sophia Antipolis, France Centre de Mise en Forme des Matériaux (CEMEF) Temps plein

    **Stage ArcelorMittal Maizières Research SA Modélisation des transformations de phase multiples en présence de liquide**: - Réf **ABG-134713**- Stage master 2 / Ingénieur- Durée 4 mois- Salaire net mensuel smic- - 08/12/2025- Centre de Mise en Forme des Matériaux (CEMEF)- Lieu de travail- Sophia Antipolis Provence-Alpes-Côte d'Azur France- Champs...