Critéres D'importance Supervisés Pour L'apprentissage Statistique à Grande échelle
il y a 3 jours
**Critéres d'importance supervisés pour l'apprentissage statistique à grande échelle // Supervised importance criteria for large-scale learning**:
- Réf **ABG-132258**
**ADUM-66109**
- Sujet de Thèse
- 28/05/2025
- Université Grenoble Alpes
- Lieu de travail- Saint Martin d'Hères cedex - Auvergne-Rhône-Alpes - France
- Intitulé du sujet- Critéres d'importance supervisés pour l'apprentissage statistique à grande échelle // Supervised importance criteria for large-scale learning
- Champs scientifiques- Informatique
- Mots clés- Méthodes à noyau, Sélection de points
Kernel methods, Inducing points selection
**Description du sujet**:
- Cette thèse s'intéresse au développement de méthodes d'apprentissage supervisé
non-paramétriques utilisables sur de grands volumes de données. Les méthodes à
noyaux constituent un formalisme puissant pour définir des modèles
d'apprentissage non
- paramétriques ; elles sont largement utilisées en pratique,
et leurs propriétés théoriques ont été amplement étudiées [1]. Toutefois, leur
coût calculatoire limite fortement leur intérêt pour une utilisation sur de
larges vo
- lumes de données. Une technique standard pour réduire ce coût est
d'utiliser des approximation matricielles de faible rang randomisées. Le
principal exemple d'une telle approximation est la méthode de Nyström [2]
(égale
- ment appelée approximation CUR), dont la définition repose sur le choix
d'un sous-échantillon représentatif du jeu de données. Ce dernier peut être tiré
aléatoirement de manière uniforme, mais une meilleure approximation est
généralement obtenue en échantillonnant les données proportionnellement aux
scores d'importances (leve
- rage scores) des observations. Ces derniers peuvent
s'interpréter comme une mesure de l'importance relative de chaque point au sein
du jeu de données, et possèdent un rôle important également en théorie de
l'approxi
- mation [3] ou pour la détection de valeurs aberrantes.
L'approximation de Nyström basée sur cette technique d'échantillonnage permet de
construire des estimateurs qui, p.ex. sur un problème comme la régression ridge
à noyau, ont un taux d'erreur optimal [4] tout en ayant un coût de calcul
limité. Toutefois, bien que largement utilisés pour des problèmes
d'apprentissage supervisé, les scores d'importance ne dépendent pas de la
variable expliquée ; p.ex. pour un problème de régression ou l'on cherche à
identifier une relation de la forme = () à partir d'observations (,
)1, les scores d'importance ne dépendent que des points ()1 mais pas
des mesures ()1, et une partie de l'information est donc ignorée dans la
construction de l'approximation. En outre, leur calcul est connu pour être
relativement coûteux, ce qui limite leur intérêt en pratique et appelle au
développement d'algorithmes d'échantillonnage approchés.
Les deux axes proposés pour cette thèse sont les suivants:
- Critères d'importance supervisés - La première direction de recherche consiste
en la définition de critères d'importance pour des problèmes d'apprentissage
supervisés. En partant d'un problème largement étudié comme la régression ridge
à noyau, nous proposerons de nouveaux critères d'importance tirant parti de
l'information issue de la variables expliquée. Nous quantifierons la qualité de
l'approximation induite, et étudierons les performances empiriques de la méthode
proposée. Ces travaux s'inspireront de la littérature existante sur la
construction de coresets par sous-échantillonnage, ou la notion de sensitivité
joue un rôle proche des scores d'importances [5].
- Algorithmes d'échantillonnage - Le calcul de scores d'importance étant connu
pour être particulière
- ment coûteux, il conviendra de s'intéresser également au
développement d'algorithmes efficaces permettant d'échantillonner
proportionnellement aux scores d'importance supervisés nouvellement introduits.
Pour ce
- la, nous nous appuierons sur les algorithmes itératifs existants dans
le cas non supervisé [6]. Nous nous intéresserons également au développement
d'algorithmes distribués.
This thesis focuses on the development of non-parametric supervised on large volumes of data. Kernel methods are a powerful formalism for defining non-parametric learning models; they are widely used in practice, and their theoretical properties have been extensively studied [1]. However, their computational cost severely limits their suitability for use on large data sets. A standard technique for reducing this cost is to use randomized low-rank matrix approximations. The main example of such an approximation is Nyström's method [2] (also called CUR approximation). (also known as the CUR approximation), whose definition is based on the choice a representative sub-sample of the dataset. The latter can be drawn uniformly, but a better approximation is generally obtained by obtained by sampling the data in proportion to the importance scores leve
- rage scores of the observations. The latter can be be interpreted as a measure of the relative importa
-
Psychologue (H/F)
il y a 2 jours
Saint-Claude, France OPPELIA Passerelle 39 Temps pleinL’association Oppelia recrute Pour sa structure Oppelia Passerelle 39 basée dans le Jura / Saint-Claude Un-e Psychologue (H/F) En CDI à temps partiel (à 0,50 ETP) Poste à pourvoir dès que possible au sein de son Centre de Soins, d’Accompagnement et de Prévention en Addictologie (CSAPA). Convention Collective 1966. Notre Centre de Soins,...
-
CHEF DE PARTIE 39 h H/F
il y a 2 semaines
Saint-Herblain, Pays de la Loire, France carrément Boeuf Temps pleinNous recherchons, afin de compléter notre équipe, un chef de partie H/F 39 h. Nous proposons une cuisine 100% maison.Vous serez amené à tourner sur les différents postes froid et chaud pour vous familiariser avec la carte et l'équipe de cuisine.Ouvert du lundi au samedi, midi et soir. Repos le dimanche et 3 1/2 journées et soirées par semaine.Type...
-
Audioprothésiste - St-Claude 39 H/F
il y a 11 heures
Saint-Claude (39200), France Audika Temps pleinNotre situé à St-Claude (39) recherche actuellement un AudioprothésisteH/F pour nous rejoindre en CDI - Temps complet ou partiel - dès que possible ! Sous la responsabilité du Responsable de Secteur et en binôme avec un Coordinateur de centre, vous participez à la vie du centre et intervenez pour : - Procéder à l'appareillage de vos patients-clients...
-
Operateur Impression Grand Format
il y a 18 heures
38400 Saint-Martin-d'Hères, France KAZAO Temps pleinNous recrutons **UN(E) OPERATEUR(TRICE) IMPRESSION GRAND FORMAT** Pour accompagner notre croissance, nous recrutons un opérateur impression grand format H/F capable, au sein d’une équipe de 6 personnes, de fabriquer des supports de communication grand format à savoir bâches, adhésifs, PVC ou encore Plexi. **Vos missions en atelier**: -...
-
Audioprothésiste - St-Claude 39 H/F
il y a 3 semaines
Saint-Claude, France Audika Temps pleinNotre situé à St-Claude (39) recherche actuellement un AudioprothésisteH/F pour nous rejoindre en CDI - Temps complet ou partiel - dès que possible ! Sous la responsabilité du Responsable de Secteur et en binôme avec un Coordinateur de centre, vous participez à la vie du centre et intervenez pour : - Procéder à l'appareillage de vos patients-clients...
-
Apprentissage - Chargé D'études Statistiques (F/H)
il y a 1 semaine
Saint-Denis, France CAF DE LA SEINE-SAINT-DENIS Temps plein**Apprentissage - Chargé d'études statistiques F/H**: - Contrat d'apprentissage (alternance) - Saint-Denis - NIVEAU 1 - NVHADD99073 **CAF DE LA SEINE-SAINT-DENIS**: La Caf de la Seine-Saint-Denis est un organisme de taille importante qui remplit ses missions de Service Public en faveur de 390 000 allocataires avec l'appui de près de 1000 salariés dans un...
-
Fontainier Polyvalent
il y a 1 semaine
Saint-Amour, France SOGEDO Temps plein**SOGEDO** assure depuis 4 générations la gestion des services publics d’eau et d’assainissement. Indépendante, la société a su conservé, dans le temps, une structure à taille humaine. Depuis 1954, SOGEDO met à la disposition de ses clients, les structures techniques, commerciales et administratives nécessaires pour assurer le bon...
-
Enseignant-chercheur Associé en Mathématiques Appliquées
il y a 19 heures
Saint-Martin-d'Hères, France Université Grenoble Alpes Temps pleinQuotité de travail: 50% - Durée du contrat: Du 01 novembre 2025 au 31 octobre 2028 - Localisation: UFR IM2AG IMA F 60 Rue de la chimie 38400 Saint Martin d'Hères Présentation de la structure L’Unité de Formation et de Recherche en Informatique, Mathématiques et Mathématiques Appliquées de Grenoble accueille chaque année environ 950 étudiants de...
-
Rhumatologue F/H
il y a 4 jours
Saint-Étienne, France Joseph Sebban Temps pleinEmploi Rhumatologue Saint-Etienne 42000 La Solution Médicale Centre Médical à Saint-Etienne 42000, recherche activement un Rhumatologue (F/H). Avantages du poste : - Assurance professionnelle, formations régulières... - Aucun frais d'intermédiation pour le praticien - Statut salarié en CDI de 2 à 5 jours - Rémunération 39% CA + 10% de CP - Horaires...
-
Pédiatre F/H
il y a 4 jours
Saint-Étienne, France Joseph Sebban Temps pleinEmploi Pédiatre Saint-Etienne 42000 | La Solution Médicale Centre Médical à Saint-Etienne 42000, recherche activement un Pédiatre (F/H). Avantages du poste : - Assurance professionnelle, formations régulières... - Aucun frais d'intermédiation pour le praticien - Statut salarié en CDI de 2 à 5 jours - Horaires flexibles à convenance -...