Stages - Data Science

il y a 1 semaine


Labège, France Alteia Temps plein

Vous rejoindrez nos bureaux à Toulouse au sein d'une équipe de data scientists spécialisée en deep learning, traitement d'images et géomatique, dédiée à la R&D sur notre plateforme delair.ai. L'équipe se concentre sur l'analyse de données variées, comme des images de drones, des nuages de points LIDAR et des modèles CAO.

**Ce que vous allez acquérir**:

- L'opportunité de travailler sur un projet à fort impact qui contribuera directement à l'efficacité de nos opérations.
- Un mentorat assuré par des professionnels expérimentés en IA/ML.
- Un environnement de travail collaboratif qui valorise la créativité, l'innovation et le développement professionnel.

Différentes thématiques peuvent être envisagées selon votre profil:
**Développement d’un modèle de génération de graphes de scènes à partir de nuages de points 3D**

**Contexte du projet**:
Pour améliorer nos procédures de traitement des nuages de points, nous souhaiterions participer à faire progresser l’état de l’art en matière de compréhension holistique des scènes 3D. La génération de graphes de scènes est une tâche complexe nécessitant au préalable une compréhension sémantique (classification), panoptique (instanciation) puis relationnelle des objets dans l’espace. La plupart des méthodes existantes exploitent des corpus d’images projetées en 3D afin d’accomplir cette tâche en tirant profit des modèles de fondation 2D tels que CLIP, SAM ou LLaVa. Nous avons identifié deux problèmes nous empêchant d’utiliser ces méthodes dans nos procédures. D’abord, ces méthodes sont inapplicables aux nuages de points directement car les _backbones _utilisées fonctionnent uniquement à partir d’images. Ensuite, il n’existe pas à notre connaissance de _benchmark_ sur lequel évaluer une méthode de génération de graphes de scènes conçues pour les nuages de points 3D de scènes extérieures. Nous nous proposons donc de développer une méthode adaptée aux scènes extérieures capturées par LiDAR ainsi que le premier _benchmark_ pour cette tâche.

**Mission / Objectifs du stage**:

- A partir des méthodes de segmentation panoptique déjà existantes en 3D, développer un modèle de génération de graphes de scènes par apprentissage supervisé sur des nuages de points 3D.
- Produire un _benchmark_ de génération de graphes de scènes à partir du _benchmark _de nuages de points 3D en scènes extérieures DALES.
- Évaluer les performances de notre modèle sur ce _benchmark_
- Identifier les limites de notre méthode ainsi que les possibles pistes d’amélioration.
- Méthodes de génération de graphes basées 2D:

- Méthodes de segmentation panoptique basées 3D:

- Benchmark en 3D:
**Développement de système de questions-réponses basées sur des LLM**

**Contexte du projet**:
Nous recherchons un stagiaire en IA/ML hautement motivé pour participer au développement d'un système interne de questions-réponses basé sur un Large Language Model (LLM). Ce système utilisera notre vaste base de connaissances interne pour fournir des réponses précises et contextuelles aux questions des employés, rationalisant ainsi la communication et améliorant la productivité dans tous les départements.

**Mission / Objectifs du stage**:

- Collaborer avec notre équipe IA/ML pour concevoir et développer un système basé sur un LLM avec RAG et MCP capable de comprendre et de répondre aux questions à partir de notre base de connaissances interne.
- Prétraiter, nettoyer et organiser les données de la base de connaissances interne afin de les optimiser pour l'entraînement du LLM.
- Ajuster les modèles LLM existants pour les adapter à la terminologie, aux processus et aux connaissances spécifiques de l'entreprise.
- Tester et évaluer les performances du système, en mettant en œuvre des améliorations basées sur les retours et les résultats des tests.
- Documenter le processus de développement, y compris les défis, solutions et bonnes pratiques.
- Travailler en étroite collaboration avec des équipes interfonctionnelles pour comprendre leurs besoins et s'assurer que le système basé sur le LLM répond à leurs exigences.
- LASER Blog
- Literature survey on low rank approximation of matrices
- QLoRA: Efficient Finetuning of Quantized LLMs
- LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS
- The Truth is in There: Improving Reasoning in Language Models with Layer-Selective Rank Reduction (LASER)

**Modèle de fondation pour la gestion de la végétation par LiDAR**

**Contexte du projet**:
Notre équipe développe des modèles d’intelligence artificielle appliqués à la gestion de la végétation à partir de données LiDAR. Nous avons déjà en production un modèle de classification de nuages de points utilisé dans ce domaine. Toutefois, l’entraînement de notre réseau reste complexe et dépend fortement de données annotées, alors que de vastes bases de données open source existent mais sont souvent non labellisées

**Mission / Objectifs du stage**:
L’objectif du stage est d’explorer l’utilisation de méthodes de pré-entraînement semi-supervisées ou n


  • Stage de Fin D’études

    il y a 3 jours


    31670 Labège, France KRATOS COMMUNICATIONS Temps plein

    Kratos recrute un stagiaire en Data Science pour rejoindre notre équipe à Labège afin de participer à un projet novateur. L'objectif est de concevoir un système de surveillance intelligente en temps réel de séries temporelles, appliqué à des données issues du secteur spatial. **Description du stage**: Vous serez chargé de concevoir et...

  • Stage de Fin D’études

    il y a 3 jours


    31670 Labège, France KRATOS COMMUNICATIONS Temps plein

    Nous recherchons un stagiaire en Data Science pour renforcer notre équipe à Labège. Ce stage de 6 mois vous offrira l'opportunité de travailler sur un sujet de pointe : les Large Language Models (LLM). **Description du stage**: Les LLM représentent une avancée majeure dans le domaine de la data science et de l'intelligence artificielle, transformant...

  • Data Engineer

    il y a 1 semaine


    Labège, France Alteia Temps plein

    **Job Summary**: Alteia is seeking a talented and passionate **Data Engineer** to join our dynamic team. In this role, you will be instrumental in designing, building, and maintaining robust and scalable data pipelines specializing in complex geospatial and 3D data. Collaborating closely with our data science team, you will be a key driver in optimizing our...

  • Stage de fin d'études

    il y a 2 semaines


    Labège, Occitanie, France KRATOS COMMUNICATIONS Temps plein

    Nous recherchons un stagiaire passionné par l'intelligence artificielle et les modèles de langage (LLM) pour rejoindre notre équipe à Labège.Ce stage de 6 mois vous offrira l'opportunité de travailler sur des technologies de pointe.Description du stageLes agents IA et les LLM redéfinissent la manière dont les systèmes interagissent avec les données...

  • Formateur Data Marketing

    il y a 1 jour


    Labège, France MBway Temps plein

    **À propos de nous** IPAC Bachelor Factory Toulouse, école reconnue pour ses formations Bac+3 d recherche un-e formateur-rice expérimenté-e pour accompagner nos étudiants du Bachelor Événementiel & Communication. **Missions principales** - Animer le module Data Marketing & Performance Online en blended-learning (21 h de présentiel) - Organiser 6...

  • Data Scientist

    il y a 1 semaine


    31670 Labège, France MODEL RH Temps plein

    **MODEL RH** est une société d’études économiques dont la mission est d’anticiper les métiers, compétences et formations de demain dans de nombreux secteurs. Nos clients sont les filières professionnelles, l'État et les grandes écoles qui cherchent à décrypter les enjeux économiques pour anticiper leurs investissements RH et formation. -...

  • Stage - Data Analyst

    il y a 6 jours


    Labège, France Skyted Temps plein

    Chez **Skyted**, start-up pionnière dans la tech, nous repoussons chaque jour les limites de l’innovation pour améliorer la manière dont nous communiquons au quotidien. **Notre mission ?** Offrir aux _"nouveaux nomades"_ — voyageurs en train, avion ou taxi — ainsi qu’aux professionnels des open-spaces et call centers, des solutions...

  • Stage - Data Analyst (H/F)

    il y a 1 semaine


    Labège, France Lyra Temps plein

    **À propos de nous**: **Vous êtes-vous déjà demandé ce qu'il se passe au moment où vous validez votre paiement en magasin ou en ligne ?** C’est (en partie) Lyra, qui se cache derrière ! Comment ? En sécurisant vos transactions et en s'assurant qu'elles transitent. Nos solutions s’adaptent à tous les besoins paiement (marketplace, mobilité,...

  • Data Scientist

    il y a 1 semaine


    Labège, France Adelyce SAS Temps plein

    **Data Scientist (H/F) en alternance** **Adelyce, la petite boîte qui monte** Editeur **français, indépendant,**basé à Toulouse, Adelyce est **leader** du pilotage de la masse salariale publique. Sa mission : contribuer à une meilleure gestion de l’argent public. **Sérieux sans se prendre au sérieux** Forte de son savoir-faire à la pointe de...

  • Stage Développeur Python

    il y a 1 semaine


    Labège, Occitanie, France Lyra Temps plein

    À propos de nousVous êtes-vous déjà demandé ce qu'il se passe au moment où vous validez votre paiement en magasin ou en ligne ?C'est (en partie) Lyra, qui se cache derrière Comment ? En sécurisant vos transactions et en s'assurant qu'elles transitent. Nos solutions s'adaptent à tous les besoins paiement (marketplace, mobilité, omnicanalité,...