Label Efficient 3D Detection with Foundation Models
il y a 7 jours
Description du poste **Domaine**: - Mathématiques, information scientifique, logiciel **Contrat**: - Stage **Intitulé de l'offre**: - Label Efficient 3D Detection with Foundation Models H/F **Sujet de stage**: - In this internship, you will contribute to breakthrough research in areas critical to autonomous driving, robotics, and augmented reality. We are addressing the challenge of reducing reliance on costly 3D annotations by exploring cutting-edge techniques. As part of our team, you will: Leverage vision-language models (VLMs) to enhance 3D detection performance. Work on innovative pseudo-labeling techniques to improve model training with mínimal labeled data. Use 2D and 3D feature integration to improve scene understanding. Gain hands-on experience with deep learning frameworks and 3D vision algorithms. **Durée du contrat (en mois)**: - 6 **Description de l'offre**: To address this, various learning paradigms such as semi-supervised[1][2], weakly supervised[3], and unsupervised domain adaptation have been proposed to reduce the need for large amounts of annotated data while maintaining or improving performance. By leveraging mínimal labeled data or even unannotated data, these approaches help reduce the reliance on costly 3D box annotations. Most state-of-the-art methods rely on a teacher-student architecture. A crucial aspect of this approach is pseudo-label filtering, which can be done using two main strategies. One strategy involves untrained heuristics, such as confidence scores produced by detection models, while the other strategy uses uncertainty estimation modules trained on a small set of annotated 3D data. Both of these approaches, however, have limitations. Heuristics can be overly reliant on hyperparameters that may overfit, while uncertainty estimators can prove unreliable. Recent breakthroughs in 2D vision-language models (VLMs) have inspired research in 3D vision, particularly around the potential of these models for pretraining [4][5]. However, despite the promise of VLMs, there is little exploration of their use in the context of semi-supervised, weakly supervised, or unsupervised domain adaptation for 3D object detection. Therefore, we aim to fill this gap by leveraging the power of foundation models for more robust pseudo-label filtering. This could involve using pixel features from the 2D projections of 3D points to calculate intra-object coherence, as well as neighborhood incoherence scores to ensure that objects are correctly detected and isolated. Additionally, 2D features could be used as a pretext for scene completion tasks, providing finer object contours and estimating occluded parts of detected objects.- [1] Zhao, N., et al. (2020). Sess: Self-ensembling semi-supervised 3d object detection. CVPR. [2] Xu, H., et al. (2021, September). Semi-supervised 3d object detection via adaptive pseudo-labeling. ICIP. [3] Yao, B., et al. (2024). Uncertainty-guided Contrastive Learning for Weakly Supervised Point Cloud Segmentation. IEEE Transactions on Geoscience and Remote Sensing. [4] Chen, Zhimin, et al. "Bridging the domain gap: Self-supervised 3d scene understanding with foundation models." NeurIPS 2024 [5] Sirko-Galouchenko, S., et al. (2024). OccFeat: Self-supervised Occupancy Feature Prediction for Pretraining BEV Segmentation Networks. CVPR 2024.- Students in their 5th year of studies (M2 or gap year) Computer vision skills - Machine learning skills (deep learning, perception models, generative AI ) - Python proficiency in a deep learning framework (especially TensorFlow or PyTorch) - Scientific research experience will be appreciated - In line with CEA's commitment to integrating people with disabilities, this job is open to all._ Localisation du poste **Site**: - Saclay **Localisation du poste**: - France, Ile-de-France, Essonne (91) **Ville**: - Palaiseau **Diplôme préparé**: - Bac+5 - Master 2 **Possibilité de poursuite en thèse**: - Oui Informations générales **Entité de rattachement**: Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat. Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs. Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international. Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales: - La conscience des responsabilités - La coopération - La curiosité **Référence **:2024-33196**Description de
-
Object Model-conditioned Image Detection and Segmentation
il y a 7 jours
Palaiseau, France CEA Temps pleinDescription du poste **Domaine**: - Mathématiques, information scientifique, logiciel **Contrat**: - Stage **Intitulé de l'offre**: - Object model-conditioned image detection and segmentation H/F **Sujet de stage**: - During this internship, you will investigate state of the art techniques for detection of objects in images when the CAD model of...
-
Object model-conditioned image detection and segmentation H/F
il y a 2 semaines
Palaiseau, Île-de-France CEA Temps pleinInformations générales Entité de rattachement Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un...
-
Co-Founder — Laser–Materials Processing
il y a 5 jours
Palaiseau, France Lprint Temps pleinJoin to apply for the Co-Founder — Laser–Materials Processing / Materials Physics role at Lprint. LPRINT is a French deep‑tech start‑up, supported by INRIA, X‑Up (École Polytechnique). We are developing an innovative 3D printer for the additive manufacturing of industrial‑grade multilayer printed circuit boards (PCBs). Our mission is to...
-
Exploitation D'un Grand Modèle de Langage Et D'une
il y a 7 jours
Palaiseau, France CEA Temps pleinDescription du poste **Domaine**: - Sciences pour l'ingénieur **Contrat**: - Stage **Intitulé de l'offre**: - Exploitation d'un grand modèle de langage et d'une reconstruction 3D neurale sémantique pour la navi H/F **Sujet de stage**: - Dans le cadre de ce stage, nous proposons d'étudier le domaine du Vision-Language Navigation [1,2,3], domaine...
-
Internship - Develop a 3D Multi-modal Annotation Tool (H/F)
il y a 1 semaine
Palaiseau, France CEA Temps pleinDescription du poste **Domaine**: - Mathématiques, information scientifique, logiciel **Contrat**: - Stage **Intitulé de l'offre**: - Internship - Develop a 3D multi-modal annotation tool H/F **Sujet de stage**: - Develop a 3D multi-modal annotation tool **Durée du contrat (en mois)**: - 6 **Description de l'offre**: - Annotationg in 3D such...
-
Co-Founder, Laser–Materials Processing
il y a 5 jours
Palaiseau, France Lprint Temps pleinA French deep-tech start-up is seeking a Co-Founder specializing in Laser–Materials Processing and Materials Physics to lead materials and process development. This role requires a PhD in relevant fields and hands-on experience with pulsed lasers. You'll collaborate on advanced manufacturing processes to innovate in electronics fabrication. Equity in the...
-
Internship - Develop a 3D multi-modal annotation tool H/F
il y a 6 jours
Palaiseau, Île-de-France CEA Temps pleinInformations générales Entité de rattachement Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un...
-
Palaiseau, Île-de-France Thales Temps pleinLieu : Palaiseau, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus...
-
Palaiseau, France École nationale supérieure de techniques avancées Temps pleinTopic description Alors que les avancées des modeles vision langage impactent la robotique car ils sont exploités pour la planification des taches compositionnelles, ils butent contre le manque d'incarnation des actions physiques des LLMs et de leur mauvais capacité pour la planification long-terme afin d'accomplir des taches compositionnelles. Une autre...
-
Palaiseau Polytechnique, France Thales Temps pleinLieu : Palaiseau, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus...