Stage Data Scientist
il y a 2 semaines
PRESENTATION DE CHAPSVISION
Fondé en 2019, ChapsVision est un
éditeur de logiciels en pleine croissance
, membre du NEXT40 de la French Tech parmi les 40 start-ups françaises les plus prometteuses.
Avec 1200 collaborateurs et plus de 1000 clients grands comptes et régaliens, nous avons pour ambition de devenir un leader européen du traitement souverain de la donnée.
Notre objectif est de poursuivre notre développement en renforçant nos équipes
pour concevoir, commercialiser, déployer et supporter des produits innovants de plus en plus ambitieux.
Parallèlement, notre engagement social se manifeste à travers la
fondation
HappyCap, adossée au groupe, qui vise à soutenir les enfants atteints de troubles de développement mental et cognitif et leurs familles.
CONTEXTE DU POSTE
Vous rejoignez l'équipe spécialisée en NLP et extraction d'information, dont les travaux sont au cœur des solutions de renseignement, d'analyse et de structuration de la donnée de ChapsVision.
Le stage porte sur un défi émergent : la
Relation Resolution
, un nouveau sous-domaine du NLP visant à aligner des relations extraites automatiquement (OpenIE) avec des schémas d'ontologies, ou à induire ces schémas à partir d'un corpus.
Vous travaillerez à la frontière entre extraction d'information, clustering, embeddings sémantiques et ontologies, en vous appuyant sur la littérature récente
VOS FUTURES MISSIONS
- Réaliser un état de l'art sur l'OpenIE, l'alignement d'ontologies et la Relation Resolution
- Concevoir une pipeline capable de mapper des relations OpenIE vers un schéma ontologique existant
- Implémenter et tester différentes approches : similarité d'embeddings, heuristiques graphe, clustering, LLM léger…
- Développer une méthode de génération automatique d'un schéma relationnel depuis un corpus
- Étudier l'utilisation de techniques frugales (modèles spécialisés, règles, agents SLM) pour améliorer la précision à moindre coût
- Documenter les résultats et proposer des pistes d'intégration dans les pipelines produits
LES COMPETENCES ET QUALITES QUE NOUS RECHERCHONS
- Intérêt pour le NLP, l'extraction d'information ou les ontologie
- Bon niveau en Pytho
- Connaissances souhaitées : embeddings, clustering, graphes, KG
- Curiosité, autonomie, bon esprit d'analyse
CE QUE NOUS OFFRONS À NOS
STAGIAIRES
Carte SWILE : 10€ / jour pris en charge à 60%
Transport en commun : Pris en charge à 50%
Télétravail : 3 jours/semaine maximum avec une indemnité de 26 euros par mois
NOTRE PROCESS DE RECRUTEMENT
Un entretien téléphonique avec l'un de nos recruteurs techniques pour faire connaissance.
Un échange avec votre futur tuteur pour évaluer vos compétences et discuter du déroulement de votre futur stage.
Tous nos postes sont ouverts aux personnes en situation de handicap.
Bibliograhie :
- Liu, P. et al – A Survey on Open Information Extraction from Rule-based Model to Large Language Model. arXiv:
Latest broad survey on OpenIE, covering rule-based, neural and LLM-based approaches.
Link: arXiv
- Bian, H – LLM-empowered knowledge graph construction: A survey. arXiv:
Systematic review of how LLMs are used for (semi-)automatic KG/ontology construction across schema design, extraction, and fusion.
Link: arXiv
- Vashishth, S., Jain, P., & Talukdar, P – CESI: Canonicalizing Open Knowledge Bases Using Embeddings and Side Information. WWW 2018.
Canonicalizes OpenIE-style triples (entities + relations) via embeddings and side information; classic reference for relation/entity clustering.
Link: GitHub
- Dash, S., Rossiello, G., Mihindukulasooriya, N., Bagchi, S., & Gliozzo, A – Open Knowledge Graphs Canonicalization using Variational Autoencoders. EMNLP 2021.
Proposes CUVA, a VAE-based joint model for entity and relation canonicalization in open KGs.
Link: ACL Anthology
- Lomaeva, M., & Jain, N – Relation Canonicalization in Open Knowledge Graphs: A Quantitative Analysis. ESWC 2022 Satellite Events.
Focuses specifically on relation canonicalization, with quantitative analysis and datasets built from OpenIE relations.
Link: OUCI
-
Stage Data Scientist
il y a 14 heures
Paris, Île-de-France un emploi de Stage Data Scientist chez Mirakl Temps pleinAbout MiraklMirakl is the leading provider of eCommerce software solutions. Mirakl's suite of solutions provides enterprises with a transformative way to drive significant growth and efficiency in their online business. Since 2012, Mirakl has been pioneering the platform economy, empowering retail and b2b enterprises with the most advanced, secure and...
-
Data Scientist H/F
il y a 2 semaines
Paris, Île-de-France Data sea Temps pleinÀ propos du posteNous recherchons un data scientist ou une data scientist passionné(e) par l'analyse des données et l'intelligence artificielle. Vous intégrerez une équipe dynamique et innovante, où vous aurez l'opportunité de travailler sur des projets stimulants qui impactent directement notre activité. Votre rôle consistera à extraire, analyser...
-
Stage Data Scientist
il y a 5 jours
Paris, Île-de-France La French Tech Taiwan Temps pleinOffres d'emploiLes SecteursIndustrieNumériqueSantéTransition écologiqueAgricultureRejoindre la Mission French TechDécouvrir les métiers de la TechStage Data ScientistParisStagePostulerÀ proposA proposMirakl est le leader des solutions logicielles pour le e-commerce. Nous offrons aux entreprises une suite unique de solutions leur permettant de...
-
Consultant Data Scientist
il y a 2 semaines
Paris, Île-de-France JICAP Performance Temps pleinStage (de mars à juillet 2026)Fondé en 2016, JICAP Performance est un cabinet de conseil spécialisé dans l'amélioration de la performance achats et la transformation des fonctions achats.Nous vous proposons de nous rejoindre en tant que stagiaire avec un quotidien et une feuille de route comparable à un Consultant Data ScientistEn rejoignant...
-
Stage Data Scientist
il y a 2 semaines
Paris, Île-de-France Groupe iliad Temps pleinChez Free, tu trouveras uneculture interne singulièreet très marquée. Il règne un fort état d'esprit collectif. Le recrutement est ouvert, sans a priori : on ne juge les gens ni sur leur âge, ni sur leur background.On aime aller vite, faire les choses nous-mêmes, et on mise sur l'autonomie pour être efficace. Tu verras : chez Free, on se sentlibre...
-
Stage Data Scientist
il y a 5 jours
Paris, Île-de-France Mirakl Temps pleinMirakl est le leader des solutions logicielles pour le e-commerce. Nous proposons aux entreprises une suite unique de solutions leur permettant de transformer significativement leur activité digitale afin d'accélérer de façon durable et rentable leur croissance.Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus...
-
Stage – Data Scientist AI for Business Optimization
il y a 2 semaines
Paris, Île-de-France BNP Paribas Temps pleinStage – Data Scientist AI for Business Optimization - H/F - 6 MoisVotre rôle au quotidienPACE (Partners in Action for Customer Experience) est une équipe de 120 collaborateurs transverse aux activités de banque de détail et de services financiers spécialisés (crédit aux particuliers, courtage…) de BNP Paribas.En France et à l'international,...
-
Data scientist
il y a 14 heures
Paris, Île-de-France Collective Temps pleinDans le cadre du renforcement d'une équipe dédiée à la modélisation mathématique, le client recherche un Data Scientist Senior (>5 ans d'expérience) pour intervenir sur un ensemble de sujets variés : optimisation, simulation, analyse de performance, développement de modèles et d'outils applicatifs.La prestation s'inscrit dans un environnement...
-
Data Scientist
il y a 1 semaine
Paris, Île-de-France AP-HP Temps plein1. CONTEXTE ET SPÉCIFICITÉSL'URC (Unité de Recherche Clinique) de l'hôpital européen Georges-Pompidou (HEGP) est en charge de l'organisation et la mise en œuvre de la recherche hospitalière pour les sites HEGP, Corentin-Celton et Vaugirard. Elle est rattachée à la DRCI (Direction de la Recherche Clinique et de l'Innovation) située à l'Hôpital...
-
Data Scientist Sénior
il y a 5 jours
Paris, Île-de-France Kéoni Consulting Temps pleinContexte : Experience : 5 ans et plus Métiers Fonctions : Data Management, Data Scientist Spécialités technologiques : APIs, Simulation, Optimisation linéaire, Devops MISSIONS Dans le cadre du renforcement d?une équipe dédiée à la modélisation mathématique, le client recherche un Data Scientist Senior (>5 ans d?expérience) pour intervenir sur un...