Stage Data Scientist
il y a 3 jours
Description de l'entreprise
Rejoindre LINCOLN, c’est rejoindre un cabinet de conseil **reconnu** pour son expertise data depuis plus de 30 ans, en proposant des prestations d’expertise, de conseil et d’accompagnement en Modern BI et Big Data.
Vous progresserez au sein d’une équipe de plus de **360** experts de l'environnement Cloud.
Vous intégrerez le Lab Lincoln et son équipe pluridisciplinaire qui vous encadrera et vous fera progresser durant vos 6 mois de stage.
Description du poste
**Projet**: Identifier et localiser les différents éléments d'un document scanné, stocker et structurer l'information.**
Les entreprises peuvent posséder un important patrimoine de document scannés. Leur exploitation est complexe, car leur qualité est variable et les outils de recherche informatiques sont très peu efficaces sur ce type d’information. Dans le but d’améliorer leur exploitation, il faut être en mesure d’identifier leur contenu, tant dans la forme que dans le fond.
Les méthodes d’OCR permettent d’extraire assez facilement le texte de ces documents, mais pas leur structure, et cela présente des complexités pour les exploiter (recherche d’information, mise en correspondance de valeurs issues de tableaux).
L’objectif de ce stage est de construire un package python disposant de différentes fonctionnalités d’extraction de structure de document, afin de construire un ensemble de métadonnées au plus proche de la réalité du document.
Afin de parvenir à réaliser cet objectif, il faudra construire un pipeline de traitement adapté à tout type de document.
Les éléments importants de ce projet seront les suivants:
- Identification des différents éléments dans un document : tableaux, figures, signatures, pagination
- Veille technique et méthodologique en lien avec la problématique
- Choix des outils et algorithmes adaptés
- Labellisation des données
- Implémentation et validation des algorithmes
- Construction des pipelines de traitement
- Refactoring et packaging des codes
Un ensemble de plusieurs centaines de documents (contenant plusieurs pages) de contenus variés sera mis à disposition pour mettre en place et évaluer les performances des traitements implémentés.
Vous serez amené(e) à travailler dans le cloud (Azure).
Déroulement du stage:
- Mise en place des environnements
- Analyse et exploration de la base documentaire
- Construction des objectifs du package (méthodologie + cible)
- Mise en œuvre de la méthodologie (labellisation, entraînement, évaluation)
- Packaging des codes, rédaction de documentation
**Qualifications**:
- Curiosité et force de proposition
- Intérêt pour le domaine
- Profil Ecole d'ingénieur
- Appétence pour les problématiques Data Science.
- Bonne connaissance de la programmation en Python
- Niveau d'anglais suffisant pour la compréhension d'articles scientifiques
Informations supplémentaires
Un stage réussi débouchera sur un CDI vous permettant d'intégrer Lincoln et de participer au développement de notre activité conseil en Data science.
-
Stage Data Scientist
il y a 1 semaine
Paris, Île-de-France un emploi de Stage Data Scientist chez Mirakl Temps pleinAbout MiraklMirakl is the leading provider of eCommerce software solutions. Mirakl's suite of solutions provides enterprises with a transformative way to drive significant growth and efficiency in their online business. Since 2012, Mirakl has been pioneering the platform economy, empowering retail and b2b enterprises with the most advanced, secure and...
-
Stage Data Scientist
il y a 1 semaine
Paris, Île-de-France un emploi de Stage Data Scientist chez Mirakl Temps pleinAbout MiraklMirakl is the leading provider of eCommerce software solutions. Mirakl's suite of solutions provides enterprises with a transformative way to drive significant growth and efficiency in their online business. Since 2012, Mirakl has been pioneering the platform economy, empowering retail and b2b enterprises with the most advanced, secure and...
-
Data Scientist
il y a 7 jours
Paris, France MP Data Temps pleinBonjour, MP DATA est une Société de Conseil à taille humaine spécialisée dans le traitement et la valorisation des données des entreprises depuis 2015. Partenaire de confiance d'entreprises du CAC40 sur leur transformation Data / IA, notre société accompagne ses clients sur tout le territoire français (bientôt Européen) sur des projets...
-
Data Scientist Nlp
il y a 5 jours
Paris 1er, France MP DATA Temps pleinPassionné(e) par **les use-cases NLP** ? Rejoins notre Équipe d'experts dans la **data/l'IA spécialisés en NLP** (plus d'une vingtaine de cas d'usages !). **MP DATA**, c'est une équipe de **70 Experts** **Data (Data Scientists, Data Engineers, Data Architects, ML Engineers) **qui accompagne les plus grands groupes français sur des projets d'IA très...
-
Data Scientist
il y a 3 jours
Paris, France MP Data Temps pleinBonjour, MP DATA est une société de Conseil spécialisée dans la transformation numérique des entreprises. Dans le cadre de son développement, MP DATA, recrute un(e) Data scientist ayant un intérêt pour le domaine des jumeaux numériques, afin de travailler pour un acteur de classe mondiale, dans le domaine de l'industrie. Profil : Ingénieur Grande...
-
Data Scientist
il y a 5 jours
Paris 2e, France MP DATA Temps pleinPassionné(e) par **l'IA appliquée au domaine de la santé**? Rejoins notre Équipe d'experts dans la **data/l'IA spécialisée dans le HealthCare** (plus de 30 cas d'usages !) basée dans le Sud-Ouest. **MP DATA**, c'est une équipe de **70 experts** **Data (Data Scientists, Data Engineers, Data Architects, ML Engineers) **qui accompagne les plus grands...
-
Data Scientist
il y a 2 semaines
Paris, France Data sea Temps plein**À propos du poste** Nous recherchons un data scientist ou une data scientist passionné(e) par l'analyse de données et l'intelligence artificielle. Vous rejoindrez notre équipe dynamique pour transformer des données complexes en informations exploitables, contribuant ainsi à la prise de décision stratégique de notre entreprise. Si vous êtes...
-
Stage Data Scientist
il y a 20 heures
Paris, France Mirakl Temps pleinA propos du stage de fin d'études Data Scientist Intégré(e) dans notre équipe Data Science, votre mission sera de prototyper, itérer, et mettre en production des algorithmes en collaboration avec les équipes Produit, les Data Engineers et les équipes de développement. Les sujets traités par l’équipe ont un véritable impact sur nos clients :...
-
Data Scientist
il y a 15 heures
Paris, France VusionGroup Temps pleinAre you ready to develop the future of retail?As the world’s leader in IoT and data technologies for commerce, our mission is to help retailers and brands use digitalization to become more efficient, more intelligent, and more sustainable—and in doing so, enable more positive commerce.VusionGroup is a fast-growing, fast-paced retail tech company. We...
-
Stage Data Scientist Learning
il y a 2 semaines
Paris, France SYSTRA Temps plein**Stage Data Scientist Learning (2 mois, stage conventionné non remunéré)**: - Pays/Région: FR- Domaine: Support et transverse- Lieu: Paris, FR, 75015- Type de contrat: Stagiaire- Expérience: 00-02 ansOffre de Stage **:Data Scientist Learning **(2 mois, stage conventionné non remunéré) Vos Missions: **Produire des analyses** à destination des...