Stage Data Scientist

il y a 3 jours


Paris, France LINCOLN Temps plein

Description de l'entreprise

Rejoindre LINCOLN, c’est rejoindre un cabinet de conseil **reconnu** pour son expertise data depuis plus de 30 ans, en proposant des prestations d’expertise, de conseil et d’accompagnement en Modern BI et Big Data.

Vous progresserez au sein d’une équipe de plus de **360** experts de l'environnement Cloud.

Vous intégrerez le Lab Lincoln et son équipe pluridisciplinaire qui vous encadrera et vous fera progresser durant vos 6 mois de stage.

Description du poste
**Projet**: Identifier et localiser les différents éléments d'un document scanné, stocker et structurer l'information.**

Les entreprises peuvent posséder un important patrimoine de document scannés. Leur exploitation est complexe, car leur qualité est variable et les outils de recherche informatiques sont très peu efficaces sur ce type d’information. Dans le but d’améliorer leur exploitation, il faut être en mesure d’identifier leur contenu, tant dans la forme que dans le fond.

Les méthodes d’OCR permettent d’extraire assez facilement le texte de ces documents, mais pas leur structure, et cela présente des complexités pour les exploiter (recherche d’information, mise en correspondance de valeurs issues de tableaux).

L’objectif de ce stage est de construire un package python disposant de différentes fonctionnalités d’extraction de structure de document, afin de construire un ensemble de métadonnées au plus proche de la réalité du document.

Afin de parvenir à réaliser cet objectif, il faudra construire un pipeline de traitement adapté à tout type de document.

Les éléments importants de ce projet seront les suivants:

- Identification des différents éléments dans un document : tableaux, figures, signatures, pagination
- Veille technique et méthodologique en lien avec la problématique
- Choix des outils et algorithmes adaptés
- Labellisation des données
- Implémentation et validation des algorithmes
- Construction des pipelines de traitement
- Refactoring et packaging des codes

Un ensemble de plusieurs centaines de documents (contenant plusieurs pages) de contenus variés sera mis à disposition pour mettre en place et évaluer les performances des traitements implémentés.

Vous serez amené(e) à travailler dans le cloud (Azure).

Déroulement du stage:

- Mise en place des environnements
- Analyse et exploration de la base documentaire
- Construction des objectifs du package (méthodologie + cible)
- Mise en œuvre de la méthodologie (labellisation, entraînement, évaluation)
- Packaging des codes, rédaction de documentation

**Qualifications**:

- Curiosité et force de proposition
- Intérêt pour le domaine
- Profil Ecole d'ingénieur
- Appétence pour les problématiques Data Science.
- Bonne connaissance de la programmation en Python
- Niveau d'anglais suffisant pour la compréhension d'articles scientifiques

Informations supplémentaires

Un stage réussi débouchera sur un CDI vous permettant d'intégrer Lincoln et de participer au développement de notre activité conseil en Data science.


  • Stage Data Scientist

    il y a 1 semaine


    Paris, Île-de-France un emploi de Stage Data Scientist chez Mirakl Temps plein

    About MiraklMirakl is the leading provider of eCommerce software solutions. Mirakl's suite of solutions provides enterprises with a transformative way to drive significant growth and efficiency in their online business. Since 2012, Mirakl has been pioneering the platform economy, empowering retail and b2b enterprises with the most advanced, secure and...

  • Stage Data Scientist

    il y a 1 semaine


    Paris, Île-de-France un emploi de Stage Data Scientist chez Mirakl Temps plein

    About MiraklMirakl is the leading provider of eCommerce software solutions. Mirakl's suite of solutions provides enterprises with a transformative way to drive significant growth and efficiency in their online business. Since 2012, Mirakl has been pioneering the platform economy, empowering retail and b2b enterprises with the most advanced, secure and...

  • Data Scientist

    il y a 7 jours


    Paris, France MP Data Temps plein

    Bonjour, MP DATA est une Société de Conseil à taille humaine spécialisée dans le traitement et la valorisation des données des entreprises depuis 2015. Partenaire de confiance d'entreprises du CAC40 sur leur transformation Data / IA, notre société accompagne ses clients sur tout le territoire français (bientôt Européen) sur des projets...

  • Data Scientist Nlp

    il y a 5 jours


    Paris 1er, France MP DATA Temps plein

    Passionné(e) par **les use-cases NLP** ? Rejoins notre Équipe d'experts dans la **data/l'IA spécialisés en NLP** (plus d'une vingtaine de cas d'usages !). **MP DATA**, c'est une équipe de **70 Experts** **Data (Data Scientists, Data Engineers, Data Architects, ML Engineers) **qui accompagne les plus grands groupes français sur des projets d'IA très...

  • Data Scientist

    il y a 3 jours


    Paris, France MP Data Temps plein

    Bonjour, MP DATA est une société de Conseil spécialisée dans la transformation numérique des entreprises. Dans le cadre de son développement, MP DATA, recrute un(e) Data scientist ayant un intérêt pour le domaine des jumeaux numériques, afin de travailler pour un acteur de classe mondiale, dans le domaine de l'industrie. Profil : Ingénieur Grande...

  • Data Scientist

    il y a 5 jours


    Paris 2e, France MP DATA Temps plein

    Passionné(e) par **l'IA appliquée au domaine de la santé**? Rejoins notre Équipe d'experts dans la **data/l'IA spécialisée dans le HealthCare** (plus de 30 cas d'usages !) basée dans le Sud-Ouest. **MP DATA**, c'est une équipe de **70 experts** **Data (Data Scientists, Data Engineers, Data Architects, ML Engineers) **qui accompagne les plus grands...

  • Data Scientist

    il y a 2 semaines


    Paris, France Data sea Temps plein

    **À propos du poste** Nous recherchons un data scientist ou une data scientist passionné(e) par l'analyse de données et l'intelligence artificielle. Vous rejoindrez notre équipe dynamique pour transformer des données complexes en informations exploitables, contribuant ainsi à la prise de décision stratégique de notre entreprise. Si vous êtes...

  • Stage Data Scientist

    il y a 20 heures


    Paris, France Mirakl Temps plein

    A propos du stage de fin d'études Data Scientist Intégré(e) dans notre équipe Data Science, votre mission sera de prototyper, itérer, et mettre en production des algorithmes en collaboration avec les équipes Produit, les Data Engineers et les équipes de développement. Les sujets traités par l’équipe ont un véritable impact sur nos clients :...

  • Data Scientist

    il y a 15 heures


    Paris, France VusionGroup Temps plein

    Are you ready to develop the future of retail?As the world’s leader in IoT and data technologies for commerce, our mission is to help retailers and brands use digitalization to become more efficient, more intelligent, and more sustainable—and in doing so, enable more positive commerce.VusionGroup is a fast-growing, fast-paced retail tech company. We...

  • Stage Data Scientist Learning

    il y a 2 semaines


    Paris, France SYSTRA Temps plein

    **Stage Data Scientist Learning (2 mois, stage conventionné non remunéré)**: - Pays/Région: FR- Domaine: Support et transverse- Lieu: Paris, FR, 75015- Type de contrat: Stagiaire- Expérience: 00-02 ansOffre de Stage **:Data Scientist Learning **(2 mois, stage conventionné non remunéré) Vos Missions: **Produire des analyses** à destination des...