Stage Machine Learning

il y a 4 semaines


Nantes, France Talend Temps plein

WHO WE ARE:
Talend, a leader in data integration and data governance, is changing the way the world makes decisions. In order to compete and win, IT and business leaders need data that they can trust and understand instantly. Talend Data Fabric is the only platform that seamlessly combines an extensive range of data integration and governance capabilities to actively manage the health of corporate information. This unified approach is unique and essential to delivering complete, clean, and uncompromised data in real-time to all employees. It has made it possible to create innovations like the Talend Trust Score, an industry-first assessment that instantly quantifies the reliability of any data set.

Over 7,250 customers have chosen Talend to run their businesses on healthy data. Talend is recognized as a leader in its field by leading analyst firms and industry media.

We pride ourselves in our values of Passion, Agility, Team Spirit, and Integrity. Every one of our 1,400 employees brings a certain
_je ne sais quoi _that makes Talend special.

**Sujet de stage de Master 2/ de fin d’étude d’école d’ingénieur**

**Durée 6 mois**

Détection automatique de PII dans un dataset tabulaire

**Mots-clés**

Personal Identifiable Information, Semantic Type, Machine Learning, Topic Modeling, Classification, Automatic column detection

**La société Talend et son contexte**

Les solutions d’intégration, de big data, et de gouvernance de Talend aident les entreprises à tirer le meilleur parti de leurs données. Avec l’explosion du nombre de données générées, cette gouvernance devient un enjeu clef pour chaque organisation. Pour tirer profit de leur données, ces organisations doivent respecter les différentes réglementations en vigueur de confidentialité et de propriété. La compréhension du contenu de ces données est donc un enjeu majeur.

Dans ce contexte, l’équipe du Lab de Talend recherche un/une stagiaire pour développer un modèle permettent la détection automatique de données personnelles (GDPR, PII, PHI,...) sur des jeux de données tabulaires.

**Objectif du stage**

**Proposition de déroulé de stage**
- Étude bibliographique (définition du problème, état de l’art, lecture de papiers académiques, sélection des algorithmes et des librairies les plus adaptées_,_ etc..)
- Identification de jeux de données type. Construction d’un modèle. Élaboration de la stratégie d’apprentissage du modèle, du processus de validation, de la construction des caractéristiques conditionnellement aux types de données.
- Application sur les jeux de données sélectionnés, évaluation des performances du modèle et comparaison à l’existant ([2])
- Rédaction de compte rendus

En fonction de l’avancée et de la pertinence des travaux, les résultats pourront donner lieu à des présentations et/ou une éventuelle publication scientifique.

Vous avez suivi une formation d’ingénieur spécialisé en mathématiques / statistiques et/ou apprentissage automatique ou toute formation équivalente.

Vous maîtrisez les outils de base de programmation (git, IDE), vous avez la connaissance d’un langage de programmation orienté sciences des données (R, Python,...), vous avez la maîtrise des notebooks et vous avez idéalement réalisé des projets de data sciences ou participez à des challenges (Kaggle, Challenge Data Ens, KDD,...).

L’innovation la qualité du travail fournit et le besoin de compréhension sont importantes pour vous.

Votre rigueur et votre sens de l’organisation vous permettent de respecter les délais impartis. Vous êtes autonome mais savez également travailler en équipe.

Anglais courant : lu, écrit, parlé (présentations orales en anglais)

Durée : 6 mois (dès mars 2023)

Lieu: Le poste sera basé sur l’île de Nantes, à Nantes (44)

Tuteur de stage: Jean-Marc Brun

**Références bibliographiques (non exhaustif)**

LI-HM1

AND NOW, A LITTLE ABOUT US:
Talend has received some pretty impressive accolades along the way:

- 7,250+ global customers rely on Talend for their data health
- Named a Leader for Data Integration Tools by Gartner (for the 7th year in a row)
- Named a Leader for Data Quality Solutions by Gartner (for the 5th year in a row)
- Named a Leader in The Forrester Wave: Enterprise Data Fabric (for the 2nd time in a row)
- Ranked in the DBTA “100 Companies that Matter Most in Data”

We are passionate about helping companies become more data driven; and, if we can be honest, we are all geeks at heart who pride ourselves on the vibrant company culture that we have built.- _. We appreciate your interest in Talend._

**_
Notice to Recruiters and Staffing Agencies_



  • Nantes, France PROXIAD Temps plein

    Proxiad Ouest est à la recherche d’un nouveau talent pour compléter son équipe ! Qui sommes-nous ? Avec une écoute attentive et un suivi régulier de ses collaborateurs, une bonne ambiance et des petits déjeuner à la clé, Proxiad est une ESN qui porte une attention toute particulière au bien-être de ses collaborateurs. Spécialisé...

  • Ingénieur machine learning

    il y a 2 semaines


    Nantes, France PROXIAD Temps plein

    Proxiad Ouest est à la recherche d’un nouveau talent pour compléter son équipe ! Qui sommes-nous ? Avec une écoute attentive et un suivi régulier de ses collaborateurs, une bonne ambiance et des petits déjeuner à la clé, Proxiad est une ESN qui porte une attention toute particulière au bien-être de ses collaborateurs. Spécialisé...


  • Nantes, France Humaniance Temps plein

    Notre groupe est présent au niveau national avec des formations réalisées en Inter et en Intra entreprise sur toute la France. Nous organisons plus de 100 sessions de formation par mois dans divers domaines et sommes engagés dans une démarche qualité depuis notre création. Nous recherchons un formateur (H/F), pour de futures sessions de...


  • Nantes, France Innosea Temps plein

    **Description**: **Be the energy behind change. Join ABL Group.** - INNOSEA, part of the ABL Group, is a specialized multidisciplinary engineering, strategy advisory, and R&D consultant in marine renewable energies. We work in offshore wind, floating solar PV, wave and tidal energy, deep-water technology, hydrogen power, and decarbonization initiatives. 100%...


  • Greater Nantes Metropolitan Area, France PROXIAD Temps plein

    Proxiad Ouest est à la recherche d’un nouveau talent pour compléter son équipe !Qui sommes-nous ? Avec une écoute attentive et un suivi régulier de ses collaborateurs, une bonne ambiance et des petits déjeuner à la clé, Proxiad est une ESN qui porte une attention toute particulière au bien-être de ses collaborateurs.Spécialisé dans le Conseil...


  • Greater Nantes Metropolitan Area, FR PROXIAD Temps plein

    Proxiad Ouest est à la recherche d’un nouveau talent pour compléter son équipe !Qui sommes-nous ? Avec une écoute attentive et un suivi régulier de ses collaborateurs, une bonne ambiance et des petits déjeuner à la clé, Proxiad est une ESN qui porte une attention toute particulière au bien-être de ses collaborateurs.Spécialisé dans le Conseil...


  • Nantes, France Groupe Samsic Temps plein

    Tu souhaites rejoindre un grand Groupe et une équipe dédiée au Digital Learning ?* - Tu es passionné(e) par l’innovation digitale ?* - Tu souhaites contribuer au développement des outils pédagogiques de demain, en étant force de propositions ?* - Ta créativité et ta capacité à travailler en équipe font partie de tes qualités ?* Rejoins-nous !...


  • Nantes, France Pharmiweb Temps plein

    My Client, a leading Biotech focusing on developing BioAI solutions for the life science industry is searching for a SENIOR MACHINE LEARNING ENGINEER for their teamResponsibilities:Collaborate with researchers to develop machine-learning methods for computational biology problems.Assist in implementing and testing novel research ideas alongside research...


  • Nantes, France TRIBOFILM Temps plein

    Depuis près de 30 ans, TRIBOFILM édite un logiciel GMAO (Gestion de maintenance assistée par ordinateur) pour faciliter le quotidien de nos nombreux clients des secteurs de l’industrie, du tertiaire et des institutions publiques. Présent auprès de très grands groupes industriels et du public, TRIBOFILM a pour objectif de continuer à se développer...

  • Stage Datascientist

    Il y a 2 mois


    Nantes, France Groupama Assurances Mutuelles Temps plein

    Au sein la Direction Marketing, l'équipe Connaissance client prédictif réalise: - les études liées à la connaissance client à base de Machine Learning : scoring, segmentation, étude ad hoc sur les profiling clients et prospect. Ces études comprennent la réalisation des bases de données, de la modélisation statistique, les présentation et le...


  • Nantes, France Armor - Iimak Temps plein

    **L'entreprise** ARMOR GROUP, c’est un groupe **industriel** centenaire dont l’activité principale est la conception, la fabrication et la commercialisation de **rubans encrés**. Nos produits sont utilisés par des acteurs industriels et logistiques pour imprimer **des données de traçabilité et d’identification** sur des étiquettes ou des films...


  • Nantes, France Armor Temps plein

    **Etablissement**: Armor - IImak **Type de contrat**: Stage **Temps de travail**: Temps plein Lieu La Chevrolière À partir du 02.09.2024 L'entreprise ARMOR GROUP, c’est un groupe industriel centenaire dont l’activité principale est la conception, la fabrication et la commercialisation de rubans encrés. Nos produits sont utilisés par des...


  • Nantes, France iAdvize Temps plein

    **Description de l'entreprise**: En associant le meilleur de l’humain et l’intelligence artificielle, la plateforme conversationnelle d’iAdvize permet aux marques d’offrir à grande échelle, à leurs clients, une expérience d’achat en ligne authentique et personnalisée. Les consommateurs ont massivement adopté le Messaging dans leur vie...


  • Nantes, France Ausy Temps plein

    En binôme avec le chef de projets Digital Learning, vous interviendrez sur un périmètre national et contribuerez à la conception des formations e-learning sur diverses expertises (RH, juridique, gestion de projet, ingénierie, etc.). Pour vous aider dans la création de ces supports, vous serez en interaction avec nos experts métiers. description du...


  • Nantes, France BrightClue Temps plein

    **Chercheur en Deep Learning 3D - Data Scientist** **CDI - H/F** **À propos** Au cœur de l’**écosystème d'intelligence artificielle français**, BrightClue est née d'une conviction : l'IA a le pouvoir de transformer les données métiers des industries en **connaissances exploitables, **afin d’optimiser le processus de conception et de...

  • Data Engineer

    il y a 5 jours


    Nantes, France EXTERNATIC Temps plein

    DESCRIPTION DE L'OFFRE Moi c'est Hadrien, Consultant chez Externatic à Nantes et j’ai une belle offre à vous partager. Voici quelques infos ci-dessous, et je serais ravi d’échanger ensemble en visio ou autour d’un café pour vous donner plus de détails ! **L'entreprise** - Éditeur français de logiciels SaaS à destination des directions...


  • Nantes, France Direction des systèmes d'informations France Travail Temps plein

    **Description entreprise**: **Votre environnement** A la recherche d’un poste motivant et d'un environnement vous permettant de développer vos compétences, dans une Direction des Systèmes d’Information performante, innovante, engagée RSE et soucieuse de la qualité de vie au travail. Attiré.e par le travail collectif et de nouveaux challenges...


  • Nantes, France LA FABRIQUE DES METIERS Temps plein

    **La Fabrique des métiers** recherche son **futur stagiaire pour des missions administratives et digitales**. Vous intervenez en renfort auprès de l’équipe e-learning, sur le déploiement d’une nouvelle plateforme e-learning pour notre organisme de formation. **Voici les missions qui vous seront confiées**: - Participation aux échanges et aux...

  • Stage Ia

    il y a 1 mois


    Nantes, France Groupe LG Temps plein

    Le Groupe LG propose de nombreux éléments préfabriqués béton (Escaliers, balcons, dalles, éléments de façade, murs de soutènement, blocs béton et d’autres éléments préfabriqués sur mesure) destinés au domaine des travaux publics, Génie-civil, Ouvrages d’art, agricole, ouvrages fonctionnels et équipements publics, BTP. Il est dirigé par...

  • Stage Data Scientist

    il y a 1 mois


    Nantes, France BRIAND Temps plein

    Dans le cadre de la feuille de route de l’entreprise consistant à développer des solutions de bâtiment décarboné, nous développons un ambitieux programme de plateforme d’automatisation de conception multi-matériaux hors-site. Rattaché(e) au chef du projet digital votre travail consistera à développer des solutions pour automatiser les...