Data Scientist

il y a 3 semaines


Rouen, France Veolia Temps plein

Description de l'entreprise

Le groupe Veolia a pour ambition de devenir l’entreprise de référence de la transformation écologique. Présent sur les cinq continents avec près de 179 000 salariés, le Groupe conçoit et déploie des solutions utiles et concrètes pour la gestion de l’eau, des déchets et de l’énergie qui participent à changer radicalement la donne. Au travers de ses trois activités complémentaires, Veolia contribue à développer l’accès aux ressources, à préserver les ressources disponibles et à les renouveler. En 2020, le groupe Veolia a servi 95 millions d’habitants en eau potable et 62 millions en assainissement, produit près de 43 millions de mégawattheures et valorisé 47 millions de tonnes de déchets. Partenaire de nombreux industriels et collectivités, l'Activité Recyclage & Valorisation des Déchets France (RVD) a pour ambition de devenir le producteur de ressources renouvelables de référence en France. Nous proposons une gamme complète de solutions innovantes à toutes les étapes du cycle des déchets, de leur collecte à leur transformation et valorisation en matière et en énergie, grâce aux étapes de tri et de traitement.En savoir plus

Description du poste

Au sein de la Direction Digitale et Performance Normandie, basé(e) à Rouen (76) et rattaché(e) au Responsable Performance Opérationnel de la région, vous contribuez à l’amélioration de la performance opérationnelle par l'analyse des processus et la structuration des bases de données, vous contribuez à la construction des modèles de machine learning et à l'amélioration des algorithmes automatiques. Vous structurez également les outils métiers (construction des Hubgrades).

Vos missions principales seront les suivantes:
**1. Extraction et structuration des données**
- Extraire les données nécessaires à l’analyse (Web scraping, API )
- Définir des règles de gestion de nettoyage des bases de données (formatage, suppression des doublons )
- Définir des règles de gestion de structuration des différentes bases de données entre elles
- Écrire et rédiger les spécifications d’automatisation des règles de gestion à la DSI Maîtriser la qualité des données tout au long de leur traitement
- Déterminer ou construire les variables importantes à introduire dans les modèles statistiques

**2. Elaboration des algorithmes d'intelligence artificielle issue des data lack**
- Analyser les données en utilisant des méthodes statistiques classiques
- Créer et tester des algorithmes d’apprentissage automatique (machine learning, deep learning )
- Construire les données d’entraînement des modèles
- Réaliser une amélioration continue des modèles

**3. Industrialisation des modèles d'apprentissage artificielle dans les outils et process métiers**
- Industrialiser les modèles d’apprentissage automatique et des modèles statistiques
- Prendre part aux vérifications lors des mises en production (recette)
- Définir les règles de gestion pour la maintenance des modèles (monitoring)
- Contribuer à la structuration et à la standardisation des data opérationnelles
- Participer à l’analyse des KPI es unités opérationnelles, repérer les anomalies et déployer actions correctives
- Former à l'utilisation des outils métiers, identifier les évolutions à réaliser dans les outils, assurer le déploiement des nouvelles fonctionnalités afin de garantir la bonne appropriation des outils

**4. Participation aux projets structurants**
- Contribuer activement aux projets structurants transverses
- Participer aux ateliers d’expression des besoins internes
- Comprendre précisément les problématiques métiers et les traduire de manière analytique
- Contribuer à l'élaboration des standards des différents processus
- Communiquer les résultats et les solutions avec les équipes métiers.

**Qualifications**:
De formation Bac+5 ingénieur(e) généraliste ou spécialisé(e) en data science. Vous êtes doté(e) d'une adaptabilité, de méthode et d'organisation et vous êtes en capacité de tisser un véritable réseau avec les différents services supports et les Directions Opérationnelles. Votre sens du client interne vous permettra de vous intégrer rapidement.

Compétences requises:

- Expertise en algorithmes et méthodes de machine learning et de deep learning
- Maîtrise des différentes architectures de réseaux neuronaux (TensorFlow, PyTorch, Caffe, Keras, Onnx )
- Maîtrise des différents systèmes d’exploitation (Unix, Windows )
- Maîtrise de l’environnement Hadoop/Spark
- Maîtrise en bases de données et gestion de bases de données (SQL/NoSQL)
- Maîtrise de langages de programmation (C++, Java, Python, R )
- Maîtriser le management de la performance
- Maîtriser l’environnement métier de l’activité recyclage et valorisation des déchets
- Travailler en mode projet avec le parties prenantes de l’entreprise (directions métiers


  • Analyste Production Big Data

    il y a 4 semaines


    Rouen, France CTI ROUEN Temps plein

    **Analyste Production Big Data**: - CDI - Rouen - de 34 980 € à 40 000 € par an - NIVEAU IVA - Télétravail possible - NVHADD87924 **CTI ROUEN**: Le CTI Rouen est un organisme appartenant au réseau de l'Assurance Maladie. Il a évolué dans ses métiers et s'est spécialisé dans la mise à disposition d'outils et de données de Gestion...

  • Analyste Production

    il y a 4 semaines


    Rouen, France CTI ROUEN Temps plein

    **Analyste Production**: - CDI - Rouen - NIVEAU IVA - Télétravail possible - NVHADD89856 **CTI ROUEN**: Le CTI Rouen est un organisme appartenant au réseau de l'Assurance Maladie. Il a évolué dans ses métiers et s'est spécialisé dans la mise à disposition d'outils et de données de Gestion Electronique de Documents (GED) ainsi que la mise à...


  • Rouen, France CTI ROUEN Temps plein

    **Analyste Production Valorisation de la donnée**: - CDI - Rouen - NIVEAU IVA - Télétravail possible - NVHADD89856 **CTI ROUEN**: Le CTI Rouen est un organisme appartenant au réseau de l'Assurance Maladie. Il a évolué dans ses métiers et s'est spécialisé dans la mise à disposition d'outils et de données de Gestion Electronique de Documents (GED)...


  • Rouen, France CTI ROUEN Temps plein

    Description du poste Dans le cadre des objectifs du contrat de service, l'intégrateur d'application a pour mission d'assurer l'intégration et la qualification des applications de son domaine dans les environnements dits 'hors production' dans le respect des contrats de services formalisés avec les organismes, les partenaires et les clients. Il...


  • Rouen, Normandie, France Orange Sa Temps plein

    Votre rôle est d'effectuer un travail de thèse sur : " Travail sur données chiffrées régulé par une autorité ".Les évolutions des régulations autours du Règlement Général sur la Protection des Données ont ouvert des discussions concernant la responsabilisation des acteurs traitant les données personnelles. Dans les protocoles cryptographiques...


  • Rouen, Normandie, France Orange Sa Temps plein

    Vous effectuerez un travail de thèse sur l'Utilisation de la provenance pour la cybersécurité en environnement opérationnel.La provenance, dans le contexte des systèmes informatiques et de la sécurité, fait référence à l'ensemble des informations qui documentent l'histoire et l'origine des données et des processus au sein d'un système...


  • Rouen, Normandie, France Orange Sa Temps plein

    Les récentes obligations réglementaires (NIS2, CRA, AI Act, DORA Act) renforcent le besoin de connaître et maîtriser la répartition des responsabilités. Cependant, nos infrastructures, matériels et logiciels sont de plus en plus le résultat de la composition dynamique de plusieurs produits indépendants fournis par des acteurs différents sur...