Data Scientist
il y a 12 heures
Overview Budget: TJM 550 € ou CDI (idéalement) Contexte de la mission Dans le cadre d’un programme stratégique autour de l’IA générative, la mission consiste à concevoir et opérer un dispositif de benchmark des technologies GenAI du marché (LLM, embeddings, RAG, agents, assistants, etc.). L’objectif est de permettre aux équipes produits et techniques : d’évaluer objectivement les solutions d’IA générative, de comparer leurs performances, limites et biais, de sécuriser les choix technologiques, et de structurer une roadmap data & IA robuste et traçable. La mission se situe à l’interface entre data science, IA générative et architecture data, avec une forte dimension expérimentale, méthodologique et opérationnelle. 📍 Localisation : Boulogne-Billancourt (92) 🏠 Télétravail : 2 jours par semaine ⏳ Durée : 12 mois 👤 1 poste ouvert Missions principales Le/la consultant(e) interviendra sur l’ensemble de la chaîne de valeur des benchmarks IA générative, notamment : 🔬 Benchmarking & expérimentation GenAI Conception de protocoles de benchmark pour évaluer des modèles de type LLM, embeddings, RAG, agents et assistants IA. Définition de métriques d’évaluation (qualité, pertinence, hallucinations, robustesse, performance, coûts, biais). Analyse critique des résultats et restitution des enseignements. 📊 Data & pipelines expérimentaux Conception et implémentation de pipelines automatisés pour : l’ingestion, le nettoyage et le versioning de datasets de benchmark, la génération d’embeddings, la collecte et l’analyse des outputs des modèles. Gestion de datasets volumineux et hétérogènes (textes, prompts, réponses, métadonnées). 🧱 Architecture data & IA Mise en place de bases de données adaptées aux cas d’usage GenAI : bases vectorielles, bases SQL / NoSQL, stockage objet pour données massives. Conception d’architectures data garantissant performance, scalabilité, traçabilité et reproductibilité des benchmarks. Industrialisation des environnements via Docker et Infrastructure as Code (IaC). 📚 Qualité, traçabilité & documentation Définition de procédures de validation et de contrôle qualité des données. Rédaction d’un dictionnaire de données et de la documentation technique associée. Formalisation des méthodologies de benchmark et des critères d’acceptation. 📦 Livrables attendus Un schéma d’architecture data & IA détaillé pour les activités de benchmark GenAI. Une infrastructure data opérationnelle (bases vectorielles, SQL/NoSQL, stockage objet). Des environnements reproductibles (IaC, Docker, configurations). Le code source documenté des pipelines (ingestion, préparation, embeddings, collecte des résultats). La documentation data & technique complète (dictionnaire de données, architecture, exploitation). Les procédures de validation et de contrôle qualité, avec critères d’acceptation formalisés. Profil recherché Nous recherchons un Senior Data Scientist / AI Engineer, avec une expertise forte en IA générative et LLM, capable d’allier expérimentation avancée et structuration industrielle. Compétences techniques clés Python avancé (data science, ML, GenAI), APIs et scripts d’intégration. Expérience solide en IA générative : LLM, embeddings, RAG, agents, assistants, prompt engineering, gestion des hallucinations et biais. Maîtrise des bases de données : SQL (PostgreSQL), NoSQL (MongoDB), bases vectorielles. Environnements Cloud, avec une expertise attendue sur Google Cloud Platform (GCP). Pratiques DevOps / MLOps : Docker, CI/CD (GitLab CI), automatisation et reproductibilité des environnements. Conception d’architectures data adaptées à des contextes IA complexes et volumineux. Compétences méthodologiques & transverses Forte capacité d’analyse et d’évaluation critique des solutions IA. Aptitude à prototyper rapidement et à comparer des technologies émergentes. Pratique des méthodes Agile / Scrum et des bonnes pratiques de développement (code review, tests). Sensibilité aux enjeux RGPD, éthique et responsabilité de l’IA. Anglais professionnel courant (documentation, échanges techniques). Langues Français : courant Anglais : professionnel (oral et écrit) #J-18808-Ljbffr
-
Staff Data Scientist
il y a 6 jours
Paris, France Data Idols Temps plein**Staff Data Scientist**: **Salary**:€**100,000 - **€**130,000 + Equity**: **Location: Paris/Remote**: - Data Idols are currently working with a rapidly scaling technology company at the forefront of AI, focusing on LLMs and NLP solutions. They’ve recently surpassed a £1 billion valuation and are on the lookout for a talented Staff Data Scientist to...
-
Data Scientist F/H
il y a 2 semaines
Paris, Île-de-France un emploi de Data Scientist FH Temps pleinData scientist F/H (Stage de 6 mois)Faire de la Data Science dans la musique, c'est analyser des millions d'écoutes quotidiennes, comprendre comment naissent les hits, comment évoluent les goûts et comment les artistes rencontrent leur public.Sony Music Entertainment France, un des leaders du secteur de la production, de la promotion et de la distribution...
-
Manager Data Scientist | IA
il y a 4 heures
Paris, France Data Recrutement Temps pleinL’ENTREPRISE : LEADER DANS LA CONCEPTION DE SOLUTIONS IA Société fondée en 2017 Les bureaux sont situés à Paris intra-muros dans de superbes locaux Près de 90 collaborateurs font déjà parti de l’aventure ! Une clientèle internationale et la présence des équipes entre la France et l'Amérique du Nord Réalisation de projet sur mesure...
-
Data Scientist
il y a 2 semaines
Paris, France Data kanyon technology Temps plein**À propos du poste** Nous recherchons un data scientist ou une data scientist passionné(e) par l'analyse de données et l'intelligence artificielle avec des connaissances solides en data ingénierie. Vous intégrerez une équipe dynamique et innovante, où vous aurez l'opportunité de travailler sur des projets variés et d'apporter des solutions basées...
-
Data Scientist H/F
il y a 2 semaines
Paris, Île-de-France Data sea Temps pleinÀ propos du posteNous recherchons un(e) Data Scientist pour rejoindre notre équipe et participer activement à la valorisation de nos données. Votre rôle sera essentiel pour comprendre nos performances, anticiper les tendances et proposer des solutions basées sur la data.Vos responsabilitésExploiter et analyser de grands volumes de donnéesConstruire...
-
Data Scientist
il y a 1 semaine
Paris 8e, France Data kanyon technology Temps plein**À propos du poste** Nous recherchons un data scientist ou une data scientist passionné(e) par l'analyse de données et l'intelligence artificielle avec des connaissances solides en data ingénierie. Vous intégrerez une équipe dynamique et innovante, où vous aurez l'opportunité de travailler sur des projets variés et d'apporter des solutions basées...
-
Data Scientist
il y a 1 jour
Paris 8e, France Data kanyon technology Temps plein**À propos du poste** Nous recherchons un data scientist ou une data scientist passionné(e) par l'analyse de données et l'intelligence artificielle avec des connaissances solides en data ingénierie. Vous intégrerez une équipe dynamique et innovante, où vous aurez l'opportunité de travailler sur des projets variés et d'apporter des solutions basées...
-
Data Engineer
il y a 13 heures
Paris, France Metroscope Temps pleinNous recherchons un.e Data Engineer - Data Scientist pour notre équipe software, composée actuellement de 2 Engineering Managers, 6 développeurs full stack, 3 data scientists, 1 data engineer, 2 platform engineers, 2 PMs, 1 designer. Tu rejoindras l'équipe Data Platform, seras sous la responsabilité managériale d'un Engineering Manager et travailleras...
-
Data Scientist | IA
il y a 2 jours
Paris, France Data Recrutement Temps pleinL’ENTREPRISE : LEADER DANS LA CONCEPTION DE SOLUTIONS IA Société fondée en 2017 Les bureaux sont situés à Paris intra-muros dans de superbes locaux Près de 90 collaborateurs font déjà parti de l’aventure ! Une clientèle internationale et la présence des équipes entre la France et l'Amérique du Nord Réalisation de projet sur mesure...
-
Data Scientist
il y a 1 jour
Paris, France HNM Solutions Temps plein**Role: Data Scientist** **Location: Paris** **Experience: 7 to 10 years** **Description**: Client is looking for an Expert Data Scientist to join the Strategic Asset Framework (CSP) project. This project aims to centralize, structure and exploit the asset data of the group's real estate subsidiaries in order to optimize the management of its real estate...