Stagiaire Data Engineer

il y a 2 semaines


Meudon, France Cast Temps plein

CAST, a Software Company based in Meudon , is the market leader in Software Intelligence. Working at CAST R&D means being an important part of a highly-talented, fast-paced, multicultural and Agile team . Overview We’re building the foundation to ground AI with AAA Software Intelligence — Aggregated, Accurated, and Augmented — sourced from real-world software and technology projects. This role goes beyond manual curation: it's about using AI to empower AI. You will leverage LLMs, embeddings, and NLP tools to clean, enrich, and validate data, enabling AI systems and autonomous agents to rely on it for training and contextual understanding. Responsibilities Aggregate and structure data from software ecosystems (codebases, APIs, tickets, documentation, architecture specs). Apply LLMs, embeddings, and NLP tools to automate: data cleaning, entity extraction, metadata tagging, and semantic annotation. Build and maintain semantic pipelines for LLM fine-tuning and RAG (Retrieval-Augmented Generation). Organize datasets into formats suitable for Agent-to-Agent (A2A) interactions: APIs, vector DBs, knowledge graphs, etc. Collaborate with AI teams to evolve schemas, prompts, labeling strategies, and evaluation data. Ensure strong data lineage, reproducibility, and version control. Requirements Experience in data engineering, ML data ops, or structured data curation. Proficient in Python, with strong data pipeline skills (Pandas, PyArrow, regex, Airflow). Experience with LLMs or NLP tools (e.g., Hugging Face, spaCy, LangChain). Ability to use AI to clean, enrich, classify, and organize technical content. Strong understanding of tokenization, chunking, and model input preparation. Experience working with software project data: Git repos, APIs, technical documentation, etc. Bonus Skills Knowledge of vector DBs (FAISS, Qdrant, Weaviate) or knowledge graphs (Neo4j, RDF, SPARQL). #J-18808-Ljbffr


  • Data Engineer

    il y a 1 semaine


    Meudon, France Hewlett Packard Temps plein

    In the GTM analytics COE our mission is to deliver impact by building machine learning products to optimize pricing and marketing investments and provide guidance to our sales organization. A data engineer on this team will design, develop, test, modify, deploy, and document solutions, services or datasets in both local and cloud-based deployments of our...

  • Stage Data Engineer IA

    il y a 2 jours


    Meudon, France THALES Temps plein

    Une entreprise technologique recherche un(e) stagiaire en Data Science. Vous travaillerez sur l'automatisation de la découverte et de l'analyse des données, en collaboration avec divers profils. Les candidats doivent avoir des compétences en Python et Java Script, ainsi qu'une connaissance des bases de données. Ce stage de 6 mois se trouve à Meudon et...


  • Meudon, France Bouygues Telecom Temps plein

    Data Scientist - Meudon 92360 - À partir de janvier 2026 Si dans votre métier vous aimez allier rigueur scientifique et impact concret, on est fait pour être ensemble. **Ce que l'on vous propose**: Chez Bouygues Telecom, le #OnEstFaitPourÊtreEnsemble est une réalité du quotidien **:notre mission est d’accompagner nos clients, nos collaborateurs et...

  • Data Engineer

    il y a 2 semaines


    Meudon, Île-de-France Thales Temps plein

    Lieu : Meudon, FranceConstruisons ensemble un avenir de confianceThales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus...

  • Data scientist

    il y a 2 jours


    Meudon, France Banque-de-france Temps plein

    Descriptif de mission La mission a une forte dimension d'innovation. Elle implique des contacts nombreux avec les spécialistes de l'analyse de données (data scientists, data engineers, responsables du data lake, informaticiens) ou de l'innovation à la Banque de France mais également chez les différents acteurs du secteur financier. Les modes d'action...

  • Data Scientist F/H

    il y a 2 semaines


    Meudon, Île-de-France Bouygues Telecom Temps plein

    Stage – Data Scientist – Meudon 92360 – À partir de janvier 2026Si vous aimez être au cœur des enjeux stratégiques liés à la donnée et à l'intelligence artificielle, alors on est fait pour être ensemble.Ce que l'on vous propose :Chez Bouygues Telecom, le #OnEstFaitPourÊtreEnsemble est une réalité du quotidien : notre mission est...


  • Meudon, France Thales Temps plein

    **QUI SOMMES-NOUS ?** Sur plus de 30 sites en France, les 1 400 collaborateurs des services partagés du Groupe œuvrent chaque jour pour délivrer en interne des Services, accélérateurs de performance. En mutualisant tout ou partie des grandes fonctions de l’entreprise au sein de centres d’expertises, Thales améliore ainsi sa compétitivité,...


  • Meudon, France Bouygues Telecom Temps plein

    Stage 6 mois | Meudon la fôret (92360) | À partir de janvier 2026 Ce que l'on vous propose Rejoignez l'équipe d'expertise data de la Direction des Opérations Clients de Bouygues Telecom Entreprises. Vous contribuerez à l'intégration et l'exploitabilité des offres DATA et sécurité, intervenant sur tout le cycle de vie des services et la stabilité du...

  • Data Engineering H/F

    il y a 7 jours


    Meudon, France Bouygues Telecom Temps plein

    Localisation : Meudon Type de contrat : Stage Date de début souhaité : Février 2026 Si pour vous être stagiaire c'est intégrer une équipe qui vous fait confiance, on est fait pour être ensemble. Vous intégrerez la Direction Technique (DTE) qui a pour rôle de concevoir, mettre en oeuvre et faire évoluer le réseau à travers la mise en place de...

  • Chef de projet DATA F/H

    il y a 2 semaines


    Meudon, Île-de-France Bouygues Telecom Temps plein

    Stage 5-6 mois | Meudon la Forêt | À partir de Janvier/Février 2026Ce que l'on vous proposeParticipez à un projet de transformation majeur chez Bouygues Telecom : la migration de nos outils de pilotage vers Google Cloud Platform (GCP). Au sein d'une équipe de 3 personnes, vous accompagnerez les métiers dans cette transition stratégique, développant...