Emplois actuels liés à Python Web Scraping Expert - Paris, Île-de-France - NewsCore


  • Paris, Île-de-France RAINBOW PARTNERS GROUP Temps plein

    Description de l'entrepriseGROUPE RAINBOW PARTNERS est un groupe de conseil multi-spécialiste présent en France et à l'international, avec des bureaux dans des villes comme Paris, Montréal, New York et Genève. Comptant plus de 980 de plus de 35 nationalités différentes, le groupe met l'accent sur des valeurs humaines telles que la proximité, la...


  • Paris, Île-de-France Altura Consult Temps plein

    Alternant·e – Assistant·e Développement & Contenu Web (Reconversion Web / Profil Senior)Altura Consult – Paris / HybrideQui sommes-nous ?Altura Consult est une agence dedéveloppement commercial et marketing spécialisée dans la restauration indépendante, le corporate et les tour-opérateurs.Notre mission :ramener du chiffre d'affaires là où il...

  • Développeur Python

    il y a 7 heures


    Paris, Île-de-France Meritis Temps plein

    Description de l'entrepriseMeritis est une société de conseil spécialisée en transformation digitale des organisations, fondée en 2007 par Sébastien Videment.Installée initialement à Paris, elle s'est déployée en régions et assure désormais une présence dans les plus grandes villes de France : Sophia-Antipolis, Montpellier, Nantes, Bordeaux,...


  • Paris, Île-de-France Twenty One Talents Temps plein

    Présentation de la société Rejoignez une entreprise tech française en pleine croissance, éditrice d'une plateforme SaaS de veille des médias sociaux utilisée par de grandes marques européennes. Son objectif : permettre aux professionnels de la communication de surveiller la réputation de leur entreprise, gérer les crises, détecter les influenceurs...

  • Senior Data Engineer Python

    il y a 7 heures


    Paris, Île-de-France Free-Work Temps plein

    Notre client dans le secteur Énergie et ressources naturelles recherche un Senior Data Engineer Python – Environnement AWS Cloud H/FDescriptif de la mission:Objectifs et livrablesL'entreprise recherche une prestation de Senior Data Engineer externe, curieux(se) et engagé(e), pour rejoindre une équipe data.Le profil externe sera responsable de...


  • Paris, Île-de-France FINAXYS Temps plein

    Qui sommes-nous ?Finaxys est un cabinet de conseilspécialisé dans les secteurs Banque, Finance et Assurance. Depuis plus de 15 ans, nous intervenons auprès des plus grandes institutions telles queBNP Paribas, Crédit Agricole, Société Générale, AXA, Malakoff Humanis, etc. en proposant des solutions technologiques innovantes (IA, Machine Learning,...

  • GTM Engineer

    il y a 7 heures


    Paris, Île-de-France Twenty One Talents Temps plein

    Présentation de la société Scale-up IA en pleine croissance (récent tour de table 3.5M€), nous révolutionnons le traitement de documents avec des LLMs. Notre plateforme aide développeurs et entreprises à parser, valider et structurer des fichiers complexes avec fiabilité production. Focus US pour scaler nos opérations...

  • Data Scientist Junior

    il y a 4 jours


    Paris, Île-de-France Beamy Temps plein

    Beamy détecte l'usage de 50K+ SaaS en temps réel chez 500K+ utilisateurs dans les grandes entreprises. Nous collectons des millions de signaux quotidiens pour aider les équipes IT à optimiser leur portefeuille logiciel et construire leur stratégie IT data-driven. Notre technologie brevetée combine extension navigateur, traitements massifs de données...

  • Data Products Analyst

    il y a 7 heures


    Paris, Île-de-France MyTraffic Temps plein

    MyTraffic, créé en 2016, a pour mission de fournir aux professionnels du commerce les meilleures analyses et insights en matière de localisation pour leur permettre d'être plus performants au quotidien et de concevoir les meilleures expériences dans les lieux physiques.Nous accompagnons déjà plus de 500 clients dans de nombreux secteurs (distribution,...


  • Paris, Île-de-France Antidox Temps plein

    Consultant(e) Senior Veille et Analyse stratégique (F/H)Antidox est un cabinet de conseil reconnu pour son expertise en stratégie de communication et spécialisé dans les problématiques complexes d'influence en ligne. Le travail d'Antidox est fondé sur les nouvelles formes d'opinion et de débat public, notamment portées par le numérique.Créé en...

Python Web Scraping Expert

il y a 8 heures


Paris, Île-de-France NewsCore Temps plein

About NewsCore

NewsCore is an
AI-native market intelligence platform
that helps leading organizations monitor, collect, and analyze strategic information from the web in real time. We enable Fortune-500 corporations, major industrial players, and public institutions to detect emerging risks, competitive moves, regulatory signals, and market trends automatically. We're building
the next generation of automated monitoring systems
, powered by advanced AI, large-scale crawling, and information retrieval technologies.

Your Responsibilities

We are looking for
a scraping expert
to strengthen our ingestion and crawling stack.

You will design resilient pipelines capable of retrieving
millions of documents per day
across:

Websites, Social media, Institutional portals, Company websites, Industry sources

You'll work directly with our CTO and tech teams.

What you will work on

Large-Scale Scraping Architecture

Build and maintain high-volume scraping pipelines capable of ingesting 5M+ article / day

Ensure resiliency, retries, concurrency, proxy rotation, throttling, and anti-bot bypassing

Maintain robust source coverage and maximize recall rate

News & Media Scraping

Scrape news sites, press portals, industry pages, and structured business data

Extract HTML content cleanly (publication date, article content, title, authors, metadata, …)

Social Media Scraping

Extend and improve our stack for: X, Telegram, WhatsApp, Instagram, Tiktok

Manage sessions, cookies, mobile scraping, and API constraints

Backend Integration

Integrate crawling systems with: Django/Fast API backend, Celery workers, Background tasks, Redis caching, Internal ingestion APIs

Persist structured content into our database with indexing, versioning, and enrichment layers

Quality & Monitoring

Detect scraping failures, parsing errors, and source mismatches

Continuously improve content quality, coverage, freshness, and extraction accuracy

Build internal metrics to measure scraping performance at scale

Required Hard Skills

Strong experience in scraping (2+ years minimum)

Proven record in web scraping at scale (1M+ docs/day)

Experience with scraping frameworks: lxml , Selenium / Playwright, Requests, BeautifulSoup

Large-scale scraping best practices: concurrency, task scheduling, proxy rotation, caching strategies, error handling & bypass rules

Experience with social media scraping: (X, Telegram, WhatsApp, etc.)

Strong knowledge of: background jobs (Celery or equivalents), Django integration, Python parsing & normalization, HTML content extraction, Database ingestion

Comfortable with: CI/CD, Git, Quality-oriented code (tests, docs)

Bonus Skills (Nice to Have)

Scraping anti-bot techniques (captcha, session hijack, mobile / device emulation, …)

Performance testing & benchmarking

Knowledge of NLP, embeddings, search pipelines, information retrieval

Soft Skills

Strong ownership mindset

Autonomous and proactive

Fast learner, adaptable to fast-changing environments

Fluent English (written and spoken)

Why Join Us?

Cutting-edge AI startup
building the future of market intelligence used by global leaders.

High-impact work
on core systems powering large-scale data collection and strategic insights.

Ownership opportunities
, including potential equity and long-term incentives based on profile.

Elite engineering culture
, working with top-tier engineers, AI and data experts.

Recruitment Process

We propose 3 rounds over two weeks:

30-minute call
with Ludovic to understand your goals and situation.

2-hour test interview
with François to assess your hard skills.

45-minutes- tech interview
- deeper dive into your technical expertise.