Emplois actuels liés à Python Web Scraping Expert - Paris, Île-de-France - NewsCore
-
stage en developpement python orienté web
il y a 7 heures
Paris, Île-de-France RAINBOW PARTNERS GROUP Temps pleinDescription de l'entrepriseGROUPE RAINBOW PARTNERS est un groupe de conseil multi-spécialiste présent en France et à l'international, avec des bureaux dans des villes comme Paris, Montréal, New York et Genève. Comptant plus de 980 de plus de 35 nationalités différentes, le groupe met l'accent sur des valeurs humaines telles que la proximité, la...
-
recrute un·e alternant·e – Profil senior en reconversion web
il y a 7 heures
Paris, Île-de-France Altura Consult Temps pleinAlternant·e – Assistant·e Développement & Contenu Web (Reconversion Web / Profil Senior)Altura Consult – Paris / HybrideQui sommes-nous ?Altura Consult est une agence dedéveloppement commercial et marketing spécialisée dans la restauration indépendante, le corporate et les tour-opérateurs.Notre mission :ramener du chiffre d'affaires là où il...
-
Développeur Python
il y a 7 heures
Paris, Île-de-France Meritis Temps pleinDescription de l'entrepriseMeritis est une société de conseil spécialisée en transformation digitale des organisations, fondée en 2007 par Sébastien Videment.Installée initialement à Paris, elle s'est déployée en régions et assure désormais une présence dans les plus grandes villes de France : Sophia-Antipolis, Montpellier, Nantes, Bordeaux,...
-
Senior Développeur Full Stack Python
il y a 7 heures
Paris, Île-de-France Twenty One Talents Temps pleinPrésentation de la société Rejoignez une entreprise tech française en pleine croissance, éditrice d'une plateforme SaaS de veille des médias sociaux utilisée par de grandes marques européennes. Son objectif : permettre aux professionnels de la communication de surveiller la réputation de leur entreprise, gérer les crises, détecter les influenceurs...
-
Senior Data Engineer Python
il y a 7 heures
Paris, Île-de-France Free-Work Temps pleinNotre client dans le secteur Énergie et ressources naturelles recherche un Senior Data Engineer Python – Environnement AWS Cloud H/FDescriptif de la mission:Objectifs et livrablesL'entreprise recherche une prestation de Senior Data Engineer externe, curieux(se) et engagé(e), pour rejoindre une équipe data.Le profil externe sera responsable de...
-
Finaxys recrute un ingénieur études et développement Python
il y a 7 heures
Paris, Île-de-France FINAXYS Temps pleinQui sommes-nous ?Finaxys est un cabinet de conseilspécialisé dans les secteurs Banque, Finance et Assurance. Depuis plus de 15 ans, nous intervenons auprès des plus grandes institutions telles queBNP Paribas, Crédit Agricole, Société Générale, AXA, Malakoff Humanis, etc. en proposant des solutions technologiques innovantes (IA, Machine Learning,...
-
GTM Engineer
il y a 7 heures
Paris, Île-de-France Twenty One Talents Temps pleinPrésentation de la société Scale-up IA en pleine croissance (récent tour de table 3.5M€), nous révolutionnons le traitement de documents avec des LLMs. Notre plateforme aide développeurs et entreprises à parser, valider et structurer des fichiers complexes avec fiabilité production. Focus US pour scaler nos opérations...
-
Data Scientist Junior
il y a 4 jours
Paris, Île-de-France Beamy Temps pleinBeamy détecte l'usage de 50K+ SaaS en temps réel chez 500K+ utilisateurs dans les grandes entreprises. Nous collectons des millions de signaux quotidiens pour aider les équipes IT à optimiser leur portefeuille logiciel et construire leur stratégie IT data-driven. Notre technologie brevetée combine extension navigateur, traitements massifs de données...
-
Data Products Analyst
il y a 7 heures
Paris, Île-de-France MyTraffic Temps pleinMyTraffic, créé en 2016, a pour mission de fournir aux professionnels du commerce les meilleures analyses et insights en matière de localisation pour leur permettre d'être plus performants au quotidien et de concevoir les meilleures expériences dans les lieux physiques.Nous accompagnons déjà plus de 500 clients dans de nombreux secteurs (distribution,...
-
Consultant(e) Senior Veille et Analyse stratégique
il y a 7 heures
Paris, Île-de-France Antidox Temps pleinConsultant(e) Senior Veille et Analyse stratégique (F/H)Antidox est un cabinet de conseil reconnu pour son expertise en stratégie de communication et spécialisé dans les problématiques complexes d'influence en ligne. Le travail d'Antidox est fondé sur les nouvelles formes d'opinion et de débat public, notamment portées par le numérique.Créé en...
Python Web Scraping Expert
il y a 8 heures
About NewsCore
NewsCore is an
AI-native market intelligence platform
that helps leading organizations monitor, collect, and analyze strategic information from the web in real time. We enable Fortune-500 corporations, major industrial players, and public institutions to detect emerging risks, competitive moves, regulatory signals, and market trends automatically. We're building
the next generation of automated monitoring systems
, powered by advanced AI, large-scale crawling, and information retrieval technologies.
Your Responsibilities
We are looking for
a scraping expert
to strengthen our ingestion and crawling stack.
You will design resilient pipelines capable of retrieving
millions of documents per day
across:
Websites, Social media, Institutional portals, Company websites, Industry sources
You'll work directly with our CTO and tech teams.
What you will work on
Large-Scale Scraping Architecture
Build and maintain high-volume scraping pipelines capable of ingesting 5M+ article / day
Ensure resiliency, retries, concurrency, proxy rotation, throttling, and anti-bot bypassing
Maintain robust source coverage and maximize recall rate
News & Media Scraping
Scrape news sites, press portals, industry pages, and structured business data
Extract HTML content cleanly (publication date, article content, title, authors, metadata, …)
Social Media Scraping
Extend and improve our stack for: X, Telegram, WhatsApp, Instagram, Tiktok
Manage sessions, cookies, mobile scraping, and API constraints
Backend Integration
Integrate crawling systems with: Django/Fast API backend, Celery workers, Background tasks, Redis caching, Internal ingestion APIs
Persist structured content into our database with indexing, versioning, and enrichment layers
Quality & Monitoring
Detect scraping failures, parsing errors, and source mismatches
Continuously improve content quality, coverage, freshness, and extraction accuracy
Build internal metrics to measure scraping performance at scale
Required Hard Skills
Strong experience in scraping (2+ years minimum)
Proven record in web scraping at scale (1M+ docs/day)
Experience with scraping frameworks: lxml , Selenium / Playwright, Requests, BeautifulSoup
Large-scale scraping best practices: concurrency, task scheduling, proxy rotation, caching strategies, error handling & bypass rules
Experience with social media scraping: (X, Telegram, WhatsApp, etc.)
Strong knowledge of: background jobs (Celery or equivalents), Django integration, Python parsing & normalization, HTML content extraction, Database ingestion
Comfortable with: CI/CD, Git, Quality-oriented code (tests, docs)
Bonus Skills (Nice to Have)
Scraping anti-bot techniques (captcha, session hijack, mobile / device emulation, …)
Performance testing & benchmarking
Knowledge of NLP, embeddings, search pipelines, information retrieval
Soft Skills
Strong ownership mindset
Autonomous and proactive
Fast learner, adaptable to fast-changing environments
Fluent English (written and spoken)
Why Join Us?
Cutting-edge AI startup
building the future of market intelligence used by global leaders.
High-impact work
on core systems powering large-scale data collection and strategic insights.
Ownership opportunities
, including potential equity and long-term incentives based on profile.
Elite engineering culture
, working with top-tier engineers, AI and data experts.
Recruitment Process
We propose 3 rounds over two weeks:
30-minute call
with Ludovic to understand your goals and situation.
2-hour test interview
with François to assess your hard skills.
45-minutes- tech interview
- deeper dive into your technical expertise.