Emplois actuels liés à Python Web Scraping Expert - Paris, Île-de-France - NewsCore
-
Data Scientist Junior
il y a 4 jours
Paris, Île-de-France Beamy Temps pleinBeamy détecte l'usage de 50K+ SaaS en temps réel chez 500K+ utilisateurs dans les grandes entreprises. Nous collectons des millions de signaux quotidiens pour aider les équipes IT à optimiser leur portefeuille logiciel et construire leur stratégie IT data-driven. Notre technologie brevetée combine extension navigateur, traitements massifs de données...
-
MCP & Tools Python Developer - Agent Evaluation Infrastructure
il y a 2 semaines
Paris, Île-de-France Mindrift Temps pleinThis opportunity is only for candidates currently residing in the specified country. Your location may affect eligibility and rates. Please submit your resume in English and indicate your level of English proficiency.At Mindrift, innovation meets opportunity. We believe in using the power of collective human intelligence to ethically shape the future of...
-
Développeur Full-Stack
il y a 3 jours
Paris, Île-de-France Kicklox Temps pleinL'offreSecteursAutomobile, Aéronautique, Spatial, Défense & Sécurité, Ferroviaire, Télécommunications, Energie, Services & Systèmes d'Informations, Chimie / Pétrochimie, Digital & E-Commerce, Naval, Machines & Industrie Lourde, Pharmaceutique / Biotechnologie, Banque & Assurance, BTPDescription De L'offreDescription de l'offre : Nous recrutons pour...
-
Expert DATA PowerBI
il y a 2 semaines
Paris, Île-de-France ANDERSON RH Temps pleinNous recherchons un Expert DATA et PowerBI Expérimenté maîtrisant parfaitement l'écriture de requête SQL, langage DAX et langage PowerQuery, connaissance de PowerBI Report Server.Vos missions1 - Amélioration de l'infra existantea. Revoir tous les workflows et la partie code (Python ?)b. Mettre tous les workflows sous supervision (s'assurer que les...
-
Développeur web Magnolia
il y a 4 jours
Paris, Île-de-France act digital Temps pleinJob Description Vous intégrerez, au sein de notre Delivery Center de Casablanca, une équipe d'experts en développement de solutions logicielles.Vos missions seront les suivantes :Travailler au sein d'une équipe agile sur le développement et la maintenance du site webInteraction régulière avec toutes les parties prenantes pour l'implémentation et la...
-
Expert Axway
il y a 4 jours
Paris, Île-de-France Codezys Temps pleinMétier : Pilotage de projet ou de programme, ExpertSpécialités technologiques : Gestion des incidents, MFT, Monitoring, ReportingTechnologies et outils : Apache Tomcat, Composer, Linux, VMware, Jboss, ServiceNow, AWS, Axway Synchrony, Python, PHP, Azure, HTTP, Perl, PowerShell, SFTP, Windows, Swift, TCP/IPNormes / Méthodes : ITSM, ITIL, CommandSecteur...
-
Développeur FullStack H/F
il y a 2 semaines
Paris, Île-de-France NEXTON Temps pleinDescription de l'entreprise Qui sommes-nous ?Rejoindre NEXTON, c'est intégrer une entreprise où convergent l'esprit d'un cabinet de conseil, la créativité d'une agence et la dynamique d'une ESN Grâce à notre expertise, nous accompagnons des clients grands comptes et des pure players tels que SNCF, Orange, et BNP Paribas dans leurs stratégies...
-
Stage Equity Sales Trading
il y a 4 jours
Paris, Île-de-France ODDO BHF Temps pleinStellenanzeige auf Homepage anzeigen :Datum der ersten Veröffentlichung :28/01/2026- Ort :PARIS- Tätigkeitsfeld :Equities and Fixed Income- Vertragsart :Praktikum/Werkstudententätigkeit- Vertragsdauer :6 Monat(e)- Startdatum :Juillet 2026- Standort der Position :12 boulevard de la Madeleine 75009 ParisActivitéQue ce soit sur les marchés européens...
-
Expert DevOps
il y a 4 jours
Paris, Île-de-France act digital Temps pleinDescription de l'entreprise ALTER SOLUTIONS est une société de conseil et d'expertise en technologies créée en 2006. Notre vocation est d'accompagner nos clients sur les enjeux technologiques et organisationnels de leur transformation digitale. Notre offre s'articule autour des expertises suivantes :Technologies & Software DeliveryCybersécuritéAvec 6...
-
Cloud Network Expert
il y a 4 jours
Paris, Île-de-France Codezys Temps pleinContexte : Transformation digitale / Organisation dirigée par la technologie ? Passage au CloudEnvironnement international ? Maîtrise de l?anglais professionnel requiseSéniorité : 7 à 10+ années d?expérience2) Objectifs & responsabilités principalesConception & déploiement Cloud NetworkConcevoir, déployer et maintenir des réseaux virtuels Azure &...
Python Web Scraping Expert
Il y a 11 minutes
About NewsCore
NewsCore is an
AI-native market intelligence platform
that helps leading organizations monitor, collect, and analyze strategic information from the web in real time. We enable Fortune-500 corporations, major industrial players, and public institutions to detect emerging risks, competitive moves, regulatory signals, and market trends automatically. We're building
the next generation of automated monitoring systems
, powered by advanced AI, large-scale crawling, and information retrieval technologies.
Your Responsibilities
We are looking for
a scraping expert
to strengthen our ingestion and crawling stack.
You will design resilient pipelines capable of retrieving
millions of documents per day
across:
Websites, Social media, Institutional portals, Company websites, Industry sources
You'll work directly with our CTO and tech teams.
What you will work on
Large-Scale Scraping Architecture
Build and maintain high-volume scraping pipelines capable of ingesting 5M+ article / day
Ensure resiliency, retries, concurrency, proxy rotation, throttling, and anti-bot bypassing
Maintain robust source coverage and maximize recall rate
News & Media Scraping
Scrape news sites, press portals, industry pages, and structured business data
Extract HTML content cleanly (publication date, article content, title, authors, metadata, …)
Social Media Scraping
Extend and improve our stack for: X, Telegram, WhatsApp, Instagram, Tiktok
Manage sessions, cookies, mobile scraping, and API constraints
Backend Integration
Integrate crawling systems with: Django/Fast API backend, Celery workers, Background tasks, Redis caching, Internal ingestion APIs
Persist structured content into our database with indexing, versioning, and enrichment layers
Quality & Monitoring
Detect scraping failures, parsing errors, and source mismatches
Continuously improve content quality, coverage, freshness, and extraction accuracy
Build internal metrics to measure scraping performance at scale
Required Hard Skills
Strong experience in scraping (2+ years minimum)
Proven record in web scraping at scale (1M+ docs/day)
Experience with scraping frameworks: lxml , Selenium / Playwright, Requests, BeautifulSoup
Large-scale scraping best practices: concurrency, task scheduling, proxy rotation, caching strategies, error handling & bypass rules
Experience with social media scraping: (X, Telegram, WhatsApp, etc.)
Strong knowledge of: background jobs (Celery or equivalents), Django integration, Python parsing & normalization, HTML content extraction, Database ingestion
Comfortable with: CI/CD, Git, Quality-oriented code (tests, docs)
Bonus Skills (Nice to Have)
Scraping anti-bot techniques (captcha, session hijack, mobile / device emulation, …)
Performance testing & benchmarking
Knowledge of NLP, embeddings, search pipelines, information retrieval
Soft Skills
Strong ownership mindset
Autonomous and proactive
Fast learner, adaptable to fast-changing environments
Fluent English (written and spoken)
Why Join Us?
Cutting-edge AI startup
building the future of market intelligence used by global leaders.
High-impact work
on core systems powering large-scale data collection and strategic insights.
Ownership opportunities
, including potential equity and long-term incentives based on profile.
Elite engineering culture
, working with top-tier engineers, AI and data experts.
Recruitment Process
We propose 3 rounds over two weeks:
30-minute call
with Ludovic to understand your goals and situation.
2-hour test interview
with François to assess your hard skills.
45-minutes- tech interview
- deeper dive into your technical expertise.