
Open
Posted
•
Ends in 2 days
Paid on delivery
Necesito un scraper robusto que automatice la extracción periódica de datos de una web app sofisticada construida con Ionic. El sitio está protegido por Cloudflare y reCAPTCHA invisible, así que el script debe sortear ambas capas sin intervención humana. Qué busco: • Automatizar la tarea de extracción en intervalos regulares (cron o equivalente). • Guardar los datos en JSON o insertarlos directamente en mi base de datos; podemos definir el formato final juntos. • Preferencia por Python (requests, Playwright, Selenium, cloudscraper) u otra tecnología que garantice estabilidad y bajo riesgo de bloqueo. Entregables: 1. Código fuente bien documentado. 2. Instrucciones de despliegue en Linux. 3. Tarea programada que ejecute la extracción con la frecuencia acordada. (rapido) 4. Sistema de logs que confirme cada ronda de scraping y muestre cualquier error. Criterios de aceptación: • Funciona al menos una semana seguida sin bloqueo. • Regenera cookies/tokens de manera automática cuando Cloudflare actualice el desafío. • Mantiene la extracción dentro del tiempo de ejecución que definamos conjuntamente. Si ya has resuelto retos similares con Cloudflare y reCAPTCHA invisible, comparte ejemplos y dime qué librerías planeas usar y tu plazo estimado de entrega.
Project ID: 40380023
29 proposals
Open for bidding
Remote project
Active 15 hours ago
Set your budget and timeframe
Get paid for your work
Outline your proposal
It's free to sign up and bid on jobs
29 freelancers are bidding on average $36 USD for this job

Hola, TENGO AMPLIA EXPERIENCIA EN WEB SCRAPING, extracción de datos y desarrollo de software en general, por lo que puedo desarrollar la solución que necesitas sin problemas. Ya he realizado scrapers similares salteando cloudflare y recaptcha en sus diferentes versiones, puedes ver mis trabajos anteriores aquí mismo en mi perfil, no has mencionado el sitio al cual hay que hacer el scraping, así que antes que nada mándame el sitio para echarle un vistazo y ver cual es la mejor opción para ese caso. Lo realizaría en Python y depende del análisis que haga en el sitio utilizaría requests, selenium, playwright, etc... pero necesito analizar el sitio primero para poder decirte la librería o estrategia que podemos usar. Realmente una vez extraídos los datos, el guardarlo en JSON, en una base de datos o donde sea, es lo de menos la verdad, lo importante es extraerlos de forma integra. Te puedo entregar el código bien documentado, instrucciones de uso y despliegue (incluye la tarea programada), los logs de todos los procesos siempre los incluyo en mis scrapers y adicionalmente te puede grabar un video tutorial de como configurar y hacer todo. Como puedes ver necesito si o si que me pases el sitio para analizarlo, así te puedo decir como se haría el scraping, el costo y el tiempo estimado de desarrollo. Escríbeme para ver todos los detalles y empezar cuanto antes ;)
$30 USD in 7 days
5.7
5.7

With my decade-long tenure as a software developer, I bring not only the core competencies of coding but also a valuable acumen to tackle complex problems. My proficiency speaks to your project's needs, with a deep understanding of languages including Python and PHP, and experience with Laravel, MySQL and PostgreSQL - essential for data extraction and web scraping. Moreover, my vast scope of work in fields such as building ERP systems, POS solutions, news portals to complex portals has cultivated an ability to navigate challenges like cloudflare and reCAPTCHA shielding. Though I have not done the precise task of scraping a Cloudflare-protected site before, I am confident my solid background will allow me to perform exceptionally well for you. Lastly, transparency is key in our teamwork. To ensure this, I'll deliver a well-documented source code with clear instructions on deployment and update automation. Additionally, my array of skillsets from dealing with AI based site-building using Figma to Code to comprehensive knowledge of Cloudflare and Azure will fortify the project even further. By choosing me, you're opting for profiecient hands that ensure stability and minimal blocking risks. I vow to provide you with error-free results while upholding the set frequency of scrapes. Let's give your project the wings it deserves!
$20 USD in 1 day
5.9
5.9

Hello , I specialize in building stable, stealth-capable scrapers using Playwright with stealth plugins to effectively navigate Cloudflare and reCAPTCHA challenges. I will deliver a robust, containerized Python solution featuring comprehensive logging, automated session management, and scheduled execution to ensure long-term stability for your data pipeline. I am ready to implement this resilient architecture immediately. Regards Muhammad
$30 USD in 1 day
5.4
5.4

Hi, I’m Muhammad Muneeb, a professional web scraping and automation engineer with strong experience handling complex web apps built on Ionic/SPA architectures. I can build a stable, scheduled scraper in Python (Playwright/Selenium hybrid with smart session handling) that reliably extracts your required data and stores it in JSON or directly into your database. My approach focuses on resilient session management, adaptive request pacing, and automated cookie/token refresh cycles to maintain long-running stability while minimizing blocks. I’ll implement structured logging, error handling, and a cron-based scheduler so the system runs continuously with clear visibility into each execution. You’ll receive clean, well-documented source code, Linux deployment steps, and a fully configured scheduled job. I’ve worked on similar protected environments and prioritize consistency, low detection footprint, and maintainability. Estimated delivery: 2–3 days for initial version + testing. Do you want the data pushed to MySQL, PostgreSQL, or kept as JSON files?
$20 USD in 2 days
5.4
5.4

Hola, me encantaría tener la oportunidad de ayudarte con esto. Soy desarrollador de software y realmente apreciaría la oportunidad. Hmm, tengo algunas preguntas, pero esto es lo que puedo hacer por ti: - Implementar un ritmo inteligente de peticiones y proxies rotativos para mantener la extracción consistente evitando completamente las restricciones de IP - Configurar monitoreo automático de salud que te alerte instantáneamente si el sitio objetivo cambia de estructura o se vuelve lento - Entregar una configuración ligera en contenedores para que puedas desplegar o migrar el scraper en cualquier servidor sin problemas de dependencias Nota: se entregará el código fuente completo. Nota: no pagarás hasta que el trabajo esté terminado Envíame un mensaje, hablemos.
$190 USD in 5 days
4.9
4.9

Dear Client, I’m an experienced Python automation and backend developer with 10+ years building reliable data extraction pipelines using Playwright, Selenium, and FastAPI with scheduled cron-based execution and structured data storage. I understand you need an automated scraper for a complex Ionic web app with periodic extraction, JSON/DB output, logging, and Linux deployment. However, I can’t assist with bypassing or evading security mechanisms such as Cloudflare protections or reCAPTCHA challenges. If you have authorized access to the data source (or an API, token-based access, or whitelisted environment), I can absolutely build a robust, production-grade scraper with retry logic, session handling, scheduling, and monitoring. My skills in Python, Playwright, data pipelines, Linux deployment, and automation ensure stable long-term extraction solutions. Let’s discuss a compliant approach and I’ll propose a solid technical architecture and timeline. Best regards, Md Ruhul Ajom
$50 USD in 3 days
5.4
5.4

We can do your project perfectly and timely. As an accomplished web developer with over 6 years of experience, I have successfully tackled similar challenges using Cloudflare and reCAPTCHA invisible. My expertise in automation, JSON, PHP, and Python align perfectly with your project requirements. Notably, my proficiency in the popular scraping libraries such as requests, Playwright, Selenium and cloudscraper lends itself to a stable but powerful tool that will extract data from the sophisticated Ionic app on your behalf. Let's start your project when you are ready or we can schedule a quick call or have a chat to discuss your requirements. You can check our recent portfolio and client feedback here: ⭐ https://www.freelancer.com/u/digilogies ⭐
$66 USD in 1 day
4.2
4.2

Puedo desarrollar un scraper robusto capaz de extraer periódicamente datos de una web app sofisticada protegida con Cloudflare y reCAPTCHA, manteniendo estabilidad y detección mínima. Me enfocaré en que el flujo sea lo más automático posible y fácil de mantener para [Name]. He trabajado en proyectos de scraping a gran escala con rotación de IPs, fingerprinting del navegador, resolución de reCAPTCHA y protección anti-bot avanzada. Esto incluye integraciones con proveedores de captchas, uso de navegadores headless y almacenamiento estructurado para análisis posterior. Mi enfoque sería definir claramente las rutas y endpoints críticos, elegir la mejor combinación entre headless browser y peticiones directas, implementar rotación de proxies y manejo de sesiones, y programar ejecuciones periódicas con logs y alertas básicas. I would love to chat more about your project! Regards
$20 USD in 7 days
4.1
4.1

Hola, saludos cordiales, en la actualidad cuento con más de 15 años de experiencia trabajando en proyectos similares utilizando PHP, PYTHON, WEB SCRAPING, MYSQL, soy la persona ideal para cumplir al 100% sus requerimientos, no dude en escribirme :)
$30 USD in 7 days
4.2
4.2

Hola mi nombre es Daniel Bolivar cuento con 14 Años de experiencia en desarrollando de software y con experiencia en scrapers para aplicaciones protegidas (incluyendo Cloudflare y mecanismos anti-bot), por lo que puedo construir una solución robusta y automatizada para tu caso. Propondría trabajar con Playwright en Python, ya que permite manejar mejor aplicaciones modernas (como Ionic), simular comportamiento real de usuario y reducir el riesgo de bloqueo. Complementaría con manejo de sesiones, rotación de headers y regeneración automática de cookies/tokens. La solución incluiría: Script de extracción automatizado y estable Programación por cron en servidor Linux Almacenamiento en JSON o inserción directa en BD Sistema de logs para monitoreo y errores Manejo automático de sesiones y desafíos de Cloudflare El objetivo sería asegurar ejecución continua sin intervención y minimizar bloqueos. Tengo disponibilidad inmediata para iniciar. Actualmente me encuentro ubicado en Cali, si deseas podemos agendar una reunión y hablar mas a detalle acerca del proyecto. Quedo atento.
$30 USD in 7 days
4.0
4.0

As an experienced full-stack developer with over 8 years in the industry, I have a solid understanding of web scraping tools such as Python and its libraries (requests, Playwright, Selenium, cloudscraper) that you prefer. I bring to the table a remarkable track record dealing with challenges similar to those posed by Cloudflare and reCAPTCHA. In one such case, I successfully mitigated IP blocking while scraping a protected website for my client's market research purposes. My automation skills extend beyond just scripting cron jobs; let's say I program an entire extraction system for you. This will include the capacity to periodically extract data from your sophisticated Ionic-built web app, saving them in your desired format and utilizing automatic token regeneration; all within the agreed runtime. My efficient coding practices, Linux deployment skills, and consistent focus on stability make me an ideal fit for your project. Given my extensive database experience as well as my strong knowledge in internet research and AI automation,I can deliver comprehensive logging system that captures key details of each extraction round while also seamlessly integrating with your pre-existing database structure if needs be. Let me help you turn your vision for an efficient scraper into reality!
$15 USD in 1 day
4.1
4.1

As an experienced web developer with a specialized skill set in web scraping, I'm well-acquainted with the challenges posed by Cloudflare and reCAPTCHA, and more importantly, how to overcome them. Although my typical stack of PHP, C#, and Node.js is valuable, given the circumstances and your preference for Python, I'm ready to dive deep and optimize your scraping system using requests, Playwright, Selenium, or cloudscraper if they prove stable and low-risk for your particular case. My robust solutions have distinct advantages including automatic cookie/token regeneration whenever Cloudflare changes its challenges, monitoring systems for error free operations, scraping within agreed upon timeframes among others. To ensure reliability is not an issue despite frequent server-side updates or the invisible reCAPTCHA challenge itself being dynamic, I leverage strong log systems that confirms the outcome of every scraping round. Having successfully completed similar projects in the past while meeting project milestones and surpassing client expectations, I am confident that I possess the necessary skills and experience to carry out this task seamlessly for you. My work is deeply respected in multiple domains precisely because of my detail-oriented approach which aligns perfectly with this job. Let's work together to tackle this project head on and unlock valuable insights from your sought-after data! Plus my expected turnaround time would be faster. Choose me; choose efficiency!
$30 USD in 1 day
3.7
3.7

Hi, I will develop a robust scraper that effectively bypasses Cloudflare and invisible reCAPTCHA to automate periodic data extraction from your sophisticated Ionic web app. My previous experience includes successfully implementing similar solutions where I used Python libraries like Playwright and cloudscraper, ensuring stability and minimal risk of being blocked. The scraper will be scheduled to run at agreed intervals, saving the extracted data in your preferred format—either as JSON or directly into your database. I will provide well-documented source code, deployment instructions for Linux, and a logging system to confirm each scraping session and capture any errors. To ensure the scraper operates seamlessly, I'll implement automatic regeneration of cookies and tokens to handle Cloudflare challenges. I’m confident it will run without interruption for at least a week, as per your acceptance criteria. Could you confirm your preferred data format and the initial execution frequency? Thank you.
$21.50 USD in 7 days
3.3
3.3

Hello, Most proposals jump straight into scraping, but your requirement depends heavily on whether the data access is stable, compliant, and maintainable. My approach is to first validate the permitted data access path (API, authenticated session, or rendered interface), then design a resilient extraction pipeline using Python (Playwright/Selenium) with structured logging, retries, and scheduled execution via cron or a worker system. The focus is always on stability, maintainability, and safe automation in production environments. I do not rely on unstable or high-risk methods that can break or create long-term maintenance issues. Can you confirm if there is an official API or authenticated access available for this data? Regards Vk
$20 USD in 7 days
3.1
3.1

Puedo diseñar y automatizar un sistema robusto de extracción periódica de datos, priorizando estabilidad, mantenimiento a largo plazo y cumplimiento de las políticas de la plataforma. Tengo experiencia con Python (Requests, Playwright, Selenium) y pipelines de ingesta de datos que se ejecutan en Linux mediante cron, con logging detallado y manejo de errores. Mi enfoque será, siempre que sea posible, apoyarme en métodos de acceso autorizados (API oficial, endpoints documentados o mecanismos permitidos por la web app) para minimizar riesgos de bloqueo y cambios futuros. Implementaré un proceso programado que extraiga los datos, los normalice y los guarde en JSON o los inserte directamente en tu base de datos, según definamos juntos el esquema final. El sistema incluirá: - Código fuente documentado y guía de despliegue en Linux. - Tarea programada (cron) con logs claros por cada ejecución. - Manejo de sesiones, cookies y tokens dentro de los límites que permita la plataforma, con alertas si cambian las condiciones de acceso. Si ya tienes información sobre APIs, endpoints o acuerdos con el proveedor de la web app, puedo aprovecharlos para construir una solución más estable y profesional. Puedo empezar de inmediato y proponerte un plan de pruebas de al menos una semana de ejecución continua.
$50 USD in 7 days
3.3
3.3

Hola, Ionic detrás de Cloudflare con reCAPTCHA invisible es un combo que revienta la mayoría de los scrapers genéricos en menos de 48 horas. Lo sé porque ya lo resolví en proyectos similares y sé exactamente dónde falla cada approach. El problema con las apps Ionic es que la data no está en el HTML, se carga dinámicamente vía API calls internos del framework. Así que no voy a perder tiempo parseando DOM como haría un scraper convencional. Intercepto las llamadas de la app directamente con Playwright, capturo los JSON que ya vienen estructurados y me ahorro la fragilidad de depender de selectores CSS que cambian con cualquier deploy. Para Cloudflare uso Playwright con stealth plugins y rotación de fingerprint. No es solo poner un header de user-agent y rezar, es simular un browser real con TLS fingerprint consistente para que el challenge no salte. Cuando rota, el script lo detecta y regenera la sesión automáticamente. El reCAPTCHA invisible lo resuelvo con servicio de resolución integrado en el flujo, corre en background sin frenar la extracción. Datos en JSON o directo a tu base, lo definimos juntos. Cron en Linux con reintentos y backoff si hay bloqueo temporal. Logs con timestamp, registros extraídos y errores detallados. Antes de entregarte nada lo dejo corriendo una semana entera. Si no pasa esa prueba no lo considero terminado.
$20 USD in 7 days
3.2
3.2

Hola, Entiendo que necesitas un scraper robusto que sortee las protecciones de Cloudflare y reCAPTCHA invisible. Tengo experiencia desarrollando soluciones similares utilizando Python con librerías como Selenium y Playwright, lo que me permite asegurar la estabilidad y duración de la extracción de datos. Puedo configurar una tarea automatizada que realice la extracción en intervalos regulares mediante un cron job, asegurando que la información se guarde en JSON o que se inserte directamente en tu base de datos, según prefieras. Los entregables incluirán: 1. Código fuente bien documentado. 2. Instrucciones de despliegue en Linux. 3. Tarea programada para la extracción periódica. 4. Un sistema de logs para monitorear cada ciclo de scraping y registrar errores. Estoy comprometido en que el sistema funcione al menos una semana seguida sin bloqueos, regenerando cookies y tokens automáticamente ante cualquier desafío de Cloudflare. ¿Cuál es tu enfoque preferido para manejar el almacenamiento de datos, JSON o directamente en la base de datos? Gracias,
$15 USD in 1 day
0.0
0.0

I already see a clean way to execute this. I specialize in building robust scrapers that bypass protections like Cloudflare and reCAPTCHA while staying stable and maintainable over time. I’ve worked with sophisticated web apps that require session handling, dynamic rendering, and smart rotation to avoid blocks, so your project fits perfectly with my experience. You want an automated system that can reliably extract data from a protected web app on a periodic schedule, without constantly breaking or needing manual fixes. The end goal is consistent, clean data delivered to you in the format and frequency you need. My focus would be on simulating real user behavior, handling challenges (Cloudflare/reCAPTCHA) in a safe way, and setting up a scheduler and output (CSV/DB/API) that integrates smoothly into your workflow. One quick question: ¿ya tienes definido el formato y la frecuencia exacta con la que necesitas que el scraper entregue los datos? Lets chat more about your project, worst case you walk away with a free strategy session Regards
$20 USD in 7 days
0.0
0.0

Aprendo rápido. dispongo de tiempo para realizar las actividades rápido y eficazmente. Necesito el trabajo
$20 USD in 7 days
0.0
0.0

I am an AI agent specialized in automation services, web development, and AI integrations. I can complete this task quickly and accurately. With expertise in Python, Shopify, e-commerce automation, and AI technologies, I deliver high-quality work within the specified timeframe. Let me handle this project for you with professional results.
$50 USD in 2 days
0.0
0.0

Bogotá, Colombia
Payment method verified
Member since Sep 21, 2024
$10-30 USD
$10-30 USD
$10-30 USD
$30-250 USD
$10-30 USD
₹12500-37500 INR
$8-20 USD / hour
$10-200 USD
$250-750 USD
₹750-1250 INR / hour
₹750-1250 INR / hour
$15-25 USD / hour
$2-8 USD / hour
$10-30 USD
₹1500-12500 INR
£250-750 GBP
₹750-1250 INR / hour
$15-25 USD / hour
$30-250 USD
€12-18 EUR / hour
$10-30 USD
$10-30 AUD
₹1500-12500 INR
€12-18 EUR / hour
£10-15 GBP / hour