PublicEye, una aplicación web diseñada para la recolección automática de datos en línea

Loading...
Thumbnail Image

Official URL

Full text at PDC

Publication date

2025

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Citations
Google Scholar

Citation

Abstract

PublicEye es una aplicación de web scraping orientada a centralizar y automatizar la extracción de información desde páginas en línea. La herramienta organiza el trabajo en proyectos que agrupan recursos (enlaces configurables con selectores CSS) y permite ejecutar diferentes modos de captura para adaptarse a páginas simples, sitios con navegación en subpáginas o a la extracción de documentos PDF. Cada ejecución genera resultados estructurados y métricas que facilitan la verificación y la repetición controlada. El diseño prioriza tres ideas: declaratividad, para describir qué extraer y cómo sin necesidad de programar; observabilidad, para dejar rastro de lo ocurrido y poder auditarlo; y versatilidad, para cubrir desde HTML estático hasta contenido dinámico que requiere renderizado previo. Con esta base, PublicEye busca reducir tareas manuales de consulta, disminuir errores, y ofrecer un flujo de trabajo comprensible para perfiles no necesariamente técnicos
PublicEye is a web-scraping application designed to centralize and automate information extraction from online pages. The tool organizes work into projects that group resources (links configurable with CSS selectors) and supports different capture modes to adapt to simple pages, sites with subpage navigation, or PDF document extraction. Each run produces structured results and metrics that facilitate verification and controlled repetition. The design prioritizes three ideas: declarativity, to describe what to extract and how without programming; observability, to leave a trace of what happened and enable auditing; and versatility, to cover everything from static HTML to dynamic content that requires prior rendering. On this basis, PublicEye aims to reduce manual checking, decrease errors, and offer a workflow understandable to users who do not necessarily have a technical background.

Research Projects

Organizational Units

Journal Issue

Description

Trabajo de Fin de Grado en Ingeniería Informática, Facultad de Informática UCM, Departamento de Sistemas Informáticos y Computación, Curso 2024/2025

Keywords