PublicEye, una aplicación web diseñada para la recolección automática de datos en línea
| dc.contributor.advisor | González Del Campo Rodríguez Barbero, Ramón | |
| dc.contributor.author | Jerez Rodríguez, Miguel Ángel | |
| dc.contributor.author | Vargas Ventura,Sergio | |
| dc.date.accessioned | 2025-10-07T14:14:33Z | |
| dc.date.available | 2025-10-07T14:14:33Z | |
| dc.date.issued | 2025 | |
| dc.degree.title | Grado en Ingeniería Informática | |
| dc.description | Trabajo de Fin de Grado en Ingeniería Informática, Facultad de Informática UCM, Departamento de Sistemas Informáticos y Computación, Curso 2024/2025 | |
| dc.description.abstract | PublicEye es una aplicación de web scraping orientada a centralizar y automatizar la extracción de información desde páginas en línea. La herramienta organiza el trabajo en proyectos que agrupan recursos (enlaces configurables con selectores CSS) y permite ejecutar diferentes modos de captura para adaptarse a páginas simples, sitios con navegación en subpáginas o a la extracción de documentos PDF. Cada ejecución genera resultados estructurados y métricas que facilitan la verificación y la repetición controlada. El diseño prioriza tres ideas: declaratividad, para describir qué extraer y cómo sin necesidad de programar; observabilidad, para dejar rastro de lo ocurrido y poder auditarlo; y versatilidad, para cubrir desde HTML estático hasta contenido dinámico que requiere renderizado previo. Con esta base, PublicEye busca reducir tareas manuales de consulta, disminuir errores, y ofrecer un flujo de trabajo comprensible para perfiles no necesariamente técnicos | |
| dc.description.abstract | PublicEye is a web-scraping application designed to centralize and automate information extraction from online pages. The tool organizes work into projects that group resources (links configurable with CSS selectors) and supports different capture modes to adapt to simple pages, sites with subpage navigation, or PDF document extraction. Each run produces structured results and metrics that facilitate verification and controlled repetition. The design prioritizes three ideas: declarativity, to describe what to extract and how without programming; observability, to leave a trace of what happened and enable auditing; and versatility, to cover everything from static HTML to dynamic content that requires prior rendering. On this basis, PublicEye aims to reduce manual checking, decrease errors, and offer a workflow understandable to users who do not necessarily have a technical background. | |
| dc.description.department | Depto. de Sistemas Informáticos y Computación | |
| dc.description.faculty | Fac. de Informática | |
| dc.description.refereed | TRUE | |
| dc.description.status | unpub | |
| dc.identifier.uri | https://hdl.handle.net/20.500.14352/124602 | |
| dc.language.iso | spa | |
| dc.page.total | 107 | |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
| dc.rights.accessRights | open access | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject.cdu | 004.(043.3) | |
| dc.subject.keyword | Web scraping | |
| dc.subject.keyword | Automation | |
| dc.subject.keyword | Official data | |
| dc.subject.keyword | CSS selectors | |
| dc.subject.keyword | ||
| dc.subject.keyword | RoachPHP | |
| dc.subject.keyword | MongoDB | |
| dc.subject.keyword | Puppeteer | |
| dc.subject.ucm | Informática (Informática) | |
| dc.subject.unesco | 33 Ciencias Tecnológicas | |
| dc.title | PublicEye, una aplicación web diseñada para la recolección automática de datos en línea | |
| dc.title | PublicEye, a web application designed for the automated collection of online data | |
| dc.type | bachelor thesis | |
| dc.type.hasVersion | AM | |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | e0e021d9-603b-4e00-bcde-b4fe302dd2c9 | |
| relation.isAdvisorOfPublication.latestForDiscovery | e0e021d9-603b-4e00-bcde-b4fe302dd2c9 |
Download
Original bundle
1 - 1 of 1
Loading...
- Name:
- PublicEye_una_aplicacion_web.pdf
- Size:
- 1.34 MB
- Format:
- Adobe Portable Document Format


