Evaluación de rendimiento en técnicas de transcripción de texto manuscrito en imágenes de documentos históricos con contenido económico del siglo XVIII sin tratamiento previo
Loading...
Official URL
Full text at PDC
Publication date
2025
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citation
Abstract
La visión por computadora (CV por sus siglas en inglés) es una disciplina amplia que incluye el procesamiento de imágenes de forma que permita la extracción de sus características, de manera similar a como lo haría una persona, aunque utilizando técnicas algo diferentes. El reconocimiento de texto manuscrito (HTR por sus siglas en inglés) puede ser considerado una especialización de la CV orientada a reconocer texto escrito a mano en imágenes y convertirlo a un formato que pueda ser manipulado por las máquinas. Ambas disciplinas tienen un relativamente largo historial de investigaciones y progreso a día de hoy, remontándose incluso al siglo XIX en el caso
de HTR, si bien no hay duda de que ambos se han beneficiado enormemente de las mejoras en el ámbito de la inteligencia artificial (AI, por sus siglas en inglés), especialmente el área de las redes neuronales. Este trabajo examina el escenario de HTR aplicado a un caso práctico de transcripción de documentos históricos manuscritos de finales del siglo XVIII representado en forma de imágenes en color JPEG, y compara una aproximación usando una aplicación de código abierto específicamente a historiadores con un conjunto de scripts Python adaptados a la tarea usando la biblioteca AI Tensorflow.
Computer Vision (CV) is a broad discipline that involves processing images in a way that enables the extraction of features of them, very much like a human could do, although it uses slightly different approaches. Handwritten Text Recognition (HTR) can be considered an specialization of CV aimed at recognizing text written by hand in images and converting it to a format that can be manipulated easily by machines. Both disciplines have a somehow long record of studies and progress as of today, going back even to 19th century in the case of HTR, albeit there is no doubt that both have greatly benefit of improvements in the Artificial Intelligence (AI) discipline, especially in the Neural Networks area. This work examines the current landscape of HTR applied to a practical case of transcribing of Spanish historical handwritten documents by the end of 18th century in the form of color JPEG images, and compares an approach using an open source application specifically targeted to History researchers and a tailored set ot Python scripts using Tensorflow AI library.
Computer Vision (CV) is a broad discipline that involves processing images in a way that enables the extraction of features of them, very much like a human could do, although it uses slightly different approaches. Handwritten Text Recognition (HTR) can be considered an specialization of CV aimed at recognizing text written by hand in images and converting it to a format that can be manipulated easily by machines. Both disciplines have a somehow long record of studies and progress as of today, going back even to 19th century in the case of HTR, albeit there is no doubt that both have greatly benefit of improvements in the Artificial Intelligence (AI) discipline, especially in the Neural Networks area. This work examines the current landscape of HTR applied to a practical case of transcribing of Spanish historical handwritten documents by the end of 18th century in the form of color JPEG images, and compares an approach using an open source application specifically targeted to History researchers and a tailored set ot Python scripts using Tensorflow AI library.
Description
Trabajo de Fin de Máster en Ingeniería Informática, Facultad de Informática UCM, Departamento de Sistemas Informáticos y Computación, Curso 2024/2025.