Reconocimiento de Entidades Nombradas en Textos Legales en Español
dc.contributor.advisor | Martínez Hernández, Luis Alberto | |
dc.contributor.advisor | García Villalba, Luis Javier | |
dc.contributor.author | López Olmos, Álvaro | |
dc.contributor.author | Chen, ZhenBo | |
dc.date.accessioned | 2024-07-03T13:03:47Z | |
dc.date.available | 2024-07-03T13:03:47Z | |
dc.date.issued | 2023 | |
dc.degree.title | Grado en Ingeniería Informática | |
dc.description | In this work, an exhaustive investigation of the use of language models for named entity recognition in Spanish texts and of the techniques for collecting, extracting information and retraining the models is carried out. The main objective of this work is to develop a model based on RoBERTa, using a balanced dataset that guarantees the robustness and reliability of the model. In the study, emphasis is placed on the field of natural language processing, taking advantage of advances in machine learning to improve the recognition of named entities in legal texts in Spanish. The performance of RoBERTa is evaluated and compared with other language models, such as BERT and ALBERT, in order to choose the most appropriate model for the analysis of Spanish texts. For the selection of the dataset, a wide variety of Spanish legal texts are collected, covering different areas and to which different preprocessing techniques are applied. The results obtained after retraining reflect a good performance of the RoBERTa model in entity recognition in Spanish legal texts. Evaluation metrics are presented that demonstrate its efficiency and accuracy in the identification of the mentioned entities. | |
dc.description.abstract | En el presente trabajo se lleva a cabo una exhaustiva investigación del uso de modelos de lenguaje para el reconocimiento de entidades nombradas en textos en español y de las técnicas de recopilación, extracción de información y reentrenamiento de los modelos. El objetivo principal de este trabajo consiste en desarrollar un modelo basado en RoBERTa, utilizando un conjunto de datos balanceado que garantice la solidez y fiabilidad del mismo. En el estudio, se hace énfasis en el campo del procesamiento del lenguaje natural, aprovechando los avances en aprendizaje automático para mejorar el reconocimiento de entidades nombradas en textos legales en español. Se evalúa y compara el rendimiento de RoBERTa con otros modelos de lenguaje, tales como BERT y ALBERT, para elegir el modelo m ́as apropiado para el análisis de textos en español. Para la selección del conjunto de datos, se recolecta una amplia variedad de textos legales en español, cubriendo distintas ́áreas y a los que se aplican diferentes técnicas de preprocesamiento. Los resultados obtenidos tras el reentrenamiento reflejan un buen desempeño del modelo RoBERTa en el reconocimiento de entidades en textos legales en español. Se presentan métricas de evaluación que demuestran su eficacia y precisión en la identificación de entidades mencionadas. | |
dc.description.department | Depto. de Ingeniería de Software e Inteligencia Artificial (ISIA) | |
dc.description.faculty | Fac. de Informática | |
dc.description.refereed | TRUE | |
dc.description.status | unpub | |
dc.identifier.uri | https://hdl.handle.net/20.500.14352/105555 | |
dc.language.iso | spa | |
dc.page.total | 57 | |
dc.rights | Attribution 4.0 International | en |
dc.rights.accessRights | open access | |
dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
dc.subject.cdu | 004(043.3) | |
dc.subject.keyword | Procesamiento del lenguaje natural | |
dc.subject.keyword | Reconocimiento de entidades | |
dc.subject.keyword | Recopilación y extracción de información. | |
dc.subject.keyword | Information collection and extraction | |
dc.subject.keyword | Named entity recognition | |
dc.subject.keyword | Natural language processing | |
dc.subject.ucm | Informática (Informática) | |
dc.subject.unesco | 33 Ciencias Tecnológicas | |
dc.title | Reconocimiento de Entidades Nombradas en Textos Legales en Español | |
dc.title.alternative | Recognition of Named Entities in Spanish Legal Texts | |
dc.type | bachelor thesis | |
dc.type.hasVersion | AM | |
dspace.entity.type | Publication | |
relation.isAdvisorOfPublication | 0f67f6b3-4d2f-4545-90e1-95b8d9f3e1f0 | |
relation.isAdvisorOfPublication.latestForDiscovery | 0f67f6b3-4d2f-4545-90e1-95b8d9f3e1f0 |
Download
Original bundle
1 - 1 of 1
Loading...
- Name:
- 85819_ALVARO_LOPEZ_OLMOS_Entrega_final_TFG_contexto_2404368_541818226.pdf
- Size:
- 1.64 MB
- Format:
- Adobe Portable Document Format