Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Identificación de idiomas mediante técnicas procesamiento de lenguaje natural

dc.contributor.advisorGarcía Merayo, María De Las Mercedes
dc.contributor.authorLucas Caturla, Daniel
dc.contributor.authorHuayllasco De la Cruz, Rogger
dc.contributor.authorSánchez Rodríguez, Jaime
dc.date.accessioned2023-09-20T14:40:33Z
dc.date.available2023-09-20T14:40:33Z
dc.date.issued2023
dc.degree.titleGrado en Ingeniería del Software
dc.descriptionTrabajo de Fin de Grado en Ingeniería del Software, Facultad de Informática UCM, Departamento de Sistemas Informáticos y Computación, Curso 2022/2023.
dc.description.abstractEl presente proyecto, consiste en el análisis, diseño e implementación de un sistema que identifique el lenguaje en el que se ha escrito un texto. El objetivo es el de comparar diferentes implementaciones del algoritmo para evaluar la rapidez y eficiencia sobre cada idioma en el alcance. Para ello se dispone de múltiples textos escritos en diferentes idiomas europeos (obtenidos de la base de datos del Parlamento Europeo) con los que trabajar a lo largo del proceso. Así pues, el proyecto consta de dos partes. Por un lado, se elaborarán programas que adaptarán los textos originales a un formato entendible por los algoritmos de detección de idiomas escogidos, y por otro se realizarán pruebas de tiempo y eficiencia sobre los algoritmos de detección de idiomas para evaluar su potencia a la hora de detectar los diferentes idiomas del alcance. Tanto los algoritmos de detección como el programa de adaptación de textos estarán escritos en el lenguaje de programación Python.
dc.description.abstractThe present project consists of the analysis, design and implementation of a system that identifies the language in which a text has been written. The objective is to compare different implementations of the algorithm to evaluate the speed and efficiency over each language in scope. For this purpose, multiple texts written in different European languages (obtained from the database of the European Parliament) are available to work with throughout the process. Thus, the project consists of two parts. On one hand, programs will be developed to adapt the original texts to a format understandable by the chosen language detection algorithms, and on the other hand, speed and efficiency tests will be performed on the language detection algorithms to evaluate their power in detecting the different languages within the scope. Both the detection algorithms and the text adaptation program will be written in the Python programming language.
dc.description.departmentDepto. de Sistemas Informáticos y Computación
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.identifier.urihttps://hdl.handle.net/20.500.14352/87830
dc.language.isospa
dc.page.total124
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu004(043.3)
dc.subject.keywordPython
dc.subject.keywordInteligencia Artificial
dc.subject.keywordAprendizaje Automático
dc.subject.keywordRandom Forest
dc.subject.keywordK-Nearest Neighbors
dc.subject.keywordSupport Vector
dc.subject.keywordComparativa
dc.subject.keywordIdioma.
dc.subject.keywordArtificial Intelligence
dc.subject.keywordMachine Learning
dc.subject.keywordComparison
dc.subject.keywordLanguage
dc.subject.ucmInformática (Informática)
dc.subject.unesco33 Ciencias Tecnológicas
dc.titleIdentificación de idiomas mediante técnicas procesamiento de lenguaje natural
dc.title.alternativeLanguage identification using natural language processing techniques
dc.typebachelor thesis
dc.type.hasVersionAM
dspace.entity.typePublication
relation.isAdvisorOfPublication28ca46b8-d1eb-42e6-a6e2-f31b193b055b
relation.isAdvisorOfPublication.latestForDiscovery28ca46b8-d1eb-42e6-a6e2-f31b193b055b

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
52808_JAIME_SANCHEZ_RODRIGUEZ_TFG_Idiomas_2404368_1933912092.pdf
Size:
7.52 MB
Format:
Adobe Portable Document Format