Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

NavigAItor: Una herramienta recomendadora de LLMs basada en la descripción del dominio a aplicar

dc.contributor.advisorSagredo Olivenza, Ismael
dc.contributor.authorLucena Prieto, Ángela
dc.date.accessioned2024-07-02T14:17:30Z
dc.date.available2024-07-02T14:17:30Z
dc.date.issued2024
dc.degree.titleGrado en Ingeniería Informática
dc.descriptionTrabajo de Fin de Grado en Ingeniería Informática, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2023/2024.
dc.description.abstractEl procesamiento del lenguaje natural (NLP) ha sido un desafío tecnológico durante décadas. Este estudio se centra en evaluar el rendimiento de diversos modelos de lenguaje a gran escala (LLMs) en casos de uso específicos de NLP, con el objetivo principal de desarrollar un asistente virtual llamado NavigAItor que ofrezca recomendaciones basadas en los resultados del estudio. Se identifican y comparan modelos de OpenAI, LLAMA y Mistral en dos contextos: el análisis de entrevistas de trabajo y de llamadas telefónicas. Se han utilizado herramientas de evaluación que incluyen un formulario para la valoración subjetiva de los usuarios sobre las salidas generadas en las tareas de cada caso de uso por cada modelo, junto con la medición de la latencia, indicando el tiempo que cada modelo tarda en ejecutar dichas tareas. Además, se ha llevado a cabo una investigación exhaustiva sobre otras métricas relevantes, como el rendimiento en benchmarks estandarizados y el precio por token. Los resultados obtenidos buscan guiar a desarrolladores y profesionales de IA en la selección de modelos de lenguaje para aplicaciones del mundo real, contribuyendo al avance del campo del NLP y mejorando la eficacia de las soluciones implementadas.
dc.description.abstractNatural Language Processing (NLP) has been a technological challenge for decades. This study focuses on evaluating the performance of various large language models (LLMs) in specific NLP use cases, with the primary objective of developing a virtual assistant called NavigAItor that provides recommendations based on the study's findings. Models from OpenAI, LLAMA, and Mistral are identified and compared in two contexts: the analysis of job interviews and phone calls. Evaluation tools used include a user feedback form for subjective assessment of the outputs generated by each model for each use case task, along with latency measurement indicating the time each model takes to execute these tasks. Additionally, an exhaustive investigation into other relevant metrics, such as performance in standardized benchmarks and cost per token, has been conducted. The results aim to guide developers and AI professionals in selecting language models for real-world applications, contributing to the advancement of NLP and improving the effectiveness of implemented solutions.
dc.description.departmentDepto. de Ingeniería de Software e Inteligencia Artificial (ISIA)
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.identifier.urihttps://hdl.handle.net/20.500.14352/105447
dc.language.isospa
dc.page.total160
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu004(043.3)
dc.subject.keywordModelos Grandes de Lenguaje (LLM)
dc.subject.keywordProcesamiento del lenguaje natural (NLP)
dc.subject.keywordGeneración de resúmenes
dc.subject.keywordExtracción de insights
dc.subject.keywordTalent Scan
dc.subject.keywordSmart Call Transcript
dc.subject.keywordMétricas de evaluación
dc.subject.keywordBechmarks estandarizados
dc.subject.keywordAsistente virtual
dc.subject.keywordInteligencia artificial.
dc.subject.keywordLarge Language Models (LLM)
dc.subject.keywordNatural Language Processing (NLP)
dc.subject.keywordText generation
dc.subject.keywordInsights extraction
dc.subject.keywordEvaluation metrics
dc.subject.keywordStandardized benchmarks
dc.subject.keywordVirtual assistant
dc.subject.keywordArtificial intelligence
dc.subject.ucmInformática (Informática)
dc.subject.unesco33 Ciencias Tecnológicas
dc.titleNavigAItor: Una herramienta recomendadora de LLMs basada en la descripción del dominio a aplicar
dc.title.alternativeNavigAItor: A tool for recommending LLMs base don the description of the domain to apply
dc.typebachelor thesis
dc.type.hasVersionAM
dspace.entity.typePublication

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
NavigAItor: Una herramienta recomendadora de LLMs basada en la descripción del dominio a aplicar.PDF
Size:
9.59 MB
Format:
Adobe Portable Document Format
Description:
NavigAItor: Una herramienta recomendadora de LLMs basada en la descripción del dominio a aplicar