NavigAItor: Una herramienta recomendadora de LLMs basada en la descripción del dominio a aplicar

Lucena Prieto, Ángela

NavigAItor: Una herramienta recomendadora de LLMs basada en la descripción del dominio a aplicar

dc.contributor.advisor	Sagredo Olivenza, Ismael
dc.contributor.author	Lucena Prieto, Ángela
dc.date.accessioned	2024-07-02T14:17:30Z
dc.date.available	2024-07-02T14:17:30Z
dc.date.issued	2024
dc.degree.title	Grado en Ingeniería Informática
dc.description	Trabajo de Fin de Grado en Ingeniería Informática, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2023/2024.
dc.description.abstract	El procesamiento del lenguaje natural (NLP) ha sido un desafío tecnológico durante décadas. Este estudio se centra en evaluar el rendimiento de diversos modelos de lenguaje a gran escala (LLMs) en casos de uso específicos de NLP, con el objetivo principal de desarrollar un asistente virtual llamado NavigAItor que ofrezca recomendaciones basadas en los resultados del estudio. Se identifican y comparan modelos de OpenAI, LLAMA y Mistral en dos contextos: el análisis de entrevistas de trabajo y de llamadas telefónicas. Se han utilizado herramientas de evaluación que incluyen un formulario para la valoración subjetiva de los usuarios sobre las salidas generadas en las tareas de cada caso de uso por cada modelo, junto con la medición de la latencia, indicando el tiempo que cada modelo tarda en ejecutar dichas tareas. Además, se ha llevado a cabo una investigación exhaustiva sobre otras métricas relevantes, como el rendimiento en benchmarks estandarizados y el precio por token. Los resultados obtenidos buscan guiar a desarrolladores y profesionales de IA en la selección de modelos de lenguaje para aplicaciones del mundo real, contribuyendo al avance del campo del NLP y mejorando la eficacia de las soluciones implementadas.
dc.description.abstract	Natural Language Processing (NLP) has been a technological challenge for decades. This study focuses on evaluating the performance of various large language models (LLMs) in specific NLP use cases, with the primary objective of developing a virtual assistant called NavigAItor that provides recommendations based on the study's findings. Models from OpenAI, LLAMA, and Mistral are identified and compared in two contexts: the analysis of job interviews and phone calls. Evaluation tools used include a user feedback form for subjective assessment of the outputs generated by each model for each use case task, along with latency measurement indicating the time each model takes to execute these tasks. Additionally, an exhaustive investigation into other relevant metrics, such as performance in standardized benchmarks and cost per token, has been conducted. The results aim to guide developers and AI professionals in selecting language models for real-world applications, contributing to the advancement of NLP and improving the effectiveness of implemented solutions.
dc.description.department	Depto. de Ingeniería de Software e Inteligencia Artificial (ISIA)
dc.description.faculty	Fac. de Informática
dc.description.refereed	TRUE
dc.description.status	unpub
dc.identifier.uri	https://hdl.handle.net/20.500.14352/105447
dc.language.iso	spa
dc.page.total	160
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 International	en
dc.rights.accessRights	open access
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu	004(043.3)
dc.subject.keyword	Modelos Grandes de Lenguaje (LLM)
dc.subject.keyword	Procesamiento del lenguaje natural (NLP)
dc.subject.keyword	Generación de resúmenes
dc.subject.keyword	Extracción de insights
dc.subject.keyword	Talent Scan
dc.subject.keyword	Smart Call Transcript
dc.subject.keyword	Métricas de evaluación
dc.subject.keyword	Bechmarks estandarizados
dc.subject.keyword	Asistente virtual
dc.subject.keyword	Inteligencia artificial.
dc.subject.keyword	Large Language Models (LLM)
dc.subject.keyword	Natural Language Processing (NLP)
dc.subject.keyword	Text generation
dc.subject.keyword	Insights extraction
dc.subject.keyword	Evaluation metrics
dc.subject.keyword	Standardized benchmarks
dc.subject.keyword	Virtual assistant
dc.subject.keyword	Artificial intelligence
dc.subject.ucm	Informática (Informática)
dc.subject.unesco	33 Ciencias Tecnológicas
dc.title	NavigAItor: Una herramienta recomendadora de LLMs basada en la descripción del dominio a aplicar
dc.title.alternative	NavigAItor: A tool for recommending LLMs base don the description of the domain to apply
dc.type	bachelor thesis
dc.type.hasVersion	AM
dspace.entity.type	Publication

Download

Original bundle

Now showing 1 - 1 of 1

Name:: NavigAItor: Una herramienta recomendadora de LLMs basada en la descripción del dominio a aplicar.PDF
Size:: 9.59 MB
Format:: Adobe Portable Document Format
Description:: NavigAItor: Una herramienta recomendadora de LLMs basada en la descripción del dominio a aplicar

Download

Collections

Trabajos Fin de Grado (TFG) y Diplomas de Estudios Avanzados (DEA)