NavigAItor: Una herramienta recomendadora de LLMs basada en la descripción del dominio a aplicar
dc.contributor.advisor | Sagredo Olivenza, Ismael | |
dc.contributor.author | Lucena Prieto, Ángela | |
dc.date.accessioned | 2024-07-02T14:17:30Z | |
dc.date.available | 2024-07-02T14:17:30Z | |
dc.date.issued | 2024 | |
dc.degree.title | Grado en Ingeniería Informática | |
dc.description | Trabajo de Fin de Grado en Ingeniería Informática, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2023/2024. | |
dc.description.abstract | El procesamiento del lenguaje natural (NLP) ha sido un desafío tecnológico durante décadas. Este estudio se centra en evaluar el rendimiento de diversos modelos de lenguaje a gran escala (LLMs) en casos de uso específicos de NLP, con el objetivo principal de desarrollar un asistente virtual llamado NavigAItor que ofrezca recomendaciones basadas en los resultados del estudio. Se identifican y comparan modelos de OpenAI, LLAMA y Mistral en dos contextos: el análisis de entrevistas de trabajo y de llamadas telefónicas. Se han utilizado herramientas de evaluación que incluyen un formulario para la valoración subjetiva de los usuarios sobre las salidas generadas en las tareas de cada caso de uso por cada modelo, junto con la medición de la latencia, indicando el tiempo que cada modelo tarda en ejecutar dichas tareas. Además, se ha llevado a cabo una investigación exhaustiva sobre otras métricas relevantes, como el rendimiento en benchmarks estandarizados y el precio por token. Los resultados obtenidos buscan guiar a desarrolladores y profesionales de IA en la selección de modelos de lenguaje para aplicaciones del mundo real, contribuyendo al avance del campo del NLP y mejorando la eficacia de las soluciones implementadas. | |
dc.description.abstract | Natural Language Processing (NLP) has been a technological challenge for decades. This study focuses on evaluating the performance of various large language models (LLMs) in specific NLP use cases, with the primary objective of developing a virtual assistant called NavigAItor that provides recommendations based on the study's findings. Models from OpenAI, LLAMA, and Mistral are identified and compared in two contexts: the analysis of job interviews and phone calls. Evaluation tools used include a user feedback form for subjective assessment of the outputs generated by each model for each use case task, along with latency measurement indicating the time each model takes to execute these tasks. Additionally, an exhaustive investigation into other relevant metrics, such as performance in standardized benchmarks and cost per token, has been conducted. The results aim to guide developers and AI professionals in selecting language models for real-world applications, contributing to the advancement of NLP and improving the effectiveness of implemented solutions. | |
dc.description.department | Depto. de Ingeniería de Software e Inteligencia Artificial (ISIA) | |
dc.description.faculty | Fac. de Informática | |
dc.description.refereed | TRUE | |
dc.description.status | unpub | |
dc.identifier.uri | https://hdl.handle.net/20.500.14352/105447 | |
dc.language.iso | spa | |
dc.page.total | 160 | |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
dc.rights.accessRights | open access | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject.cdu | 004(043.3) | |
dc.subject.keyword | Modelos Grandes de Lenguaje (LLM) | |
dc.subject.keyword | Procesamiento del lenguaje natural (NLP) | |
dc.subject.keyword | Generación de resúmenes | |
dc.subject.keyword | Extracción de insights | |
dc.subject.keyword | Talent Scan | |
dc.subject.keyword | Smart Call Transcript | |
dc.subject.keyword | Métricas de evaluación | |
dc.subject.keyword | Bechmarks estandarizados | |
dc.subject.keyword | Asistente virtual | |
dc.subject.keyword | Inteligencia artificial. | |
dc.subject.keyword | Large Language Models (LLM) | |
dc.subject.keyword | Natural Language Processing (NLP) | |
dc.subject.keyword | Text generation | |
dc.subject.keyword | Insights extraction | |
dc.subject.keyword | Evaluation metrics | |
dc.subject.keyword | Standardized benchmarks | |
dc.subject.keyword | Virtual assistant | |
dc.subject.keyword | Artificial intelligence | |
dc.subject.ucm | Informática (Informática) | |
dc.subject.unesco | 33 Ciencias Tecnológicas | |
dc.title | NavigAItor: Una herramienta recomendadora de LLMs basada en la descripción del dominio a aplicar | |
dc.title.alternative | NavigAItor: A tool for recommending LLMs base don the description of the domain to apply | |
dc.type | bachelor thesis | |
dc.type.hasVersion | AM | |
dspace.entity.type | Publication |
Download
Original bundle
1 - 1 of 1
Loading...
- Name:
- NavigAItor: Una herramienta recomendadora de LLMs basada en la descripción del dominio a aplicar.PDF
- Size:
- 9.59 MB
- Format:
- Adobe Portable Document Format
- Description:
- NavigAItor: Una herramienta recomendadora de LLMs basada en la descripción del dominio a aplicar