Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Clasificador Multi-nivel para la identificación de individuos en riesgo de desarrollar sobrepeso

Loading...
Thumbnail Image

Official URL

Full text at PDC

Publication date

2021

Advisors (or tutors)

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Citations
Google Scholar

Citation

Abstract

En este trabajo se ha desarrollado un sistema clasificador basado en técnicas de inteligencia artificial y aprendizaje automático. El sistema consiste en un novedoso mecanismo de clasificación Multi-nivel en el que se combinan hasta tres clasificadores diferentes. Éstos han sido seleccionados de un conjunto de 14 algoritmos de clasificación supervisada mediante un proceso previo de validación cruzada. El clasificador funciona colocando por niveles distintos algoritmos de clasificación y estableciendo unos umbrales para la aceptación de la respuesta de cada uno de los algoritmos. Los algoritmos de clasificación proporcionan tanto el grupo que asignan, como la probabilidad de que esa clasificación sea correcta. Si la probabilidad que proporciona el primer algoritmo es superior a este umbral, la decisión del clasificador se da por correcta, en caso contrario se solicita una clasificación al algoritmo del siguiente nivel y así sucesivamente. Este clasificador Multi-nivel se ha diseñado específicamente para adaptarse a los datos del proyecto Genobia-CM, aunque su diseño permite aplicarlo a cualquier otro problema que utilice el formato de datos de entrada adecuado, que es el habitual en problemas de clasificación. Genobia es un proyecto participado por un consorcio de 20 instituciones, hospitales y empresas, financiado por el Fondo Social Europeo y la Comunidad de Madrid (genobia.es). El proyecto busca diseñar, utilizando inteligencia artificial, algoritmos predictivos para la identificación de personas en riesgo de desarrollar sobrepeso, obesidad y sus patologías asociadas. En este trabajo se ha utilizado una base de datos con 1179 individuos proporcionada por el Consorcio en el que se recoge información de los hábitos de vida y adherencia a la dieta mediterránea. Se ha implementado el clasificador Multi-nivel como algoritmo predictivo y de clasificación del riesgo de padecer sobrepeso, adaptándolo a los datos proporcionados donde el número de casos de obesidad es muy reducido. Mediante nuestra propuesta se consigue reducir el número de falsos negativos, lo que es fundamental dentro del problema en cuestión, ya que, al tratarse de salud pública, esto implica reducir el número de acciones clínicas erróneas u omitidas. Los resultados obtenidos rondan el 80 % de tasa de exactitud y nuestro sistema está perfectamente preparado para aceptar los datos que proporcione el consorcio en el futuro. Estos datos incluirán información genética de cada individuo y esperamos que además incluya un mayor número de casos. Además, se han realizado otros tipo de clasificadores basados en árboles de decisión, así como un exhaustivo análisis de las variables, su influencia en los modelos, redundancias y un estudio de sensibilidad de los modelos a las mismas.
In this work, a classification system based on artificial intelligence and automatic learning techniques has been developed. The system consists of a novel multi-level classification mechanism in which up to three different classifiers are combined. These have been selected from a set of 14 supervised classification algorithms through a previous process of cross validation. The classifier works by placing by levels different classification algorithms and establishing thresholds for the acceptance of the response of each of the algorithms. The classification algorithms provide both the group they assign and the probability that the classification is correct. If the probability provided by the first algorithm is higher than this threshold, the decision of the classifier is considered to be correct, otherwise a classification is requested to the algorithm of the next level and so on. This multi-level classifier has been specifically designed to adapt to the data of the Genobia-CM project, although its design allows it to be applied to any other problem using the appropriate input data format, which is the usual one in classification problems. Genobia is a project participated by a consortium of 20 institutions, hospitals and companies, financed by the European Social Fund and the Community of Madrid (genobia.es). The project seeks to design, using artificial intelligence, predictive algorithms for the identification of people at risk of developing overweight, obesity and their associated pathologies. In this work, a database with 1179 individuals provided by the Consortium has been used to collect information on living habits and adherence to the Mediterranean diet. The multi-level classifier has been implemented as a predictive and classification algorithm of the risk of suffering from overweight, adapting it to the data provided where the number of cases of obesity is very low. By means of our proposal, the number of false negatives is reduced, which is fundamental within the problem in question, since being a matter of public health, this implies reducing the number of erroneous or omitted clinical actions. The results obtained are around 80% accurate and our system is perfectly prepared to accept the data provided by the consortium in the future. This data will include genetic information of each individual and we hope that it will also include a greater number of cases. In addition, other types of classifiers based on decision trees have been carried out, as well as an exhaustive analysis of the variables, their influence on the models, redundancies and a study of the sensitivity of the models to them.

Research Projects

Organizational Units

Journal Issue

Description

Trabajo Fin de Máster en Ingeniería Informática, Facultad de Informática UCM, Departamento de Arquitectura de Computadores y Automática, Curso 2020/2021.

Unesco subjects

Keywords