%0 Thesis %A Gil Gavela, Sergio %T Desarrollo de aplicación basada en modelos de clasificación para diagnóstico de enfermedades cardiovasculares. %D 2021 %U https://hdl.handle.net/20.500.14352/10592 %X Según la OMS, las enfermedades cardiovasculares son la primera causa de muerte en el mundo. Para las personas que padecen enfermedades cardiovasculares, es crucial la detección precoz de la existencia de la enfermedad o de un infarto cardiaco. Con este propósito A. Janosi et al. crearon una base de datos en la que se recogían 14 parámetros médicos de pacientes a su entrada en el hospital. Algunos de estos pacientes finalmente presentaron una enfermedad cardiovascular y algunos resultaron estar sanos.El propósito de este trabajo es, a partir de la base de datos de A. Janosi et al., crear un modelo que prediga la probabilidad de padecer una enfermedad cardíaca. Para ello se evaluará el rendimiento de los siguientes modelos de clasificación y regresión sobre la base de datos de A. Janosi et al.:Naive BayesKNNRegresión linearRegresión logísticaRandom forestEstos modelos se evaluarán atendiendo principalmente a dos indicadores de la bondad de un modelo:AUCValor F1Tras la evaluación se determinará cual es el modelo que mejores resultados ofrece y se desarrollará una interfaz gráfica que integre dicho modelo. Esta interfaz gráfica en forma de calculadora permitirá al personal sanitario introducir los parámetros médicos e imprimirá por pantalla la probabilidad de que el paciente padezca una enfermedad cardiovascular. %X According to WHO, cardiovascular diseases are the primary cause of death in the world. It is crucial for people who suffer from heart diseases an early diagnosis of the disease or of a heart attack. For this purpose, A. Janosi et al. developed a data set based on 14 medical parametres measured when patients entered hospital. Some of these patients finally suffered from a heart disease and some were healthy. This project purpose is to develop a model based on A. Janosi et al. data set which predicts the probability of suffering a heart disease. To this end, several classification and regression models will be tested: Naive BayesKNN Linear regression Logistic regression Random forest This models will be evaluated accordingly to two metrics which indicate how good a model is: AUC F1 score After evaluating the models it will be determined which model is the one that performed best. The best model will be integrated into a graphical interface. The graphical interface will be a calculator in which health professionals will be able to input the parameters and it will display the probability that a patient suffers from a heart disease. %~