%0 Thesis %A Redondo Antón, Javier %T Comparativa de modelos de random forest y redes neuronalesaplicados al mantenimiento predictivo con valores ausentes ydatos desbalanceados %D 2021 %U https://hdl.handle.net/20.500.14352/5181 %X En este trabajo se describen las tareas seguidas para solucionar un problema de mantenimiento predictivo que consiste en utilizar técnicas de aprendizaje automático para predecir si un componente específico del sistema de aire comprimido de un camión pesado se enfrentará a un fallo inminente. Este problema se modela como un problema de clasificación, ya que el objetivo es determinar si una instancia no observada representa un fallo o no. Se evalúan varios algoritmos de clasificación y se investiga cómo tratar con un conjunto de datos desbalanceado y con gran cantidad de valores ausentes. El enfoque se compone de cuatro pasos: (i) la creación de tres conjuntos de datos distintos aplicando diversas técnicas de tratamiento de datos; (ii) la creación de varios modelos de aprendizaje automático; (iii) el ajuste de sus hiperparámetros y del umbral de probabilidad para las predicciones, y (iv) la comparación de resultados entre los distintos modelos sobre los conjuntos creados para determinar la mejor solución. Los resultados muestran que una buena imputación de los valores ausentes y el ajuste del umbral de probabilidad son factores clave a la hora de mejorar el rendimiento de los clasificadores. %X This paper describes the workflow used to solve a predictive maintenance problem that consists in using machine learning techniques to predict whether a specific component of the Air Pressure System of a heavy truck is facing an imminent failure. This problem is modeled as a classification problem, since the objective is to determine whether or not an unobserved instance represents a failure. Several classification algorithms are evaluated and it is investigated how to deal with an unbalanced dataset with a large number of missing values. The approach consists of four steps: (i) the creation of three different datasets by applying various data processing techniques; (ii) the creation of several machine learning models; (iii) the adjustment of their hyperparameters and probability threshold for predictions; and (iv) the comparison of results between the different models on the created datasets to determine the best solution. The results show that appropriate imputation of missing values and adjustment of the probability threshold are key factors in improving the performance of the classifiers. %~