Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Integración de datos y análisis predictivo en tratamiento de drogodependencia

dc.contributor.advisorLópez López, María Victoria
dc.contributor.authorMariscal Carhuamaca, Víctor hugo
dc.date.accessioned2023-06-18T07:23:23Z
dc.date.available2023-06-18T07:23:23Z
dc.date.issued2016
dc.descriptionMáster en Ingeniería Informática, Facultad de Informática, Departamento de Arquitectura de Computadores y Automática, curso 2015-2016
dc.description.abstractEl análisis de datos actual se enfrenta a problemas derivados de la combinación de datos procedentes de diversas fuentes de información. El valor de la información puede enriquecerse enormemente facilitando la integración de nuevas fuentes de datos y la industria es muy consciente de ello en la actualidad. Sin embargo, no solo el volumen sino también la gran diversidad de los datos constituye un problema previo al análisis. Una buena integración de los datos garantiza unos resultados fiables y por ello merece la pena detenerse en la mejora de procesos de especificación, recolección, limpieza e integración de los datos. Este trabajo está dedicado a la fase de limpieza e integración de datos analizando los procedimientos existentes y proponiendo una solución que se aplica a datos médicos, centrándose así en los proyectos de predicción (con finalidad de prevención) en ciencias de la salud. Además de la implementación de los procesos de limpieza, se desarrollan algoritmos de detección de outliers que permiten mejorar la calidad del conjunto de datos tras su eliminación. El trabajo también incluye la implementación de un proceso de predicción que sirva de ayuda a la toma de decisiones. Concretamente este trabajo realiza un análisis predictivo de los datos de pacientes drogodependientes de la Clínica Nuestra Señora de la Paz, con la finalidad de poder brindar un apoyo en la toma de decisiones del médico a cargo de admitir el internamiento de pacientes en dicha clínica. En la mayoría de los casos el estudio de los datos facilitados requiere un pre-procesado adecuado para que los resultados de los análisis estadísticos tradicionales sean fiables. En tal sentido en este trabajo se implementan varias formas de detectar los outliers: un algoritmo propio (Detección de Outliers con Cadenas No Monótonas), que utiliza las ventajas del algoritmo Knuth-Morris-Pratt para reconocimiento de patrones, y las librerías outliers y Rcmdr de R. La aplicación de procedimientos de cleaning e integración de datos, así como de eliminación de datos atípicos proporciona una base de datos limpia y fiable sobre la que se implementarán procedimientos de predicción de los datos con el algoritmo de clasificación Naive Bayes en R.
dc.description.abstractThe current data analysis faces problems arising from the combination of data from various sources. The value of information can be enhanced greatly facilitating the integration of new data sources and industry is well aware of it today. However, not only the volume but also the great diversity of data is a problem prior to analysis. A good integration of data ensures reliable results and therefore worth stopping in the specification process improvement, collecting, cleaning and data integration. This work is dedicated to the cleaning phase and data integration analyzing existing procedures and proposing a solution that applies to medical data, thus focusing on projects prediction (with purpose of prevention) in health sciences. In addition to the implementation of cleaning processes, develop algorithms of detection of outliers that allow improving the quality of the data set after being eliminated. The work also includes the implementation of a process of prediction that serve as an aid to decision-making. Specifically this work performs a predictive analysis of the data of patients drug addicts of the clinic Nuestra Señora de la Paz, in order to be able to offer support in decisions of the physician in charge admit the internment of patients in the clinic In the majority of cases the study of data provided requires a proper pre-procesado to traditional statistical analysis results to be reliable. So in this paper are implemented various ways to detect the outliers: an own algorithm (Detection of Outliers not monotonous chains), that uses the advantages of the algorithm Knuth-Morris-Pratt for pattern recognition, and the bookshops outliers and Rcmdr of R. The application of cleaning procedures and data integration and elimination of outliers provides a clean and reliable base data on which prediction procedures be implemented data with Naive Bayes classification algorithm in R.
dc.description.departmentDepto. de Arquitectura de Computadores y Automática
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.eprint.idhttps://eprints.ucm.es/id/eprint/39325
dc.identifier.urihttps://hdl.handle.net/20.500.14352/25168
dc.language.isospa
dc.master.titleMáster en Ingeniería Informática
dc.page.total135
dc.rightsAtribución-NoComercial 3.0 España
dc.rights.accessRightsopen access
dc.rights.urihttps://creativecommons.org/licenses/by-nc/3.0/es/
dc.subject.cdu004.6(043.3)
dc.subject.cdu004.438R(043.3)
dc.subject.cdu004:613.83(043.3)|
dc.subject.keywordIntegración de Datos
dc.subject.keywordData Cleaning
dc.subject.keywordAnálisis de Datos
dc.subject.keywordPredicción
dc.subject.keywordDrogodependencia
dc.subject.keywordDatos Atípicos
dc.subject.keywordRegresión Lineal
dc.subject.keywordNaive Bayes
dc.subject.keywordClasificación
dc.subject.keywordAlgoritmo KMP
dc.subject.keywordData integration
dc.subject.keywordData cleaning
dc.subject.keywordData analysis
dc.subject.keywordPrediction
dc.subject.keywordDrug dependence
dc.subject.keywordOutliers
dc.subject.keywordLinear regression
dc.subject.keywordNaive Bayes classification algorithm KMP
dc.subject.ucmBases de datos (Informática)
dc.subject.ucmLenguajes de programación
dc.subject.unesco1203.23 Lenguajes de Programación
dc.titleIntegración de datos y análisis predictivo en tratamiento de drogodependencia
dc.typemaster thesis
dspace.entity.typePublication
relation.isAdvisorOfPublicationf806566f-1e28-4933-b145-c9531c1ded1c
relation.isAdvisorOfPublication.latestForDiscoveryf806566f-1e28-4933-b145-c9531c1ded1c

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
TFM- VICTOR MARISCAL-SET 2016.pdf
Size:
5.02 MB
Format:
Adobe Portable Document Format