Bases de datos en R :análisis gráfico y estadístico de valores atípicos y ausentes
Loading...
Official URL
Full text at PDC
Publication date
2013
Authors
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citation
Abstract
Este trabajo se centra en el tratamiento de valores atípicos y valores ausentes. Para ello se incluye una mejora a las caras de Chernoff, para poder localizar en un entorno
multivariante valores atípicos de manera unívoca. Dicha mejora se desarrolla en una base de datos propia de 531 ejemplares de cabras de Guadarrama con un total de 21 variables,con resultados satisfactorios. En la misma base de datos se verifica la correlación existente entre el perímetro torácico y el peso en caprinos, consiguiendo una ecuación con resultados considerablemente buenos. También se consiguen hallar más correlaciones en las medidas
morfológicas de los caprinos gracias a esta base de datos. Estas correlaciones son la anchura de la caña con el perímetro de la caña, la altura de la cruz con la altura de medio dorso y esta última con la altura de la grupa.
También se dispone de dos bases de datos de repostajes de carburante, una de diesel con 231 registros y otra de gasolina 95 con 109, sobre las que se descartan posibles correlaciones entre sus variables, así como se desarrolla un sistema experto el cual se testea haciendo uno de un comparador de estimadores, el cual ha sido también desarrollado en este trabajo y permite comparar métodos propios de estimación desarrollado por usuarios y compararlos entre sí.
[ABSTRACT]
This work is centred in the treatment of outliers and missing values. For this proposal here is developed an improvement of Chernoff face's, which consists of finding outliers accurately and univocally in a multivariate environment. This improvement is developed in our onhouse
developed database with 531 specimens of coats of Guadarrama, with 21 variables for each and satisfactory results. With this database is verified the correlation between the bust measurement and the weight in coats, getting an equation that responds well to tests.
Also other correlations with the morphological measures of the coats are discovered: the leg's width with the leg's perimeter, the cross's height and the back half height, and finally,the correlation between latter and rump height.
This work also shows the work on other two databases of refueling, the first with 109 records of 95 octano's petrol and the last one with 231 records of diesel. Any variable
correlations in those databases are discarded, and then an expert system is developed, which is tested with an estimators comparator. This developed comparator allows to compare user designed estimation methods.
Description
500 Convocatoria de septiembre
Máster en Investigación en Informática, Facultad de Informática, Departamento de Arquitectura de Computadora y Automática, curso 2012-2013