Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Bases de datos en R :análisis gráfico y estadístico de valores atípicos y ausentes

Loading...
Thumbnail Image

Official URL

Full text at PDC

Publication date

2013

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Citations
Google Scholar

Citation

Abstract

Este trabajo se centra en el tratamiento de valores atípicos y valores ausentes. Para ello se incluye una mejora a las caras de Chernoff, para poder localizar en un entorno multivariante valores atípicos de manera unívoca. Dicha mejora se desarrolla en una base de datos propia de 531 ejemplares de cabras de Guadarrama con un total de 21 variables,con resultados satisfactorios. En la misma base de datos se verifica la correlación existente entre el perímetro torácico y el peso en caprinos, consiguiendo una ecuación con resultados considerablemente buenos. También se consiguen hallar más correlaciones en las medidas morfológicas de los caprinos gracias a esta base de datos. Estas correlaciones son la anchura de la caña con el perímetro de la caña, la altura de la cruz con la altura de medio dorso y esta última con la altura de la grupa. También se dispone de dos bases de datos de repostajes de carburante, una de diesel con 231 registros y otra de gasolina 95 con 109, sobre las que se descartan posibles correlaciones entre sus variables, así como se desarrolla un sistema experto el cual se testea haciendo uno de un comparador de estimadores, el cual ha sido también desarrollado en este trabajo y permite comparar métodos propios de estimación desarrollado por usuarios y compararlos entre sí. [ABSTRACT] This work is centred in the treatment of outliers and missing values. For this proposal here is developed an improvement of Chernoff face's, which consists of finding outliers accurately and univocally in a multivariate environment. This improvement is developed in our onhouse developed database with 531 specimens of coats of Guadarrama, with 21 variables for each and satisfactory results. With this database is verified the correlation between the bust measurement and the weight in coats, getting an equation that responds well to tests. Also other correlations with the morphological measures of the coats are discovered: the leg's width with the leg's perimeter, the cross's height and the back half height, and finally,the correlation between latter and rump height. This work also shows the work on other two databases of refueling, the first with 109 records of 95 octano's petrol and the last one with 231 records of diesel. Any variable correlations in those databases are discarded, and then an expert system is developed, which is tested with an estimators comparator. This developed comparator allows to compare user designed estimation methods.

Research Projects

Organizational Units

Journal Issue

Description

500 Convocatoria de septiembre Máster en Investigación en Informática, Facultad de Informática, Departamento de Arquitectura de Computadora y Automática, curso 2012-2013

Unesco subjects

Keywords