Browsing by Unesco subject "1208 Probabilidad"
Now showing 1 - 20 of 33
Results Per Page
Sort Options
Publication A probabilistic position value(2009) Ghintran, Amandine; González Arangüena, Enrique; Manuel García, Conrado MiguelIn this article the authors generalize the position value, defined by Meessen (1988) for the class of deterministic communication situations, to the class of generalized probabilistic communication situation (Gómez et al.)They provide two characterization of this new allocation rule, They characterize the probabilistic position value using probabilistic version of component efficiency and balanced link contribution. The They generalize the notion of link potential, defined by Slikker for the class of deterministic communication situations, to the class of generalizad probabilistic commnication situations, and use it charasterized their allocation rules. Finally, They show that these two characterizations are logically equivalent.Publication A state of the art of sensor location, flow observability, estimation, and prediction problems in traffic networks(Hindawi Publishing Corporation, 2015) Castillo, Enrique; Grande, Zacarias; Calviño Martínez, Aida; Szeto, W. Y.; Lo, Hong K.A state-of-the-art review of flow observability, estimation, and prediction problems in traffic networks is performed. Since mathematical optimization provides a general framework for all of them, an integrated approach is used to perform the analysis of these problems and consider them as different optimization problems whose data, variables, constraints, and objective functions are the main elements that characterize the problems proposed by different authors. For example, counted, scanned or “a priori” data are the most common data sources; conservation laws, flow nonnegativity, link capacity, flow definition, observation, flow propagation, and specific model requirements form the most common constraints; and least squares, likelihood, possible relative error, mean absolute relative error, and so forth constitute the bases for the objective functions or metrics. The high number of possible combinations of these elements justifies the existence of a wide collection of methods for analyzing static and dynamic situations.Publication Adoption of e-commerce by individuals and digital divide: Evidence from Spain(Facultad de Ciencias Económicas y Empresariales. Instituto Complutense de Análisis Económico (ICAE), 2019) Valarezo Unda, Ángel Eduardo; López Zorzano, Rafael Alberto; Pérez-Amaral, TeodosioE-commerce penetration rates are distant among those groups of individuals with the lowest and the highest levels of online shopping adoption. This is an indicator of digital divide, having negative effects in terms of untapped opportunities for people, companies and the whole economy. Key socioeconomic and demographic determinants of adoption of ecommerce are explored, analyzing a dataset of 174,776 observations for the period 2008-2017 in Spain. The empirical analysis is based on a standard neoclassical utility maximization framework. Linear probability model, logistic regression, and Heckman’s sample selection correction model have been used. The results suggest that e-commerce adoption is positively related with being male, having higher levels of education, income and digital skills, being Spanish, and being employed; while being female, older and belonging to a household of two or more members have negative effects. An interaction between digital skills and age has been introduced in the model, where high digital skills seem to have a positive influence, partly counteracting the lower odds for some age groups. Policy recommendations related to demand and supply measures are suggested to foster the adoption of e-commerce.Publication Análisis de predicción aplicado a la deserción de empleados(2021-09) Rey Caldeyro, María Ema; Llorens Marín, MiguelLa deserción laboral es una de las principales preocupaciones en las grandes empresas hoy en día, y el principal problema de estudio en lo que refiere al análisis de datos en el área de recursos humanos. Esto se debe principalmente a las altas tasas de rotación laboral que existen en el mercado, y los altos costos de reemplazo de los trabajadores. El objetivo de este trabajo es encontrar el modelo que mejor prediga la deserción laboral dentro de una empresa e identificar las variables que mayor influencia tienen en esta decisión. Para ello se utilizó una base de datos pública que consta de características tanto personales como profesionales de 1470 empleados. En una primera instancia se llevó a cabo un proceso de exploración de datos, se seleccionaron varios conjuntos de variables y, finalmente, se probaron diferentes algoritmos predictivos. Se llegó a la conclusión de que, en este caso, el modelo que mejor explica la variable objetivo es el de regresión logística. Por otra parte, se detectó que las variables que mejor explican la variable objetivo son la realización de horas extras, el nivel del puesto de trabajo, la edad, los años de servicio en la empresa, los años de trabajo en el puesto actual y los años trabajados bajo la supervisión del mismo gerente. Este estudio, no solo permite a las empresas detectar cuales son los empleados con mayor riesgo de deserción, sino que, además, representa una herramienta de apoyo clave para identificar aspectos a mejorar en lo que refiere a la calidad del entorno de trabajo.Publication Aplicación de técnicas de Big Data Science para la gestión de crisis(2016-11) Fernandes Moreno, Caio; Carrasco González, RamónA pesar de la existencia de una multitud de investigaciones sobre el análisis de sentimiento, existen pocos trabajos que traten el tema de su implantación práctica y real y su integración con la inteligencia de negocio y big data de tal forma que dichos análisis de sentimiento estén incorporados en una arquitectura (que soporte todo el proceso desde la obtención de datos hasta su explotación con las herramientas de BI) aplicada a la gestión de la crisis. Se busca, por medio de este trabajo, investigar cómo se pueden unir los mundos de análisis (de sentimiento y crisis) y de la tecnología (todo lo relacionado con la inteligencia de negocios, minería de datos y Big Data), y crear una solución de Inteligencia de Negocios que comprenda la minería de datos y el análisis de sentimiento (basados en grandes volúmenes de datos), y que ayude a empresas y/o gobiernos con la gestión de crisis. El autor se ha puesto a estudiar formas de trabajar con grandes volúmenes de datos, lo que se conoce actualmente como Big Data Science, o la ciencia de los datos aplicada a grandes volúmenes de datos (Big Data), y unir esta tecnología con el análisis de sentimiento relacionado a una situación real (en este trabajo la situación elegida fue la del proceso de impechment de la presidenta de Brasil, Dilma Rousseff). En esta unión se han utilizado técnicas de inteligencia de negocios para la creación de cuadros de mandos, rutinas de ETC (Extracción, Transformación y Carga) de los datos así como también técnicas de minería de textos y análisis de sentimiento. El trabajo ha sido desarrollado en distintas partes y con distintas fuentes de datos (datasets) debido a las distintas pruebas de tecnología a lo largo del proyecto. Uno de los datasets más importantes del proyecto son los tweets recogidos entre los meses de diciembre de 2015 y enero de 2016. Los mensajes recogidos contenían la palabra "Dilma" en el mensaje. Todos los twittees fueron recogidos con la API de Streaming del Twitter. Es muy importante entender que lo que se publica en la red social Twitter no se puede manipular y representa la opinión de la persona o entidad que publica el mensaje. Por esto se puede decir que hacer el proceso de minería de datos con los datos del Twitter puede ser muy eficiente y verídico. En 3 de diciembre de 2015 se aceptó la petición de apertura del proceso del impechment del presidente de Brasil, Dilma Rousseff. La petición fue aceptada por el presidente de la Cámara de los Diputados, el diputado Sr. Eduardo Cunha (PMDBRJ), y de este modo se creó una expectativa sobre el sentimiento de la población y el futuro de Brasil. También se ha recogido datos de las búsquedas en Google referentes a la palabra Dilma; basado en estos datos, el objetivo es llegar a un análisis global de sentimiento (no solo basado en los twittees recogidos). Utilizando apenas dos fuentes (Twitter y búsquedas de Google) han sido extraídos muchísimos datos, pero hay muchas otras fuentes donde es posible obtener informaciones con respecto de las opiniones de las personas acerca de un tema en particular. Así, una herramienta que pueda recoger, extraer y almacenar tantos datos e ilustrar las informaciones de una manera eficaz que ayude y soporte una toma de decisión, contribuye para la gestión de crisis.Publication Auctions: A New Method for Selling Objects with Bimodal Density Functions(Springer Nature, 2022-04-03) Castro Cantalejo, Javier; Espínola Vílchez, Rosario; Gutiérrez García-Pardo, Inmaculada; Gómez González, DanielIn this paper we define a new auction, called the Draw auction. It is based on the implementation of a draw when a minimum price of sale is not reached. We find that a Bayesian Nash equilibrium is reached in the Draw auction when each player bids his true personal valuation of the object. Furthermore, we show that the expected profit for the seller in the Draw auction is greater than in second-price auctions, with or without minimum price of sale. We make this affirmation for objects whose valuation can be modeled as a bimodal density function in which the first mode is much greater than the second one. Regarding the Myerson auction, we show that the expected profit for the seller in the Draw auction is nearly as good as the expected profit in the optimal auction, with the difference that our method is much more simple to implement than Myerson’s one. All these results are shown by computational tests, for whose development we have defined an algorithm to calculate Myerson auction.Publication Como influye la información personal, social en el consumo de drogas (Estudio de predicción en la población escolar de Chile) [sic](Facultad de Estudios Estadísticos, 2019-09) Jarrín Vivar, Carlos Andrés; Sarasa Cabezuelo, AntonioPublication Didáctica de la estadística y la probabilidad en secundaria: experimentos motivadores(2009) Pajares García, Almudena; Tomeo Perucha, VenancioEn el ámbito de la educación han aparecido en los últimos tiempos numerosos trabajos destacando la importancia de la enseñanza de la estadística y la probabilidad dentro de la enseñanza secundaria, en la práctica suelen ser las grandes olvidadas por los profesores de matemáticas. En este trabajo se intenta poner de relieve la importancia que tiene dentro del curriculum, ofreciendo diversas motivaciones a los profesores y los alumnos y sobre todo un método y unas actividades.Publication Distribución observada y potencial del género Aphodius (Illiger 1798) de la Península Ibérica (Coleoptera, scarabaeoidea)(Facultad de Estudios Estadísticos (UCM), 2016) Aguilar Colmenero, José LuisPublication El abandono en la Facultad de Estadística de la UCM. Prediciendo para mejorar(Facultad de Estudios Estadísticos, 2019-09) Blanco Iglesias, Jorge; Portela García-Miguel, JavierEl abandono de los programas de grado constituye uno de los problemas centrales de la gestión universitaria actual. Se puede abordar y tratar de explicar desde perspectivas descriptivas, pero sin lugar a duda constituye un enfoque diferente e interesante tratar de predecirlo antes de que se produzca. En este trabajo, tomando como punto de partida los datos académicos del Grado en Estadística Aplicada de la Universidad Complutense de Madrid, se llevarán a cabo labores de predicción basadas en algoritmos de Machine Learning que ayuden a definir si, efectivamente, es posible predecir el abandono universitario en base al rendimiento académico y qué asignaturas podrían ejercer de principales predictores del abandono tras el primer curso académico.Publication Elaboración y diseño de estructura modular para la formación en Técnicas estadísticas básicas y para la investigación(2015-01) Alonso Revenga, Juana M.; Amador Pacheco, Julia; Brita-Paja Segoviano, Jose Luis; Cáceres García, Inés; Cintas del Río, Rosario; Corral Herrero, Aránzazu; Espínola Vílchez, Rosario; Ferrán Aranaz, Magdalena; Nieto Zayas, Carmen; Ortega Castelló, Eduardo; Susi García, Rosario; Vicente Hernanz, Mª LinaPublication Estadísticos para la detección de observaciones anómalas en modelos de elección binaria: una aplicación con datos reales(Facultad de Ciencias Económicas y Empresariales. Instituto Complutense de Análisis Económico (ICAE), 1994) Serrano García, Gregorio R.Este trabajo trata el problema de la detección de observaciones anómalas en modelos de elección binaria. Partiendo del estadístico propuesto en Gracia-Díez y Serrano (1994) que mide la influencia individual de cada observación sobre el vector de parámetros estimado, se derivan otros estadísticos que evalúan la influencia individual y de grupos de observaciones sobre i) el vector de probabilidades estimadas e ii) sobre subconjuntos de parámetros y combinaciones lineales de los mismos. También, se generaliza el método de Peña y Yohai (1991) para la detección de observaciones enmascaradas en modelos lineales al caso de los modelos de elección binaria. Finalmente, se propone una estrategia de diagnosis para la detección de anomalías en este tipo de modelos. Esta estrategia se ilustra mediante su aplicación al modelo probit estimado por Dhillon el. al (1987).Publication Estimación Bayesiana de la prevalencia de Estrongiloidiasis en la población infantil de Cubal (Angola) y de los parámetros de tests diagnósticos en ausencia de gold standard(Facultad de Estudios Estadísticos (UCM), 2017-09) Dacal Picazo, Elena; Susi García, Rosario; Nieto zayas, CarmenEl diagnóstico de certeza de Strongyloides stercoralis es la detección de larvas por microscopía; sin embargo su sensibilidad es baja. La técnica de Baermann mejora dicha sensibilidad, pero es insuficiente por las limitaciones que presenta. Como alternativa, las técnicas moleculares suponen una notable mejora de sensibilidad, especificidad y rapidez. Sin embargo, actualmente no existe un gold standard. La Estadística Bayesiana permite abordar esta problemática en ausencia de gold standard estimando la sensibilidad y la especificidad de estas pruebas diagnósticas y la prevalencia de la enfermedad en contexto de zonas endémicas. Por esto nos planteamos estimar la prevalencia de la estrongiloidiasis en población infantil de una zona rural de Cubal (Angola) y la sensibilidad y especificidad de dos pruebas diagnósticas específicas de esta enfermedad, las técnicas de Baermann y PCR en tiempo real (PCRrt), empleadas en el contexto de ausencia de gold standard. Para ello la población se dividió en niños que caminaban descalzos y niños que caminaban calzados. Se utilizó inferencia Bayesiana para estimar tres modelos dependiendo de las distribuciones a priori fijadas para los parámetros de interés, a partir de: 1) una búsqueda bibliográfica; 2) datos de un estudio de una población de Etiopía cuyas a priori se determinaron a partir de la búsqueda bibliográfica; 3) una combinación de los dos anteriores. Tras observar los datos de la población de Cubal se obtuvieron las distribuciones a posteriori generando muestras aleatorias por el método de Monte Carlo de Cadenas de Markov. El modelo 2 presentó un bajo valor de DIC (32.02) y una mayor precisión de los intervalos de probabilidad. La sensibilidad para la técnica Baermann y su intervalo de probabilidad al 95% fue 51.54% (35.72%-69.14%), mientras que para PCRrt fue de 81.75% (67.54%-92.85%). La especificidad para Baermann fue de 94.66% (92.27%-96.73%) y para PCRrt 89.90% (85.70%-93.91%). Las prevalencias estimadas fueron 14.15% (9.02%-20.00%) para la población que camina descalza y 11.10% (6.48%-16.71%) para la que camina calzada. A la vista de estos resultados se puede concluir que la Estadística Bayesiana permite estimar la validez de las pruebas diagnóstico en estudio así como determinar la prevalencia de estrongiloidiasis en ausencia de gold standard.Publication Estimación del riesgo de aborto y muerte neonatal en embarazos de gemelos con dos enfoques diferentes: longitudinal y tiempo hasta el evento(Facultad de Estudios Estadísticos, 2020) Amor Merino, Miriam; Girón Daviña, Pedro Ramón; Pérez Pérez, María TeresaLos embarazos gemelares son embarazos con un alto riesgo de muerte fetal (aborto), por lo que es frecuente inducir el parto antes de que éste llegue a término. Sin embargo, el parto prematuro se asocia con un mayor riesgo de muerte neonatal. Por lo tanto, se necesitan estimaciones sólidas para el riesgo de muerte fetal y de muerte neonatal, para poder decidir el tiempo óptimo para el parto. En el artículo de Cheong-See F. et al. se aborda este problema mediante una revisión sistemática. El análisis se realiza con un enfoque de datos longitudinales y analizando la edad gestacional en semanas, como variable categórica. Tomando este artículo como punto de partida, el riesgo de aborto y muerte neonatal se han estimado mediante dos enfoques y técnicas estadísticas. Primero se han estimado los riesgos con un enfoque de modelos longitudinales, analizando la semana gestacional, no solo como variable cualitativa, sino también como variable cuantitativa. Los resultados obtenidos son similares a los publicados en el artículo de referencia; en el que se concluyó que la diferencia de riesgos (DR) es cero en la semana 37. Dado que la ocurrencia de aborto o muerte neonatal ocurren solo una vez en cada embarazo; la incidencia de evento se ha estimado aplicando técnicas de análisis de supervivencia con riesgos competitivos para cada evento, y la técnica bootstrap para estimar la diferencia de incidencias, por edad gestacional (en semanas). En este análisis se concluye que la incidencia de aborto se incrementa de forma considerable a partir de la semana 37, en línea con los resultados previos. Sin embargo, el enfoque de análisis de supervivencia tiene limitaciones importantes cuando se trata de analizar la incidencia de muerte neonatal y estos resultados deben ser interpretados con cautela.Publication Estimating and forecasting generalized fractional Long memory stochastic volatility models(Facultad de Ciencias Económicas y Empresariales. Instituto Complutense de Análisis Económico (ICAE), 2016) Peiris, Shelton; Asai, Manabu; McAleer, MichaelIn recent years fractionally differenced processes have received a great deal of attention due to its flexibility in financial applications with long memory. This paper considers a class of models generated by Gegenbauer polynomials, incorporating the long memory in stochastic volatility (SV) components in order to develop the General Long Memory SV (GLMSV) model. We examine the statistical properties of the new model, suggest using the spectral likelihood estimation for long memory processes, and investigate the finite sample properties via Monte Carlo experiments. We apply the model to three exchange rate return series. Overall, the results of the out-of-sample forecasts show the adequacy of the new GLMSV model.Publication Estudio en tiempo discreto de la expansión de una epidemia(Facultad de Estudios Estadísticos (UCM), 2017-09) Gamboa Pérez, María; Amador Pacheco, Julia; López Herrero, María JesúsA lo largo de toda la historia, la Humanidad se ha visto afectada por grandes epidemias como la peste, la viruela o el sida. Estas epidemias se han estudiado matemáticamente dando lugar a diversos modelos epidemiológicos. Estos modelos tienen dos posibles enfoques, el determinista que se modeliza mediante sistemas de ecuaciones diferenciales y el enfoque estocástico que nosotros lo modelizaremos mediante cadenas de Markov y cuyo modelo subyacente es el modelo SIS estocástico. En ambos casos disponemos de ciertos indicadores los cuales nos permitirán cuantificar la epidemia. Estos son el número reproductivo básico, el número reproductivo exacto y el número reproductivo poblacional. El objetivo principal de este trabajo es el estudio en tiempo discreto de una epidemia en poblaciones de tamaño moderado sin inmunidad y aunque la mayor parte de los estudios son en tiempo continuo estos no se ajustan bien a los datos disponibles en la vida real porque se suelen tener datos medidos sobre intervalos de tiempo como por ejemplo días o meses y no en cualquier instante (inspecciones). La metodología usada para el estudio del modelo epidemiológico, objeto de este trabajo, es la que concierne a las cadenas de Markov en tiempo discreto, en concreto a los procesos de nacimiento y muerte. Al modelizarse mediante cadenas de Markov se garantiza que todos los brotes epidémicos finalicen en un tiempo esperado finito y por ello se estudia el número de etapas hasta la finalización de la epidemia. Para su análisis hemos usado ecuaciones en diferencias finitas, método de la primera transición. Su posterior análisis numérico para evaluar la influencia de los parámetros del modelo se ha realizado con el software R.Publication Inference in ergodic queues using occupation cycles(Facultad de Ciencias Económicas y Empresariales. Decanato, 1994) Rodrigo Fernández, AntonioWe deal with inference problems on traffic intensity and on the mean number of customers in the system in steady state (q). We define the slopping time in terms of occupation cycles and apply the resulting estimators to a large class of stationary queues comparing it with alternative methods and with the integral estimator obtained directly from the sample in the Markovian case. Our method is quite effocient to estimate q. Also the asymptotic problems posed by Schruben and Kulkarni [7] do not appear. We observe that reductions in the sample information do not necessarily give worse estimations. We also give some numerical examples by simulating known models.Publication La princesa elige prometido y otros ejercicios de probabilidad(Facultad de Estudios Estadísticos, 2020-11) Tomeo Perucha, VenancioEn este trabajo se estudian diez ejercicios de probabilidad. Se comienza con el problema de encontrar una estrategia para que la princesa elija al mejor de sus pretendientes, supuestas varias condiciones. A continuacin se estudian las estrategias para el juego de las siete y media y el juego del blackjack, por su semejanza con el problema de la princesa en cuanto a utilizar la mejor estrategia posible. Se completa el trabajo con otros ejercicios de probabilidad que tienen tratamientos similares a los anteriores.Publication Measures to assess a warning vaccination level in a stochastic SIV model with imperfect vaccine(Wiley, 2022-01-04) Gamboa Pérez, María; López Herrero, María JesúsA stochastic Markovian Susceptible-Infectious-Susceptible (SIS) model, with infection reintroduction is considered to represent the evolution of an epidemic process within a finite population. Disease is assumed to be a contact disease whose effect can be prevented by a vaccine. Before the epidemic process emerges, individuals got vaccinated to assure that the population is protected by herd immunity. In consequence, we formulate the model by adding a new compartment for vaccine protected individuals. The administered vaccine is not a perfect one and consequently it fails in a proportion of vaccinated individuals that are not protected against the vaccine preventable communicable disease. Hence, while the infectious process is in progress, the initial vaccine coverage declines and herd immunity could be lost. A threshold on the size of the vaccinated group is included as a warning measure on the protection of the community. Our objective is to define and study random characteristics, depending on the vaccination eligible group, that could advise health authorities when to launch a new vaccination program to recover the initial immunity level.Publication Minería de datos espaciales: detección de agregaciones espaciales de riesgo de morir por cáncer de mama y próstata en España y su asociación con la contaminación industrial(2014-09) Pérez Abad, Natalia; Valencia Delfa, José Luis; Fernández Navarro, Pablo; García Pérez, JavierLos estilos de vida modernos y el desarrollo industrial han mejorado enormemente la calidad de vida de las personas pero han expuesto a la población a sustancias tóxicas a través del aire, agua y suelo que afectan directamente al ser humano provocando daños en el sistema inmunológico, reproductor y cáncer. En la actualidad, el cáncer de mama es el tumor más frecuente en la población femenina, y el de próstata el tercero en la población masculina. Como consecuencia de un proyecto de investigación del Instituto de Salud Carlos III “Nuevos enfoques en el estudio de la influencia de la contaminación emitida por las industrias en la mortalidad por cáncer’ NAPICAM, desarrollado en el Área de Epidemiología Ambiental y Cáncer del Centro Nacional de Epidemiología, se dispone tanto de información sobre la mortalidad municipal por distintos tipos de cáncer en España como de una base de datos muy completa aportada por el Ministerio de Agricultura, Alimentación y Medio Ambiente de los complejos industriales en España incluidos en el registro E-PRTR (los que superan los umbrales de notificación) y de aquellos complejos con emisiones que no superan los umbrales (registro IPPC), que suponen un recurso muy útil para el estudio de la contaminación industrial y, por extensión, hace posible que la asociación entre la proximidad residencial a este tipo de instalaciones contaminantes y el impacto en la salud, como el cáncer, puedan ser estudiados. En este contexto, los objetivos de este estudio fueron: evaluar la asociación entre la contaminación industrial y los patrones espaciales de los cánceres hormonodependientes más frecuentes en España (mama y próstata), y detectar posibles patrones geográficos de dichas causas en el territorio nacional, con medidas clásicas de estimación de riesgos y con técnicas de minería de datos espaciales. Se realizaron mapas representando la mortalidad por estos cánceres y análisis de agrupaciones espaciales de riesgo (clústers). También se ha llevado a cabo una caracterización de la contaminación industrial es España mediante un análisis descriptivo de las emisiones de contaminantes y empleando técnicas de análisis estadístico espacial basadas en modelos autorregresivos condicionales de Poisson propuestos por Besag, York y Mollié; se ha valorado si la proximidad a los complejos industriales está asociado con una mayor mortalidad por cáncer de mama y próstata . Los resultados obtenidos muestran que posiblemente exista un patrón espacial de mortalidad por cáncer de mama en la zona Suroeste de España y no existe evidencia de un patrón claro para el caso del cáncer de próstata. En relación con el análisis de asociación geográfica, los resultados obtenidos muestran un exceso de mortalidad por cáncer de mama en aquellos municipios próximos a sectores industriales dedicados a la cerámica, minería, astilleros y la fabricación de papel y cartón. No existen resultados relevantes para el caso de cáncer de próstata. Las técnicas de minería de datos espaciales pueden ser clave para la comprensión y manejo de datos localizados geográficamente y un buen complemento en estudios epidemiológicos ambientales. En este trabajo han permitido la confirmación de los patrones de mortalidad que se observaban en los mapas generados con técnicas de estadística espacial tradicionales. Finalmente cabe destacar que las emisiones de determinados grupos industriales pueden suponer un factor de riesgo para el desarrollo del cáncer de mama.