Análisis de series temporales para la detección de brotes de salmonelosis
dc.contributor.advisor | Moreno Romo, Miguel Ángel | |
dc.contributor.advisor | Álvarez Sánchez, Julio | |
dc.contributor.author | Hoyuela Iglesias, Izan | |
dc.date.accessioned | 2023-06-17T10:18:26Z | |
dc.date.available | 2023-06-17T10:18:26Z | |
dc.date.defense | 2021 | |
dc.date.issued | 2021 | |
dc.description.abstract | Antecedentes: La salmonelosis es la primera causa de brotes de enfermedades de origen alimentario de los países desarrollados y, según algunas estimaciones, en los EE. UU podrían producirse anualmente más de un millón de casos. Las infecciones por este agente patógeno son de obligada notificación a las autoridades sanitarias en multitud de países, por lo que está disponible una gran cantidad de información sobre la frecuencia y distribución de la enfermedad. Objetivo: Este trabajo pretende evaluar la capacidad de varios tipos de análisis para capturar la variabilidad en el número de casos esporádicos de salmonelosis, de modo que puedan predecirse los casos esperados con antelación y detectar así desviaciones que puedan ser debidas a la presencia de brotes. Métodos: Se analizó una serie temporal, comprendida entre los años 2005-2017, del número de casos semanales definidos como esporádicos por el departamento de salud de Minnesota. La capacidad de los modelos para detectar brotes se evaluó generando predicciones sobre cada semana del año 2018 y comparando posteriormente estas con los casos totales reales observados, incluyendo los procedentes de brotes conocidos. Adicionalmente, se generaron curvas ROC y se fijaron puntos de corte alternativos para optimizar la sensibilidad y la especificidad de la diferencia entre casos totales observados (esporádicos y pertenecientes a brote) y casos esporádicos predichos como herramienta para detectar brotes activos. Resultados: Los mejores modelos ajustados a partir de las diferentes técnicas empleadas fueron un modelo autorregresivo integrado de media móvil estacional (SARIMA) (1,0,1) x (0,1,1)52 con constante, una regresión armónica dinámica con 10 términos de Fournier y un modelo ARIMA (0,1,1) para los errores, además el mejor modelo de redes neuronales autorregresivas (NNAR) tuvo parámetros (14,1,8) y las variables precipitación y temperatura como predictoras. Las mejores predicciones de los casos de salmonelosis esporádicos semanales del año 2018 fueron, según el error absoluto medio (2,740) y la raíz del error cuadrático medio (4,388), las obtenidos a través de la regresión armónica dinámica. Las predicciones puntuales de los casos semanales de salmonelosis humanas, una vez aplicados los puntos de corte óptimos, permitieron obtener una sensibilidad y especificidad para la detección de brotes activos en las semanas de 2018, del 76,67% y 72,73% en el caso de las obtenidas a partir de la regresión armónica dinámica, del 83,33% y 63,63% con las del SARIMA y del 93,33% y 40,90% con las del NNAR. Conclusiones: Los modelos SARIMA, NNAR y las regresiones dinámicas armónicas fueron capaces de modelizar correctamente la distribución temporal de los casos esporádicos semanales de salmonelosis y de generar predicciones aceptables. Además, el método desarrollado, basado en la comparación entre predicciones puntuales semanales de casos esporádicos de salmonelosis con los totales observados, permite detectar semanas en las que hay brotes activos con una sensibilidad elevada y una especificidad aceptable. | |
dc.description.department | Depto. de Estadística y Ciencia de los Datos | |
dc.description.faculty | Fac. de Estudios Estadísticos | |
dc.description.refereed | FALSE | |
dc.description.status | submitted | |
dc.eprint.id | https://eprints.ucm.es/id/eprint/68280 | |
dc.identifier.uri | https://hdl.handle.net/20.500.14352/9232 | |
dc.language.iso | spa | |
dc.master.title | Máster en Bioestadística | |
dc.rights.accessRights | open access | |
dc.subject.cdu | 004.032.26 | |
dc.subject.cdu | 613.2.099 | |
dc.subject.keyword | Salmonelosis | |
dc.subject.keyword | Biovigilancia | |
dc.subject.keyword | SARIMA | |
dc.subject.keyword | Regresión armónica dinámica | |
dc.subject.keyword | Redes neuronales (Informática) | |
dc.subject.keyword | NNAR | |
dc.subject.ucm | Estadística | |
dc.subject.ucm | Veterinaria | |
dc.subject.unesco | 1209 Estadística | |
dc.subject.unesco | 3109 Ciencias Veterinarias | |
dc.title | Análisis de series temporales para la detección de brotes de salmonelosis | |
dc.type | master thesis | |
dcterms.references | (1) Salmonella EFSA explains zoonotic diseases. EFSA 2014. (2) Majowicz SE, Musto J, Scallan E, Angulo FJ, O'Brien SJ, Jones T, et al. The Global Burden of Nontyphoidal Salmonella Gastroenteritis. 2010. (3) Bad Bug Book, Foodborne Pathogenic Microorganisms and Natural Toxins. Washington, D.C.: U.S. Food & Drug Administration, Center for Food Safety & Applied Nutrition; 2012. (4) Ficha técnica: Salmonelosis. ANMAT. (5) National Salmonella Surveillance Overview. CDC 2011. (6) European Food Safety Authority, European Centre for Disease Prevention and Control. The European Union One Health 2019 Zoonoses Report. EFSA journal 2021;19(2):e06406-n/a. (7) Martínez-Avilés M, Garrido-Estepa M, Álvarez J, de la Torre A. Salmonella Surveillance Systems in Swine and Humans in Spain: A Review. Veterinary sciences 2019;6(1):20. (8) Real Decreto 2210/1995 (9) Protocolo de vigilancia de salmonelosis (Salmonella Spp. distinta de S.Typhi y S.Paratyphi) de la red de vigilancia epidemiológica. Instituto de Salud Carlos III. (10) Local Public Health Institute of Massachussetts. Types of Disease Surveillance .2021; cited 2021 Oct 10. Available at: http://www.masslocalinstitute.info/diseasesurveillance/diseasesurveillance4.html. (11) Universidad Internacional de Valencia. Vigilancia epidemiológica en salud pública: definición y tipos. 2018; cited 2021 Oct 10. Available at: https://www.universidadviu.com/es/actualidad/nuestros-expertos/vigilancia-epidemiologica-en-salud-publica-definicion-y-tipos. (12) Jamison DT, Breman JG, Measham AR, Alleyne G, Claeson M, Evans DB, et al. Disease Control Priorities in Developing Countries, Second Edition.: Washington, DC: World Bank and Oxford University Press; 2006. (13) CDC. Foodborne Diseases Active Surveillance Network (FoodNet): FoodNet 2015 Surveillance Report (Final Data). CDC 2017. (14) EFSA. Salmonellosis - Annual Epidemiological Report 2016. 2016. (15) 1instituto de Salud Carlos, III. Resultados de la Vigilancia Epidemiológica de las enfermedades transmisibles. Informe anual. Años 2017-2018. Ministerio de Ciencia e Innovación 2020. (16) European Food Safety Authority and European Centre for Disease Prevention and Control (EFSA and ECDC). The European Union One Health 2018 Zoonoses Report. EFSA journal 2019;17(12):e05926-n/a. (17) Ministerio de Sanidad. CMBD. cited 2021 Oct 10. Available at: https://pestadistico.inteligenciadegestion.mscbs.es/publicoSNS/S/rae-cmbd. (18) CDC. National Enteric Disease Surveillance: Salmonella Annual Report, 2016. CDC 2018. (19) Lynch M, Marder EP, Zansky S, Tauxe R, Cronquist AB, Geissler AL, et al. Incidence and Trends of Infections with Pathogens Transmitted Commonly Through Food and the Effect of Increasing Use of Culture-Independent Diagnostic Tests on Surveillance — Foodborne Diseases Active Surveillance Network, 10 U.S. Sites, 2013–2016. MMWR. Morbidity and mortality weekly report 2017 Apr 21,;66(15):397-403. (20) CDC. Surveillance for Foodborne Disease Outbreaks, U.S., 2016: Annual Report; 2018 ASI 4205-59;CS295288-A. 2018. (21) ECDC. Salmonellosis - Just the tip of the iceberg. 2015. (22) Mølbak K, Simonsen J, Jørgensen CS, Krogfelt KA, Falkenhorst G, Ethelberg S, et al. Seroincidence of Human Infections With Nontyphoid Salmonella Compared With Data From Public Health Surveillance and Food Animals in 13 European Countries. Clinical infectious diseases 2014;59(11):1599-1606. (23) Scallan E, Hoekstra RM, Angulo FJ, Tauxe RV, Widdowson M, Roy SL, et al. Foodborne illness acquired in the United States: major pathogens. Emerging infectious diseases 2011;17(1):7-15. (24) Organization WH. Foodborne disease outbreaks : guidelines for investigation and control. Geneva: World Health Organization; 2008. (25) Unkel S, Farrington CP, Garthwaite PH, Robertson C, Andrews N. Statistical methods for the prospective detection of infectious disease outbreaks: a review. Journal of the Royal Statistical Society. Series A, Statistics in society 2012;175(1):49-82. (26) Chatfield C, Xing H. The Analysis of Time Series An Introduction with R. : CRC Press; 2019. (27) Ward MP, Iglesias RM, Brookes VJ. Autoregressive Models Applied to Time-Series Data in Veterinary Science. Frontiers in veterinary science 2020;7:604. (28) Moser EB. Repeated Measures Modeling With PROC MIXED. Louisiana State University. (29) Hyndman RJ, Athanasopoulos G. Forecasting: Principles and Practice. Second print edition ed. Lexington, Ky: Otexts; 2018. (30) Wang Y, Xu C, Li Y, Wu W, Gui L, Ren J, et al. An Advanced Data-Driven Hybrid Model of SARIMA-NNNAR for Tuberculosis Incidence Time Series Forecasting in Qinghai Province, China. Infection and drug resistance 2020;13:867-880. (31) Ramanathan K, Thenmozhi M, George S, Anandan S, Veeraraghavan B, Naumova EN, et al. Assessing Seasonality Variation with Harmonic Regression: Accommodations for Sharp Peaks. International journal of environmental research and public health 2020 Feb 18,;17(4):1318. (32) Nielson A. Practical time series analysis: prediction with statistics and machine learning. : O'Reilly Media; 2019. (33) Jebb AT, Tay L, Wang W, Huang Q. Time series analysis for psychological research: examining and forecasting change. Frontiers in psychology 2015;6:727. (34) Michael Foley. Time Series Analysis. 2021; cited 2021 Oct 10. Available at: https://bookdown.org/mpfoley1973/time-series/. (35) Álvarez Martín T. Análisis y predicción del mercado inmobiliario en la Comunidad de Madrid. 2018. (36) Department of natural resources. Daily Data New Hope station (ID: 215838) .2021; cited 2021 Oct 10. Available at: https://www.dnr.state.mn.us/climate/historical/daily-data.html?sid=215838&sname=NEW%20HOPE&sdate=por&edate=por&__cf_chl_captcha_tk__=pmd_u.CJ83xYrts5AGyQzGM_y19h9yPBKoUWPb9SPxcuX9E-1631986900-0-gqNtZGzNA1CjcnBszQlR. (37) Wilkinson L. ggplot2: Elegant Graphics for Data Analysis by WICKHAM, H. Biometrics 2011 Jun;67(2):678-679. (38) Hadley Wickham (2011). The Split-Apply-Combine Strategy for Data Analysis. Journal of Statistical Software, 40(1), 1-29. cited 2021 Oct 10. URL http://www.jstatsoft.org/v40/i01/. (39) Hadley Wickham, Romain François, Lionel Henry and Kirill Müller (2021). dplyr: A Grammar of Data Manipulation. R package version 1.0.5. https://CRAN.R-project.org/package=dplyr. (40) Garrett Grolemund, Hadley Wickham (2011). Dates and Times Made Easy with lubridate. Journal of Statistical Software, 40(3), 1-25. cited 2021 Oct 10. URL https://www.jstatsoft.org/v40/i03/. (41) Adrian Trapletti and Kurt Hornik (2020). tseries: Time Series Analysis and Computational Finance. R package version 0.10-48. (42) Bernhard Pfaff (2008). VAR, SVAR and SVEC Models: Implementation Within R Package vars. Journal of Statistical Software 27(4). URL http://www.jstatsoft.org/v27/i04/. (43) Hyndman R, Athanasopoulos G, Bergmeir C, Caceres G, Chhay L, O'Hara-Wild M, Petropoulos F, Razbash S, Wang E, Yasmeen F (2021). _forecast: Forecasting functions for time series and linear models_. R package version 8.15, <URL: https://pkg.robjhyndman.com/forecast/>. (44) Duncan Temple Lang (2020). RCurl: General Network (HTTP/FTP/...) Client Interface for R. R package version 1.98-1.2. https://CRAN.R-project.org/package=RCurl. (45) Kung-Sik Chan and Brian Ripley (2020). TSA: Time Series Analysis. R package version 1.3. https://CRAN.R-project.org/package=TSA. (46) Paulo J. Ribeiro Jr, Peter J. Diggle, Martin Schlather, Roger Bivand and Brian Ripley (2020). geoR: Analysis of Geostatistical Data. R package version 1.8-1. https://CRAN.R-project.org/package=geoR. (47) John Fox and Sanford Weisberg (2019). An {R} Companion to Applied Regression, Third Edition. Thousand Oaks CA: Sage. URL: https://socialsciences.mcmaster.ca/jfox/Books/Companion/ (48) Kamil Barton (2020). MuMIn: Multi-Model Inference. R package version 1.43.17. https://CRAN.R-project.org/package=MuMIn. (49) David Stoffer (2020). astsa: Applied Statistical Time Series Analysis. R package version 1.12. https://CRAN.R-project.org/package=astsa. (50) Mitchell O'Hara-Wild, Rob Hyndman and Earo Wang (2021). feasts: Feature Extraction and Statistics for Time Series. R package version 0.2.2. https://CRAN.R-project.org/package=feasts. (51) Carl Anners. Forecasting energy usage in the industrial sector in sweden using sarima and dynamic regressionUppsala universitet, Statistiska institutionen; 2017. (52) Robert Nau. Summary of rules for identifying ARIMA models. Available at: https://people.duke.edu/~rnau/arimrule.htm, 2021. (53) Robert Nau. Lecture notes on forecasting. 2014. (54) Rodríguez J, Ruiz E. A powerful test for conditional heteroscedasticity for financial time series with highly persistent volatilities. 2005. (55) Thamanukornsri C, Tiensuwan M. Applications of Box-Jenkins (Seasonal ARIMA) and GARCH models to dengue incidence in Thailand. Model assisted statistics and applications 2018;13(2):95-105. (56) Richard Hardy. What is the null hypothesis of the Mcleod and Li test? 2017; cited 2021 Oct 10. Available at: https://stats.stackexchange.com/questions/317556/what-is-the-null-hypothesis-of-the-mcleod-and-li-test. (57) Aashiq Reza. An Approach to Make Comparison of ARIMA and NNAR Models For Forecasting Price of Commodities. 2020; cited 2021 Oct 10. Available at: https://towardsdatascience.com/an-approach-to-make-comparison-of-arima-and-nnar-models-for-forecasting-price-of-commodities-f80491aeb400. (58) López Ratón M, Rodríguez Álvarez MX, Cadarso Suárez CM, Gude Sampedro F. OptimalCutpoints: An R Package for Selecting Optimal Cutpoints in Diagnostic Tests. Journal of Statistical Software 2014 Nov 1,;61(1):1-36. (59) Maleki A, Nasseri S, Aminabad M, Hadi M. Comparison of ARIMA and NNAR Models for Forecasting Water Treatment Plant’s Influent Characteristics. KSCE J Civ Eng 2018 Sep;22(9):3233-3245. (60) İbrahim Demir, Murat Kirişci. Forecasting COVID-19 disease cases using the SARIMA-NNAR hybrid model. medRxiv 2021 May 16,:159. (61) Briët OJT, Amerasinghe PH, Vounatsou P. Generalized Seasonal Autoregressive Integrated Moving Average Models for Count Data with Application to Malaria Time Series with Low Case Numbers. PloS one 2013;8(6):e65761. (62) Spencer SEF, Marshall J, Pirie R, Campbell D, French NP. The detection of spatially localised outbreaks in campylobacteriosis notification data. Spatial and spatio-temporal epidemiology 2011 Sep;2(3):173-183. | |
dspace.entity.type | Publication | |
relation.isAdvisorOfPublication | c9b2d69f-6df3-4295-a4b1-5d9f2629caaa | |
relation.isAdvisorOfPublication | 7a0cfc93-a3f1-45bf-b529-403f216cf8f7 | |
relation.isAdvisorOfPublication.latestForDiscovery | c9b2d69f-6df3-4295-a4b1-5d9f2629caaa |
Download
Original bundle
1 - 1 of 1
Loading...
- Name:
- hoyuela-iglesias-ivan-tfm.pdf
- Size:
- 1.37 MB
- Format:
- Adobe Portable Document Format