Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Virus de ácido ribonucleico (ARN) y coronavirus en Google Dataset Search: alcance y correlación epidemiológica

dc.contributor.authorBlázquez Ochando, Manuel
dc.contributor.authorPrieto Gutiérrez, Juan José
dc.date.accessioned2023-06-17T08:56:46Z
dc.date.available2023-06-17T08:56:46Z
dc.date.issued2020
dc.description.abstractSe presenta un análisis sobre la publicación de conjuntos de datos recogidos en el buscador Google Dataset Search, especializados en familias de virus de ARN, cuya terminología fue obtenida en el tesauro del National Cancer Institute (NCI), elaborado por el Department of Health and Human Services de los Estados Unidos. Se busca evaluar el alcance y capacidad de reutilización de los datos disponibles, determinando el número de datasets, su libre acceso, proporción en formatos de descarga reutilizables, principales proveedores, cronología de publicación y verificación de su procedencia científica. Por otra parte, definir posibles vínculos entre la publicación de datasets y las principales pandemias ocurridas en los últimos 10 años. Entre los resultados obtenidos se destaca que sólo el 52% de los datasets tienen correspondencia con investigaciones científicas y, en menor medida, un 15% son reaprovechables. También se observa una evolución al alza en la publicación de datasets, especialmente vinculada a la afectación de las principales epidemias. Esto es confirmado de manera evidente con los virus del Ébola, Zika, SARS-CoV, H1N1, H1N5 y, particularmente con el coronavirus SARS-CoV-2. Finalmente, se observa que el buscador aún no ha implementado métodos adecuados para el filtrado y supervisión de los datasets. Estos resultados muestran algunas de las dificultades que aún presenta la ciencia abierta en el campo de los datasets
dc.description.abstractThis paper presents an analysis of the publication of datasets collected via Google Dataset Search, specialized in families of RNA viruses, whose terminology was obtained from the National Cancer Institute (NCI) thesaurus developed by the US Department of Health and Human Services. The objective is to determine the scope and reuse capacity of the available data, determine the number of datasets and their free access, the proportion in reusable download formats, the main providers, their publication chronology, and to verify their scientific provenance. On the other hand, we also define possible relationships between the publication of datasets and the main pandemics that have occurred during the last 10 years. The results obtained highlight that only 52% of the datasets are related to scientific research, while an even smaller fraction (15%) are reusable. There is also an upward trend in the publication of datasets, especially related to the impact of the main epidemics, as clearly confirmed for the Ebola virus, Zika, SARS-CoV, H1N1, H1N5, and especially the SARS-CoV-2 coronavirus. Finally, it is observed that the search engine has not yet implemented adequate methods for filtering and monitoring the datasets. These results reveal some of the difficulties facing open science in the dataset field.
dc.description.departmentDepto. de Biblioteconomía y Documentación
dc.description.facultyFac. de Ciencias de la Documentación
dc.description.refereedTRUE
dc.description.statuspub
dc.eprint.idhttps://eprints.ucm.es/id/eprint/63513
dc.identifier.doi10.3145/epi.2020.nov.28
dc.identifier.issn1699-2407
dc.identifier.officialurlhttps://doi.org/10.3145/epi.2020.nov.28
dc.identifier.urihttps://hdl.handle.net/20.500.14352/7641
dc.issue.number6
dc.journal.titleProfesional de la Información
dc.language.isospa
dc.publisherEPI SCP
dc.rights.accessRightsopen access
dc.subject.cdu616.98:004.65
dc.subject.cdu616-092:004.65
dc.subject.cdu025.4.036
dc.subject.keywordDatos
dc.subject.keywordDatasets
dc.subject.keywordConjuntos de datos
dc.subject.keywordVirus
dc.subject.keywordVirus de ARN
dc.subject.keywordCoronavirus
dc.subject.keywordSARS-CoV-2
dc.subject.keywordCovid-19
dc.subject.keywordPandemias
dc.subject.keywordReutilización de datos
dc.subject.keywordGoogle
dc.subject.keywordGoogle Dataset Search
dc.subject.keywordProveedores de datos
dc.subject.keywordBuscadores
dc.subject.keywordRecuperación de información
dc.subject.keywordCiencia abierta.
dc.subject.keywordData
dc.subject.keywordViruses
dc.subject.keywordRNA viruses
dc.subject.keywordPandemics
dc.subject.keywordData reuse
dc.subject.keywordData providers
dc.subject.keywordSearch engines
dc.subject.keywordInformation retrieval
dc.subject.keywordOpen science.
dc.subject.ucmEnfermedades infecciosas
dc.subject.ucmSalud pública (Medicina)
dc.subject.ucmBases de datos (Biblioteconomía y Documentación)
dc.subject.ucmRecuperación de la información
dc.subject.unesco3205.05 Enfermedades Infecciosas
dc.subject.unesco3212 Salud Pública
dc.subject.unesco1203.12 Bancos de Datos
dc.titleVirus de ácido ribonucleico (ARN) y coronavirus en Google Dataset Search: alcance y correlación epidemiológica
dc.title.alternativeRibonucleic acid (RNA) virus and coronavirus in Google Dataset Search: their scope and epidemiological correlation
dc.typejournal article
dc.type.hasVersionVoR
dc.volume.number29
dspace.entity.typePublication
relation.isAuthorOfPublicationc3914788-1a74-442b-9b88-eb2398a0d435
relation.isAuthorOfPublication05ae253c-b4e1-4a2d-9424-c0c7ab5f1eed
relation.isAuthorOfPublication.latestForDiscovery05ae253c-b4e1-4a2d-9424-c0c7ab5f1eed

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
ARN_y covid_en_Google_Dataset_Search.pdf
Size:
1.4 MB
Format:
Adobe Portable Document Format

Collections