Building the VisSE Corpus of Spanish SignWriting
dc.contributor.author | Díaz Esteban, Alberto | |
dc.contributor.author | García Sevilla, Antonio Fernando | |
dc.contributor.author | Lahoz Bengoechea, José María | |
dc.date.accessioned | 2023-06-21T02:17:55Z | |
dc.date.available | 2023-06-21T02:17:55Z | |
dc.description | Este artículo forma parte de la tesis por compendio de Antonio F. G. Sevilla, titulada "Tratamiento Computacional de Lengua de Signos Española y SignoEscritura", dirigida por Alberto Díaz Esteban y defendida el 2023-12-12 con una calificación de Sobresaliente cum laude. | |
dc.description.abstract | SignWriting is a system for transcribing sign languages, using iconic depictions of the hands and other body parts, as well as exploiting the possibilities of the page as a two dimensional medium to capture the three-dimensional nature of signs. This goes beyond the usual line-oriented nature of oral writing systems, and thus requires a different approach to its processing. In this article we present a corpus of handwritten SignWriting, a collection of images which transcribe signs from Spanish Sign Language. We explain the annotation schema we have devised, and the decisions which have been necessary to deal with the challenges that both sign language and SignWriting present. These challenges include the transformational nature of symbols in SignWriting, which can rotate and otherwise transform to convey meaning, as well as how to properly codify location, a fundamental part of SignWriting which is completely different to oral writing systems. The data in the corpus is fully annotated, and can serve as a tool for computational training and evaluation of algorithms, as well as provide a window into the nature of SignWriting and the distribution of its features across a real vocabulary. The corpus is freely available online at https://zenodo.org/record/6337885. | |
dc.description.abstract | La SignoEscritura es un sistema para transcribir las lenguas de signos usando representaciones icónicas de las manos y otras partes del cuerpo, así como explotando las posibilidades de la página como un medio bidimensional para capturar la naturaleza tridimensional de los signos. Esto va más allá de la naturaleza habitual de los sistemas de escritura oral, formados por líneas, y por tanto requiere un enfoque diferente para su procesamiento. En este artículo presentamos un corpus de SignoEscritura manuscrita: una colección de imágenes que transcriben signos de la Lengua de Signos Española. Explicamos el esquema de anotación que hemos ideado, y las decisiones que han sido necesarias para hacer frente a los retos que presentan tanto la lengua de signos como la SignoEscritura. Estos desafíos incluyen la naturaleza mutable de los símbolos en SignoEscritura, que pueden rotarse y transformarse para transmitir significados concretos, o cómo codificar correctamente la ubicación, una parte fundamental de la SignoEscritura que es completamente diferente a los sistemas de escritura oral. Los datos del corpus están completamente anotados, y pueden servir como herramienta para el entrenamiento computacional y la evaluación de algoritmos, así como para proporcionar una ventana a la naturaleza de la SignoEscritura y la distribución de sus funciones en un vocabulario real. El corpus está disponible libremente en línea en https://zenodo.org/record/6337885. | |
dc.description.department | Depto. de Ingeniería de Software e Inteligencia Artificial (ISIA) | |
dc.description.department | Depto. de Lengua Española y Teoría de la Literatura | |
dc.description.faculty | Fac. de Informática | |
dc.description.faculty | Fac. de Filología | |
dc.description.refereed | TRUE | |
dc.description.sponsorship | Indra | |
dc.description.sponsorship | Fundación Universia | |
dc.description.sponsorship | Fundación BBVA | |
dc.description.status | pub | |
dc.eprint.id | https://eprints.ucm.es/id/eprint/71764 | |
dc.identifier.citation | Sevilla, A. F. G., Díaz Esteban, A., & Lahoz-Bengoechea, J. M. (2023). Building the VisSE corpus of Spanish SignWriting. Language Resources and Evaluation. | |
dc.identifier.doi | 10.1007/s10579-023-09694-9 | |
dc.identifier.essn | 1574-0218 | |
dc.identifier.officialurl | https://doi.org/10.1007/s10579-023-09694-9 | |
dc.identifier.uri | https://hdl.handle.net/20.500.14352/65268 | |
dc.journal.title | Language Resources and Evaluation | |
dc.language.iso | eng | |
dc.page.initial | 22 | |
dc.publisher | Springer Nature | |
dc.relation.projectID | info:eu-repo/grantAgreement/Fundación BBVA/Leonardo/IN[21]_HMS_LIN_0070/ES/Signario de LSE: Diccionario paramétrico de la lengua de signos española/ | |
dc.relation.projectID | info:eu-repo/grantAgreement/INDRA/Tecnologías Accesibles/PR2014_19%2F01/ES/Visualizando la SignoEscritura/VisSE | |
dc.rights.accessRights | embarged access | |
dc.rights.uri | https://www.springernature.com/gp/open-research/policies/accepted-manuscript-terms | |
dc.subject.keyword | Sign Language | |
dc.subject.keyword | SignWriting | |
dc.subject.keyword | Corpus | |
dc.subject.keyword | Writing Systems | |
dc.subject.keyword | Graphical Languages | |
dc.subject.keyword | Lengua de Signos | |
dc.subject.keyword | SignoEscritura | |
dc.subject.keyword | Sistemas de Escritura | |
dc.subject.keyword | Lenguajes Gráficos | |
dc.subject.ucm | Bases de datos (Informática) | |
dc.subject.ucm | Inteligencia artificial (Informática) | |
dc.subject.ucm | Filología | |
dc.subject.ucm | Lingüística | |
dc.subject.ucm | Informática (Filología) | |
dc.subject.unesco | 1203.04 Inteligencia Artificial | |
dc.subject.unesco | 5505.10 Filología | |
dc.subject.unesco | 57 Lingüística | |
dc.title | Building the VisSE Corpus of Spanish SignWriting | |
dc.title.alternative | Creando el Corpus VisSE de SignoEscritura Española | |
dc.type | journal article | |
dc.type.hasVersion | SMUR | |
dc.type.hasVersion | AM | |
dspace.entity.type | Publication | |
relation.isAuthorOfPublication | 97e9fa87-0f3e-48d8-9832-0abd05ecd9c0 | |
relation.isAuthorOfPublication | b0a639f9-8768-4af7-be19-19194a01f3fe | |
relation.isAuthorOfPublication | 2f31e7dc-130e-4c87-9b15-fa29d7bb9277 | |
relation.isAuthorOfPublication.latestForDiscovery | 97e9fa87-0f3e-48d8-9832-0abd05ecd9c0 |
Download
Original bundle
1 - 1 of 1
Loading...
- Name:
- 2023 Building the VisSE corpus of Spanish SignWriting (1).pdf
- Size:
- 748.66 KB
- Format:
- Adobe Portable Document Format