TY - JOUR AU - García Sierra, Óscar AU - Fernández-Pampillón Cesteros, Ana María AU - Ortega Martín, Miguel PY - 2024 DO - 10.31810/rsel.54.1.4 SN - 0210-1874 UR - https://hdl.handle.net/20.500.14352/129172 T2 - Revista Española de Lingüística (RSEL) AB - RESUMEN: Con el auge de los grandes modelos del lenguaje neuronales, especialmente aquellos basados en "Transformers", la tradicional segmentación en palabras y morfemas que empleaba reglas lingüísticas ha sido reemplazada por algoritmos de... AB - ABSTRACT: Traditional tokenization methods using linguistic rules have been replaced by statistical segmentation algorithms. Although these algorithms show a higher efficiency and are capable of building subword vocabularies from large corpora without... LA - spa M2 - 103 PB - Sociedad Española de Lingüística (SEL) KW - Segmentación KW - Morfemas KW - Subpalabras KW - Grandes modelos del lenguaje KW - Lengua española KW - Tokenizing KW - Morphemes KW - Subwords KW - Large language models KW - Spanish language TI - Evaluación morfológica de los vocabularios de subpalabras utilizados por los grandes modelos de lenguaje TY - journal article VL - 54 ER -