TY - THES AU - Herranz Álvarez, Guillermo A3 - Gregorio Rodríguez, Carlos PY - 2020 UR - https://hdl.handle.net/20.500.14352/10533 AB - En este trabajo planteamos un algoritmo que permite identificar qué registros de un dataset, aún no siendo idénticos, se corresponden con la misma entidad real (Entity Resolution). El algoritmo clásico para este proceso consiste en la comparación... AB - In this work we present and algorithm that allows the user to identify which registers from a dataset, while not being identical, represent the same real-world entity (Entity Resolution). The classical algorithm for this process consists of direct... LA - spa KW - Resolución de entidades KW - deduplicación KW - algoritmo paralelo KW - spark KW - Entity Resolution KW - Deduplication KW - Parallel blocking algorithm KW - Spark TI - Entity Resolution y Deduplication con Blocking paralelo en Spark T2 - Entity Resolution and Deduplication with parallel blocking using Spark M3 - bachelor thesis ER -