Díaz de La Paz, LisandraGonzález González, Luisa ManuelaGarcía Mendoza, Juan Luis2019-01-212019-01-212017-03-05https://dspace.uclv.edu.cu/handle/123456789/10674La incompletitud de los metadatos constituye uno de los principales problemas que afecta la búsqueda y recuperación de información debido a la ausencia de elementos básicos. Hasta el momento, en las universidades cubanas no existe un equipo de especialistas para el control de la calidad de los metadatos, específicamente no se conoce el grado de completitud que presentan estos catálogos de registros bibliográficos con formato MARC 21, ni se ofrece una vía de solución automatizada para dicho problema. Por consiguiente, el objetivo principal del presente trabajo es elaborar un procedimiento para la mejora de la completitud de registros bibliográficos con formato MARC 21 mediante la modificación de un algoritmo de detección de duplicados y la identificación de las características que pueden variar en las métricas de completitud de metadatos. Para la medición de la completitud se identificaron como las características que varían para este formato la cantidad de campos, el grado de importancia de cada uno de estos y cómo determinar si está completo o no. Además, se modificó un algoritmo para la detección de registros duplicados para reducir el espacio de búsqueda. Como resultado, se elaboró un procedimiento que permite la mejora de los valores de completitud resultantes a partir de la integración de los elementos duplicados y se implementó una herramienta extensible que incorpora las métricas y el procedimiento propuesto. El presente trabajo, a pesar de basarse en una sola dimensión, incluye las fases de medición y mejora presentes en las metodologías de calidad de datos.The lack of completeness of the metadata constitutes one of the main problems that affects the search and information retrieval due to the absence of basic elements. So far, in the Cuban universities does not exist a team of specialists for the control of the metadata quality. More specifically, the degree of completeness of bibliographic record catalogs in MARC 21 format is unknown and there not exists an automated solution for this problem. Therefore, the main objective of this investigation is to elaborate a procedure for the improvement of the completeness of bibliographic records in MARC 21 format by mean of modification of an algorithm for duplicates detection and the identification of the characteristics that can variate in the metrics of completeness of metadata. To the completeness measurement were identified as the characteristics that change for this format the quantity of fields, the degree of importance of every one of these and how to determine if it is complete or not. Furthermore, an algorithm for the detection of duplicated records to reduce the space of search was modified. As a result, there was elaborated a procedure for the improvement of the values of completeness resulting from the integration of duplicated elements and an extensible tool that incorporates the metrics and the proposed procedure. The present work, in spite of being based on a single dimension, includes the phases of measurement and improvement that belong to the methodologies of data quality.esEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 LicenseProcedimiento para la MejoraDetección de DuplicadosCompletitud de Registros BibliográficosFormat Marc 21IntegrationRecuperation de InformationDatos BibliográficosCompletitudCatálogos en LíneaAutomatizacion de BibliotecasProcedimiento para la mejora de la completitud en registros bibliográficos con formato MARC 21Thesis