Procedimiento para la mejora de la completitud en registros bibliográficos con formato MARC 21

Fecha

2017-03-05

Autores

García Mendoza, Juan Luis

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central “Marta Abreu” de Las Villas

Resumen

La incompletitud de los metadatos constituye uno de los principales problemas que afecta la búsqueda y recuperación de información debido a la ausencia de elementos básicos. Hasta el momento, en las universidades cubanas no existe un equipo de especialistas para el control de la calidad de los metadatos, específicamente no se conoce el grado de completitud que presentan estos catálogos de registros bibliográficos con formato MARC 21, ni se ofrece una vía de solución automatizada para dicho problema. Por consiguiente, el objetivo principal del presente trabajo es elaborar un procedimiento para la mejora de la completitud de registros bibliográficos con formato MARC 21 mediante la modificación de un algoritmo de detección de duplicados y la identificación de las características que pueden variar en las métricas de completitud de metadatos. Para la medición de la completitud se identificaron como las características que varían para este formato la cantidad de campos, el grado de importancia de cada uno de estos y cómo determinar si está completo o no. Además, se modificó un algoritmo para la detección de registros duplicados para reducir el espacio de búsqueda. Como resultado, se elaboró un procedimiento que permite la mejora de los valores de completitud resultantes a partir de la integración de los elementos duplicados y se implementó una herramienta extensible que incorpora las métricas y el procedimiento propuesto. El presente trabajo, a pesar de basarse en una sola dimensión, incluye las fases de medición y mejora presentes en las metodologías de calidad de datos.
The lack of completeness of the metadata constitutes one of the main problems that affects the search and information retrieval due to the absence of basic elements. So far, in the Cuban universities does not exist a team of specialists for the control of the metadata quality. More specifically, the degree of completeness of bibliographic record catalogs in MARC 21 format is unknown and there not exists an automated solution for this problem. Therefore, the main objective of this investigation is to elaborate a procedure for the improvement of the completeness of bibliographic records in MARC 21 format by mean of modification of an algorithm for duplicates detection and the identification of the characteristics that can variate in the metrics of completeness of metadata. To the completeness measurement were identified as the characteristics that change for this format the quantity of fields, the degree of importance of every one of these and how to determine if it is complete or not. Furthermore, an algorithm for the detection of duplicated records to reduce the space of search was modified. As a result, there was elaborated a procedure for the improvement of the values of completeness resulting from the integration of duplicated elements and an extensible tool that incorporates the metrics and the proposed procedure. The present work, in spite of being based on a single dimension, includes the phases of measurement and improvement that belong to the methodologies of data quality.

Descripción

Palabras clave

Procedimiento para la Mejora, Detección de Duplicados, Completitud de Registros Bibliográficos, Format Marc 21, Integration

Citación