Procedimientos para la mejora de la exactitud de los nombres de autores personales en registros bibliográficos con formato MARC 21

Fecha

2017-06-20

Autores

Nuñez Arcia, Yaisel

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central “Marta Abreu” de Las Villas

Resumen

Los problemas de calidad de metadatos afectan significativamente la recuperación de información en las bibliotecas y centros de documentación. Uno de los problemas que están presente en los registros bibliográficos es la incorrecta representación de los nombres de los autores personales, ya sea por errores tipográficos, inconsistencias entre los diferentes registros, uso de abreviaturas, un mal control de autoridades o la entrada manual de los datos catalogados en sistemas como el ABCD. Lo anterior cobra mayor relevancia al no existir, hasta el momento, en nuestras bibliotecas un equipo de especialistas para el control de la calidad de los metadatos, ser la inexactitud uno de los principales problemas detectados y no contar con un registro de autoridad. El presente trabajo tiene como objetivo elaborar procedimientos para la mejora de la exactitud de los nombres de autores personales en registros bibliográficos con formato MARC 21, mediante el uso de técnicas de agrupamiento y una función de distancia entre cadenas, de manera que se obtengan grupos con los elementos más similares que faciliten la confección de un registro de autoridad. Para ello se utilizó una métrica propuesta en la literatura, un algoritmo basado en densidades cuando se desconoce la cantidad de grupos a formar y un algoritmo basado en particiones cuando se posea un registro de autoridad. Como principales resultados se construye un fichero de autoridad con los nombres de autores personales escritos correctamente y se obtiene una colección con los nombres previamente estandarizados, para lo cual se implementó el módulo MARCAccuracy.
Metadata quality problems affect retrieval of information in libraries and documentation centers significantly. One of the problems that are present in the bibliographic records is the incorrect representation of the names of the personal authors, due to typographical errors, inconsistencies between the different registers, using of abbreviations, poor control of authorities or manual entry of data cataloged in systems such as ABCD, among others. All the above becomes more relevant as there is no team of specialists to control the quality of the metadata in our libraries so far, inaccuracy is one of the main problems detected and inexistence of an authority record. The present work aims to elaborate procedures for the improvement of the accuracy of the names of personal authors in MARC 21 bibliographic records, throughout the use of grouping techniques and a function of distance between strings, in order to obtain groups with the most similar elements that facilitate the creation of an authority record. To accomplish this, we used a metric from the literature. Besides, we used an algorithm based on densities when the number of groups to be formed is unknown and a partition-based algorithm when an authority record is possessed. As main results we constructed an authority file with the names of personal authors written correctly and we obtained a collection with the previously standardized names, for which we implemented the module MARCAccuracy.

Descripción

Palabras clave

Calidad de Metadatos, Exactitud, Formato MARC 21, Nombres de Autores Personales, Técnicas de Agrupamiento, Registro de Autoridad, Metadata Quality, Accuracy, MARC 21 Format, Personal Author Names, Clustering Techniques, Authority Record

Citación