Medición de la dimensión completitud en repositorios digitales utilizando MapReduce
Archivos
Fecha
2016
Autores
García Mendoza, Juan Luis
Díaz de la Paz, Lisandra
González González, Luisa Manuela
Nuñez Arcia, Yaisel
Leiva Mederos, Amed Abel
Moreno Montes de Oca, Isel
Título de la revista
ISSN de la revista
Título del volumen
Editor
Resumen
En la actualidad se ha producido un aumento considerable en el volumen de información almacenada en repositorios digitales en forma de metadatos. Este aumento provoca una disminución de la calidad de dichos datos lo cual afecta las funcionalidades e interoperabilidad de los repositorios digitales. Además, dificulta el uso de herramientas computacionales tradicionales para su análisis. En el contexto de los metadatos, la dimensión de calidad “completitud” constituye una de las siete características más reconocidas. Es por ello que el presente trabajo tiene como objetivo medir la dimensión completitud en repositorios digitales con grandes volúmenes de metadatos. Para la medición de la completitud se utilizaron dos métricas expuestas en la literatura y para el manejo de los volúmenes de datos elevados, se usó el modelo de programación MapReduce. Como resultado se propusieron dos algoritmos que miden la completitud en repositorios digitales con altos volúmenes de metadatos utilizando MapReduce. Además se propuso un tercer algoritmo que calcula el grado de importancia de cada campo, el cual es necesario para una de las métricas implementadas.
Descripción
Palabras clave
Calidad de datos, Medición de la completitud, Repositorios digitales, Modelo de programación MapReduce, Algoritmos
Citación
Mendoza, J. L. G., De la Paz, L. D., González, L. G., Arcia, Y. N., Mederos, A. A. L., & de Oca, I. M. M. (2016, September). Medición de la dimensión completitud en repositorios digitales utilizando MAPREDUCE. In XIV Congreso Internacional de Información Info'2016.