Centro de Investigaciones de la Informática (CII)
URI permanente para esta comunidad
En esta comunidad se agrupan las colecciones que recogen la producción científica del Centro de Investigaciones de la Informática en la UCLV.
Examinar
Examinando Centro de Investigaciones de la Informática (CII) por Autor "Nuñez Arcia, Yaisel"
Mostrando 1 - 5 de 5
Resultados por página
Opciones de ordenación
Ítem Acceso Abierto Algoritmo para corregir anomalías a nivel de instancia en grandes volúmenes de datos utilizando MapReduce(2016) Nuñez Arcia, Yaisel; Díaz de La Paz, Lisandra; García Mendoza, Juan Luis; Universidad Central ”Marta Abreu” de Las Villas. Departamento Ciencia de la Computación; Universidad Central ”Marta Abreu” de Las Villas, Centro de Investigaciones de la InformáticaLos problemas de calidad de datos a nivel de instancia tienen un impacto directo en la toma de decisiones de las organizaciones y afectan su desempeño. A medida que crece desmedidamente la información es mayor la probabilidad de que se encuentren dichos problemas en los datos. En este trabajo se presenta un algoritmo para corregir anomalías a nivel de instancia en fuentes de datos big data con formato estructurado o semi-estructurado. Como método de agrupamiento se utiliza el algoritmo K-means, para calcular la distancia de edición entre las cadenas se aplica la modificación de Levenshtein y para manejar el volumen de los datos se utiliza el modelo de programación distribuida MapReduce. Además, con el fin de mejorar la calidad de los datos se propusieron las siguientes cuatro fases: identificación del tipo de fuente de datos, el formato de los datos y el problema a corregir; pre-procesamiento de los datos; agrupamiento de los datos y limpieza de los datos.Ítem Acceso Abierto Generación automática de reglas de negocio en bases de datos para la implementación del sistema de información SIMCO(2015-12-22) Nuñez Arcia, Yaisel; Boggiano Castillo, Martha Beatriz; Universidad Central "Marta Abreu" de Las VillasEl diseño e implementación de sistemas informáticos para las organizaciones deben basarse en las políticas y reglas del negocio. Hoy día se considera ventajoso aplicar el enfoque de reglas de negocio en el desarrollo de sistemas de información, y de esta manera garantizar la inserción y modificación de las reglas de manera automática. Una de las formas para implementar un sistema de información usando reglas de negocio, es a través del tipo de herramienta independiente de los gestores de datos, pero que genera recursos de bases de datos. Ante la necesidad de desarrollar un sistema de información transaccional para la gestión de menús de comedores en la UCLV, se hizo necesaria una aplicación cuya interfaz de entrada realice las operaciones de inserción y actualización en una base de datos. La existencia de un conjunto de reglas de negocio que deben ser chequeadas al realizar estas operaciones, hace posible la utilización de la herramienta LPT-SQL con vistas a disminuir el esfuerzo de programación al insertar el código, que garantiza el cumplimiento de las reglas, y su posible modificación independientemente de la interfaz de usuario.Ítem Acceso Abierto Herramienta CompMARC para la medición de la completitud de registros bibliográficos en formato MARC 21(2016) García Mendoza, Juan Luis; Díaz de La Paz, Lisandra; González González, Luisa Manuela; Nuñez Arcia, Yaisel; Leiva Mederos, Amed Abel; Universidad Central ”Marta Abreu” de Las Villas. Departamento Ciencia de la Computación; Universidad Central ”Marta Abreu” de Las Villas, Centro de Investigaciones de la Informática; Universidad Central ”Marta Abreu” de Las Villas, Departamento Ciencia de la InformaciónMARC 21 constituye uno de los estándares más utilizados para la catalogación de registros bibliográficos. Según los resultados del procesamiento de encuestas aplicadas a especialistas en Ciencias de la Información de la Universidad Central “Marta Abreu” de Las Villas, uno de los principales problemas de calidad de datos que presentan los registros bibliográficos en este formato es la incompletitud de sus datos. Por consiguiente, el presente trabajo tiene como objetivo medir la dimensión de calidad de datos completitud de registros bibliográficos en formato MARC 21. En el proceso de medición de la completitud se utilizaron dos métricas propuestas en la literatura para metadatos. Como principal resultado se implementó la herramienta CompMARC que utiliza ambas métricas y determina el grado de completitud de estos registros a partir de los umbrales propuestos en este trabajo.Ítem Acceso Abierto Medición de la dimensión completitud en repositorios digitales utilizando MapReduce(2016) García Mendoza, Juan Luis; Díaz de la Paz, Lisandra; González González, Luisa Manuela; Nuñez Arcia, Yaisel; Leiva Mederos, Amed Abel; Moreno Montes de Oca, Isel; Universidad Central ”Marta Abreu” de Las Villas. Departamento Ciencia de la Computación; Universidad Central ”Marta Abreu” de Las Villas, Centro de Investigaciones de la Informática; Universidad Central ”Marta Abreu” de Las Villas, Departamento Ciencia de la InformaciónEn la actualidad se ha producido un aumento considerable en el volumen de información almacenada en repositorios digitales en forma de metadatos. Este aumento provoca una disminución de la calidad de dichos datos lo cual afecta las funcionalidades e interoperabilidad de los repositorios digitales. Además, dificulta el uso de herramientas computacionales tradicionales para su análisis. En el contexto de los metadatos, la dimensión de calidad “completitud” constituye una de las siete características más reconocidas. Es por ello que el presente trabajo tiene como objetivo medir la dimensión completitud en repositorios digitales con grandes volúmenes de metadatos. Para la medición de la completitud se utilizaron dos métricas expuestas en la literatura y para el manejo de los volúmenes de datos elevados, se usó el modelo de programación MapReduce. Como resultado se propusieron dos algoritmos que miden la completitud en repositorios digitales con altos volúmenes de metadatos utilizando MapReduce. Además se propuso un tercer algoritmo que calcula el grado de importancia de cada campo, el cual es necesario para una de las métricas implementadas.Ítem Acceso Abierto Medición de la exactitud de los nombres de autores personales en registros bibliográficos con formato MARC 21(2018) Nuñez Arcia, Yaisel; Díaz de la Paz, Lisandra; García Mendoza, Juan Luis; González González, Luisa Manuela; Leiva Mederos, Amed Abel; Universidad Central ”Marta Abreu” de Las Villas. Departamento Ciencia de la Computación; Universidad Central ”Marta Abreu” de Las Villas, Centro de Investigaciones de la Informática; Universidad Central ”Marta Abreu” de Las Villas, Departamento Ciencia de la InformaciónLos problemas de calidad de metadatos afectan significativamente la recuperación de información en las bibliotecas y centros de documentación. Uno de los problemas que están presente en los registros bibliográficos es la incorrecta representación de los nombres de los autores personales, ya sea por errores tipográficos, inconsistencias entre los diferentes registros, uso de abreviaturas, un mal control de autoridades o la entrada manual de los datos catalogados en sistemas como el ABCD. La existencia de estos problemas está relacionado con la dimensión de calidad exactitud. Es por ello que el objetivo de este trabajo consiste en la medición de la exactitud de los nombres de autores personales en dos bases de datos de prueba de universidades cubanas que contienen registros bibliográficos con formato MARC 21. Para la medición se utilizó una métrica propuesta en la literatura, la cual se adaptó al formato de metadatos MARC 21. Como resultado se obtienen valores de la exactitud de los nombres de autores personales por cada tipo de material. Los resultados de este estudio denotaron la ausencia de los autores personales en varios registros, así como falta de exactitud en ambas bases de datos.