Tesis Doctorado - Matemática y Computación
URI permanente para esta colección
En esta colección se depositarán las Tesis Doctorales de personal afiliado a la UCLV que fueron defendidas en el Tribunal Nacional de Matemática y Computación.
Examinar
Examinando Tesis Doctorado - Matemática y Computación por Autor "Pérez Vázquez, Ramiro Alberto"
Mostrando 1 - 2 de 2
Resultados por página
Opciones de ordenación
Ítem Acceso Abierto Limpieza de datos: reemplazo de valores ausentes y estandarización(Universidad Central “Marta Abreu” de Las Villas. Facultad de Matemática, Física y Computación. Departamento Ciencias de la Computación, 2011-01-25) López Porrero, Beatriz Eugenia; Pérez Vázquez, Ramiro AlbertoLa limpieza de datos es un proceso de gran importancia cuando se quiere asegurar la calidad de los mismos. Aunque existen varias herramientas que permiten realizar distintas tareas relacionadas con la limpieza de datos, por diferentes circunstancias estas no son de fácil acceso para los especialistas de nuestro país. En este trabajo se hace un estudio de los principales tipos de errores que pueden aparecer en las bases de datos, proponiéndose una taxonomía de errores para las bases de datos cubanas, en que se constata que algunos de los que más se presentan son la forma no estándar de representar campos de tipo cadenas de caracteres y la ausencia de información. Se propuso una modificación de la distancia de edición de Levenshtein, un marco de trabajo para la estandarización de cadenas de caracteres y un método de trabajo para realizar en el ambiente de las bases de datos el reemplazo de los valores ausentes. Se obtuvieron las herramientas DBAnalyzer, que ayuda a la detección de errores en los datos, DBStandard, que permite la estandarización de las cadenas de caracteres, aplicando una modificación a la distancia de edición de Levenshtein y DbNulos, que ofrece un asistente que ayuda al especialista a la selección de los métodos para la sustitución de los valores ausentes. Las herramientas han sido aplicadas en varias empresas que validan la efectividad del uso de las mismas, como por ejemplo en las bases de datos de Recursos Humanos de la Universidad Central, de la ONAT (Oficina Nacional de Administración Tributaria) de Ranchuelo, del Departamento de Anatomía patológica del Hospital Provincial de Villa Clara y otras.Ítem Acceso Abierto Reglas de negocio desde la perspectiva de los datos en bases de datos relacionales(Universidad Central “Marta Abreu” de Las Villas. Facultad de Matemática, Física y Computación. Departamento Ciencias de la Computación, 2014-07-14) Boggiano Castillo, Martha Beatriz; Pérez Vázquez, Ramiro AlbertoEl enfoque de reglas de negocio es una temática en que las reglas se administran con cierta independencia de los sistemas de información (SI) y permite la automatización de las mismas. Existen reglas que se representan en el propio esquema de la base de datos, no sucede así con aquellas asociadas al comportamiento de los datos y sus operaciones. La implementación de las reglas generalmente sucede a su identificación basada en categorías, desde dos perspectivas: del negocio y de los SI, expresadas en los niveles de abstracción, informal y técnico. Los motores de reglas para lograr su automatización son muy populares, pero controvertidos. En este trabajo se proponen un conjunto de categorías de reglas desde la perspectiva de los datos y patrones para escribirlas en lenguaje natural estructurado y lenguaje técnico (LPT), y se formulan los pasos para transformar las reglas de LPT a recursos de bases de datos. Además se propone una arquitectura de software para administrar dichas reglas en bases de datos relacionales y una aplicación concreta: LPT-SQL. Finalmente se incluyen dos estudios de casos y los resultados de la evaluación de expertos sobre el conjunto de categorías y su expresión en LPT para permitir su implementación automática.