Departamento de Ciencias de la Computación
URI permanente para esta comunidad
En esta comunidad se agrupan las colecciones que recogen la producción científica del Departamento de Ciencias de la Computación
Examinar
Examinando Departamento de Ciencias de la Computación por Fecha de publicación
Mostrando 1 - 23 de 23
Resultados por página
Opciones de ordenación
Ítem Acceso Abierto Limpieza de datos(Feijóo, 2009) López Porrero, Beatriz Eugenia; Pérez Vázquez, Ramiro Alberto; Universidad Central "Marta Abreu" de Las Villas. Departamento de Ciencias de la Computación. Facultad de Matemática, Física y ComputaciónLos sistemas de información abarcan importantes esferas y se caracterizan por el manejo de enormes cantidades de datos. La existencia de anomalías e impurezas en los mismos es un fenómeno que distorsiona los resultados que se obtienen de su interpretación y análisis. La limpieza de datos es el proceso mediante el cual se detectan y corrigen los errores, y su aplicación es válida tanto en bases de datos de uso operacional, como en aquellos conjuntos que sirven de fuentes a los almacenes de datos. El objetivo de esta monografía es establecer el estado del arte en esta área de trabajo y sistematizar el conocimiento sobre la actividad de la limpieza de datos, estudiar las definiciones, los métodos y las herramientas empleadas para llevarla a cabo, debido a que es una línea relativamente nueva y los conocimientos sobre ella están dispersos en los artículos científicosÍtem Acceso Abierto Sistema de Calidad Para la Producción de Software a la Medida(Feijóo, 2010) García Pérez, Ana María; Aragón González, Neida; Universidad Central "Marta Abreu" de Las Villas. Departamento de Ciencias de la Computación. Facultad de Matemática, Física y ComputaciónSe presenta la descripción de los procesos de un sistema de calidad orientado a la producción de software a la medida, que se basa en la aplicación de los principios de la Norma ISO 9000:2005 y ha tomado las recomendaciones del modelo CMMI, el marco de trabajo RUP y sugiere para la representación de los modelos de negocio a la notación IDEFÍtem Acceso Abierto Sistema de Calidad Para la Producción de Software a la Medida(Feijóo, 2010) García Pérez, Ana María; Aragón González, Neida; Universidad Central "Marta Abreu" de Las Villas. Departamento de Ciencias de la Computación. Facultad de Matemática, Física y ComputaciónSe presenta la descripción de los procesos de un sistema de calidad orientado a la producción de software a la medida, que se basa en la aplicación de los principios de la Norma ISO 9000:2005 y ha tomado las recomendaciones del modelo CMMI, el marco de trabajo RUP y sugiere para la representación de los modelos de negocio a la notación IDEFÍtem Acceso Abierto Modelos de proximidad novedosos para el cribado virtual de conjuntos de datos quimioinformáticos(Feijóo, 2012) Rivera Borroto, Oscar Miguel; Hernández Díaz, Yoandy; García de la Vega, José Manuel; Grau Ábalo, Ricardo; Marrero Ponce, Yovani; Universidad Central "Marta Abreu" de Las Villas. Departamento de Ciencias de la Computación. Facultad de Matemática, Física y ComputaciónLa búsqueda de similitud es una prestación importante en los sistemas modernos de gestión de la información química para acceder a la rica información contenida en los enormes repositorios químicos modernos. Básicamente, dadas una representación molecular, una medida de similitud y un algoritmo de búsqueda, la salida de la técnica devuelve una lista ordenada de moléculas del conjunto de datos en orden decreciente de similitud con respecto a la molécula consulta especificada por el usuario. Como consecuencia, los investigadores han puesto su interés en la eficacia de las representaciones y medidas de similitud en estas tareas. Sin embargo, sus estudios se han enfocado predominantemente en representaciones binarias y las medidas de semejanza correspondientes, y poco se ha trabajado en otros tipos de descripción numérica. También se han aplicado técnicas del Aprendizaje Automático en la selección de rasgos, aunque no de forma consistente con el principio de vecindad. Estos precedentes junto a la necesidad de nuevos métodos apropiados para cada contexto químico, constituyen la motivación para este trabajo. El mismo comprende la implementación computacional en el ambiente Java de 21 modelos de proximidad, 9 de los cuales son novedosos en Quimioinformática, proceden del área de la Psicología y están basados en el concepto acuerdo relacional, y otros doce son medidas ya establecidas de la literatura especializada. Posteriormente, las nuevas medidas de similitud fueron comparadas y validadas en la “recuperación temprana” usando nueve conjuntos farmacológicos de la Química Medicinal de interés internacional, representados por descriptores numéricos, seleccionados por Aprendizaje Automático, y un algoritmo de búsqueda eficiente. Los resultados muestran que en tendencia promedia los nuevos modelos se comportan superiormente a los de referencia y que más de la mitad de los mismos se sitúan entre los diez modelos más potentesÍtem Acceso Abierto Métricas para evaluar la complejidad de los productos software(Feijóo, 2012) O’farrill Fernández, Lianny; García Pérez, Ana María; Universidad Central "Marta Abreu" de Las Villas. Departamento de Ciencias de la ComputaciónÍtem Acceso Abierto Minería de datos para series temporales(Feijóo, 2014) Gonzáles Castellanos, Mabel; Soto Valero, César; Universidad Central "Marta Abreu" de Las Villas. Departamento de Ciencias de la Computación. Facultad de Matemática, Física y ComputaciónÍtem Acceso Abierto Reglas de negocio: Clasificaciones, lenguajes e implementaciones(Feijóo, 2014) Boggiano Castillo, Martha Beatriz; Pérez Vázquez, Ramiro; González González, Luisa Manuela; Universidad Central "Marta Abreu" de Las Villas. Departamento de Ciencias de la Computación. Facultad de Matemática, Física y ComputaciónLas reglas de negocio, sus clasificaciones, lenguajes y formas para expresarlas, así como las maneras de implementarlas constituyen temas de interés actual para el desarrollo de los Sistemas de Información (SI). Este interés está motivado por las bondades que propicia el tratamiento explícito de las reglas, como son la disminución del costo de programación y el aumento de la eficacia de dichos sistemas. Esta monografía presenta un estudio acerca de las reglas de negocio, a partir de conjuntos de categorías usados por diferentes autores en los que se observa que todos proponen categorías de reglas que involucran de una manera u otra a los datos del negocio, generalmente almacenados en bases de datos. Se muestran diferentes niveles de expresión para las reglas de negocio, así como formalismos y lenguajes utilizados. También se analizan distintas maneras de implementar las mismas, tanto por parte de los programadores, como por herramientas que las generan de forma automática. Se destacan aspectos sobre la implementación de reglas de negocio mediante recursos de bases de datos y finalmente, se tratan puntos de vista sobre elementos a tener en cuenta para la modificación consecuente de ellasÍtem Acceso Abierto Detección de tópicos(Feijóo, 2015) Torres López, Carmen; Arco García, Leticia; Universidad Central "Marta Abreu" de Las Villas. Departamento de Ciencias de la Computación. Facultad de Matemática, Física y ComputaciónEl acceso a los datos de forma efectiva y rápida es de gran importancia hoy en día; sin embargo, manejar eficientemente tales cantidades de datos constituye un desafío. Por ejemplo, resulta muy difícil que alguna persona posea el tiempo para leer toda la información disponible sobre un tema dado, por tal motivo, podría ser mucho más efectivo leer y buscar por temas específicos. De ahí que uno de los campos de investigación que ha tomado la iniciativa en el procesamiento de datos textuales es la Detección y Seguimiento de Tópicos (Topic Detection and Tracking; TDT); referido de forma general como “las técnicas automáticas para encontrar material relacionado tópicamente en flujos de datos” [1] o como “un tema importante cuando grandes volúmenes de datos son enviados continuamente al usuario” [2]. De esta forma, “un tópico es un conjunto coherente de términos relacionados semánticamente que expresan un único argumento” [3]. Para crear algoritmos en el contexto de TDT se propusieron cinco tareas, cada una es vista como un componente cuya solución ayuda a guiar el problema de organizar los documentos por tópicos [4] [5]. Las tareas consisten en la segmentación de historias (encontrar regiones homogéneas en el texto tópicamente); el seguimiento (encontrar historias adicionales sobre un tópico dado); la detección de la primera historia (reconocer el comienzo de un nuevo tópico en el flujo de historias); la detección de grupos (detectar y agrupar nuevos tópicos, es decir, agrupar todas las historias tal como llegan, basándose en los tópicos que ellas presentan) y la detección de enlaces de historias (decidir si dos historias seleccionadas aleatoriamente pertenecen al mismo tópico). La detección de tópicos inicialmente fue declarada como una tarea dependiente de la segmentación, debido a que la entrada de los algoritmos de detección estaba representada por segmentos [4]. Sin embargo, varias han sido las propuestas que utilizan como entrada el corpus textual sin segmentar, es decir, aplican técnicas que extraen los términos de los documentos, los agrupan y estos grupos representan los tópicos. De esta forma se define a la detección de tópicos como: “la tarea que automáticamente encuentra nuevos tópicos en datos textuales” [6], “el descubrimiento de rasgos de palabras y fragmentos correspondientes a un tópico en los datos textuales, considerando a un tópico como un tema específico” [2] o “el proceso de agrupar documentos con tópicos similares en el mismo grupo” [7]. La presente monografía brinda el resultado de una revisión de la literatura dispersa sobre los métodos propuestos para la tarea de detección de tópicos. La primera sección se divide en dos partes: la primera expone las distintas clasificaciones que caracterizan a los métodos de detección, y la segunda describe los métodos desde distintos enfoques, de acuerdo al mecanismo que emplean para obtener los tópicos y luego se presentan varios ejemplos. Para concluir, se declaran algunas consideraciones finales sobre los métodos descritos, reflejando sus ventajas y desventajas, así como elementos que sugieren cuándo aplicar uno u otro en dependencia del dominio de aplicación. Finalmente, se presentan los anexos que facilitan la comprensión de los métodos que aquí se exponen, así como las principales referencias consultadas sobre el temaÍtem Acceso Abierto Calidad de datos(Editorial Feijóo, 2016) Díaz de La Paz, Lisandra; García Mendoza, Juan Luis; Andreu Álvarez, Yordan; López Porrero, Beatriz Eugenia; González González, Luisa Manuela; Rodríguez Morffi, Abel; Universidad Central "Marta Abreu" de Las Villas. Facultad Matemática, Física y Computación. Departamento de Ciencia de la ComputaciónLa tendencia actual adquirida por la mayoría de las empresas modernas de almacenar cantidades crecientes de información ha provocado que la gestión de la calidad de datos se convierta en un proceso sumamente importante. En el presente trabajo se exponen las principales definiciones del término calidad de datos y su ciclo de vida a través de la caracterización de las cuatro fases que componen la metodología para la gestión total de la calidad de datos: definir, medir, analizar y mejorar. Además, se analiza la correspondencia que existe entre las dimensiones y las métricas de la calidad de datos, así como del perfilado y la limpieza de datos con estas fases.Ítem Acceso Abierto Comparación de herramientas de gestión de la configuración(2016-03) Carbonell Muela, Enrique; García Pérez, Ana María; DATYS; DESOFTLas herramientas de gestión de la configuración (CMT) en esencia permiten la automatización de la instalación, configuración y actualización de software en un sistema. La variedad de estas herramientas disponibles en el mercado hace difícil la selección de la adecuada, acorde a las necesidades de los clientes cuando no se cuenta con expertos en el área para consultar. El propósito de este trabajo es seleccionar las características para establecer un marco de comparación y aplicarlo a cuatro de las CMT más populares. Para la selección se tuvieron en cuenta algunos criterios de comparación de estudios previos que de conjunto con los aportados en este trabajo dan lugar a un sencillo marco de comparación para las CMT. Las herramientas seleccionadas por su popularidad fueron: CFEngine, Puppet, Ansible y Salt. El estudio aporta una tabla resumen donde se evidencian las características seleccionadas y su evaluación en cada una de las herramientas.Ítem Acceso Abierto Análisis de la escalabilidad del cálculo paralelo de medidas de similitud entre pares de genes(2016-07-01) Goya Jorge, Addel Arnaldo; Galpert Cañizares, Deborah Raquel; Millo Sánchez, Reinier; Companioni Brito, Claudia; Universidad Central “Marta Abreu” de Las Villas. Facultad de Matemática, Física y Computación. Departamento de ComputaciónEl presente trabajo analiza la escalabilidad de una implementación paralela del cálculo de medidas de similitud entre pares en la detección de genes ortólogos. El análisis se realiza mediante el uso de métricas de calidad como la aceleración y la eficiencia que se calculan para algoritmos de cálculo del alineamiento par a par de secuencias y de cálculo de la similitud del perfil físico-químico de las proteínas. Los experimentos realizados en un conjunto de datos de dos genomas arrojan una mejora en el tiempo de ejecución de las implementaciones paralelas. No obstante, la escalabilidad de los algoritmos continúa siendo un objetivo de nuevas implementaciones.Ítem Acceso Abierto Inventario nacional de emisiones atmosfericas de las principales fuentes fijas(2017) Cuesta Santos, Osvaldo; Sosa Pérez, Carlos; Iraola Ramirez, Caridad; González Jaime, Yosdany; Nuñez Caraballo, Vladimir; Fonte Hernández, Aramis; Imbert Lamorú, Caridad; Barcia Sardiñas, Sinaí; Gómez Zamora, Yanssel; Portal Castillo, Dianelis; Instituto de Meteorología, Cubai; Centro Meteorológico Provincial, Villa Clara, Cuba; Centro Meteorológico Provincial, Camagüey, Cuba; Centro Meteorológico Provincial, Santiago de Cuba, Cuba; Centro Meteorológico Provincial, Cienfuegos, Cuba; Centro Meteorológico Provincial, Artemisa, Cuba; Centro Meteorológico Provincial, Sancti Spiritus, CubaLa determinación cuantitativa de las emisiones de contaminantes por las fuentes fijas en Cuba y sus efectos potenciales en el medio ambiente, es un estudio necesario y urgente. Se presenta el primer inventario de emisiones de las fuentes fijas del país. El conocimiento de estas emisiones es una valiosa herramienta para la mitigación del cambio climático y la gestión ambiental. Se utiliza las metodologías correspondientes a la USEPA y la Agencia Ambiental Europea y las mediciones de las emisiones in situ es una de las herramientas utilizadas. Los resultados muestran la emisión a la atmósfera de más de 273 mil toneladas de SO2. Mientras que para el NO2 se emiten alrededor 98 mil toneladas al año. El PM10 potencialmente dañino a la salud humana alcanza más de 55 mil toneladas al año. Las provincias que más emiten SO2 a la atmosfera son Artemisa, Camagüey y Cienfuegos, en ellas están presentes potentes centrales termoeléctricas y refinerías. Por municipios tenemos que los más emisores de contaminantes gaseosos (SO2, NO2, CO y COVDM) son Mariel y Nuevitas. También Cienfuegos, Matanzas y Regla son grandes emisores. Coincidiendo con zonas urbanas con calidad del aire comprometida. Por lo tanto se deben mantener medidas de control y regulación ambiental para mitigar las emisiones. Además de implementar planes de reducción con mejoras tecnológicas. Este inventario que utiliza la metodología de abajo – arriba puede comprobar los cálculos obtenidos en los Inventarios de Emisiones de Gases de Efecto Invernadero disminuyendo las incertidumbres y por lo tanto lograr escenarios de mitigación más precisos para el cambio climático.Ítem Acceso Abierto Agrupamiento de artículos científicos basado en la extracción de n-gramas relevantes(2017-10-27) Amador, Lisvandy; García Lorenzo, María MatildeÍtem Acceso Abierto Análisis de las emisiones provenientes de la Refinería Sergio Soto y su influencia en la calidad del aire en el municipio Cabaiguán(2018) Portal Castillo, Dianelis; Centro Meteorológico Provincial de Sancti SpíritusCon el objetivo de trazar las bases de una adecuada gestión ambiental en la provincia de Sancti Spíritus se realizó el inventario de las fuentes fijas provinciales de acuerdo a la Norma Cubana (NC: 1049-2014). Fueron identificadas y caracterizadas las fuentes emisoras más representativas, así como sus emisiones, logrando conocer sus características de dispersión. El objetivo esencial de este estudio es analizar los impactos a la calidad del aire que trae consigo el proceso de refinación de petróleo de la refinería Sergio Soto ubicada en el municipio de Cabaiguán en la provincia Sancti Spíritus, para sentar las bases para la elaboración de pronósticos de calidad del aire y la realización de estudios de impacto ambiental mediante el uso de técnicas informáticas.Ítem Acceso Abierto Gestión de la contaminación ambiental mediante técnicas de minería de datos(2018) Portal Castillo, Dianelis; Centro Meteorológico Provincial de Sancti SpíritusLas emisiones de sustancias contaminantes hacia la atmósfera y la magnitud de ellas, son la causa de muchos problemas ambientales en la actualidad. El presente trabajo se enfocó en la contaminación atmosférica de la provincia de Sancti Spíritus, donde se buscó encontrar relaciones entre variables climatológicas y las emisiones contaminantes por medio de técnicas de minería de datos que se puede definir como el proceso de extraer conocimiento válido, útil y comprensible que se encuentra en grandes conjuntos de datos.Ítem Acceso Abierto Aplicación de la técnica de análisis de conceptos formal en la determinación de problemas de calidad relacionados con el modelado de procesos de negocio(Feijóo, 2018) Moreno Montes de Oca, Isel; Reyes Hernández, Frank; García Mendosa, Juan Luis; Hernández Cárdenas, Lisbet; Rodríguez Morffi, Abel; Moreno Rodríguez, Rosendo; Universidad Central "Marta Abreu" de Las Villas. Facultad de Matemática , Física y Computacíon. Depatamento de Ciencias de la Computación; Ravelo Romero, LisetÍtem Acceso Abierto Big Data Supervised Pairwise Ortholog Detection in Yeasts(IntechOpen, 2018-02-01) Galpert, Deborah; del Río García, Sara; Herrera, Francisco; Ancede-Gallardo, Evys; Antunes, Agostinho; Agüero-Chapin, GuillerminOrtholog are genes in different species, evolving from a common ancestor. Ortholog detection is essential to study phylogenies and to predict the function of unknown genes. The scalability of gene (or protein) pairwise comparisons and that of the classification process constitutes a challenge due to the ever-increasing amount of sequenced genomes. Ortholog detection algorithms, just based on sequence similarity, tend to fail in classification, specifically, in Saccharomycete yeasts with rampant paralogies and gene losses. In this book chapter, a new classification approach has been proposed based on the combination of pairwise similarity measures in a decision system that consider the extreme imbalance between ortholog and non-ortholog pairs. Some new gene pair similarity measures are defined based on protein physicochemical profiles, gene pair membership to conserved regions in related genomes, and protein lengths. The efficiency and scalability of the calculation of these measures are analyzed to propose its implementation for big data. In conclusion, evaluated supervised algorithms that manage big and imbalanced data showed high effectiveness in Saccharomycete yeast genomes.Ítem Acceso Abierto Software JSEDITOR para la marcación automática de artículos de la Revista Biotecnología Vegetal para la base de datos SciELO(2018-03-23) Penichet Amador, Lisvandy; Castellano, Hansel; Alvarado, Yelenys; Santos, LesterÍtem Acceso Abierto Algoritmo para la optimización del proceso de secuenciación de reportes(2018-03-23) Coto Palacio, Jessica; Méndez Hernández, Beatriz María; Martínez Jiménez, Yailen; Nowé, Ann; Rodríguez Bazan, Erick D.; Universidad Central "Marta Abreu" de Las Villas. Departamento de ComputaciónLa secuenciación de trabajos es un área muy amplia en la cual muchos investigadores se han enfocado en los últimos años. En las empresas generalmente esta planificación se realiza de forma manual o semiautomática. Este trabajo propone un algoritmo para la secuenciación de trabajos en máquinas paralelas no relacionadas. El algoritmo utiliza dos variantes de solución: una heurística simple basada en una generación pseudoaleatoria y una regla de despacho basada en la máquina que más tiempo de procesamiento tiene pendiente. Para analizar el desempeño de las mismas se utiliza un caso de estudio donde los resultados obtenidos demuestran que la regla de despacho proporciona mejores resultados, conclusión que fue validada mediante pruebas estadísticas.Ítem Acceso Abierto Aplicación de directrices de calidad a modelos de procesos de negocio a través de archivos de salida con extensión bpmn y xpdl(Feijóo, 2019) Reyes Hernández, Frank; Hernández Cárdenas, Lisbet; Moreno Montes de Oca, Isel; Rodríguez Morffi, Abel; Moreno Rodríguez, Rosendo; Universidad Central "Marta Abreu" de Las Villas. Departamento de Ciencias de la Computación. Facultad de Matemática, Física y ComputaciónEn la actualidad, el modelado de procesos de negocio constituye una parte esencial de las organizaciones en la mejora de su eficiencia y efectividad operacionales. Una forma de incrementar la calidad de los modelos de procesos de negocio es a través de la aplicación de directrices prácticas de calidad. El objetivo de este trabajo consiste en la interpretación de archivos de salida con extensión .bpmn y .xpdl, con el objetivo de evaluar la complejidad de modelos de procesos de negocio BPMN. Dicha evaluación se lleva a cabo mediante la aplicación de medidas de calidad, con el fin de ofrecer directrices prácticas que faciliten la mejora de la calidad de dichos modelos. Los principales resultados obtenidos consisten en la interpretación de los archivos de salida .bpmn y .xpdl de las herramientas de modelado Bonita y Bizagi respectivamente; la formulación de una estructura interna de los archivos generados por dichas herramientas y el almacenamiento de la información de los modelos contenida en dichos archivos en la estructura de datos grafoÍtem Acceso Abierto Estrategia curricular de educación ambiental desde la matemática superior(2021-01) Del Sol Martínez, Jorge Luis; Arteaga Valdés, Eloy; Bande González, Libán; Universidad de Cienfuegos Carlos Rafael Rodríguez. Departamento de Matemática; Universidad Central "Marta Abreu" de Las Villas. Departamento de Ciencia de la ComputaciónEl presente trabajo se dirige a perfeccionar el desempeño de los estudiantes de carreras universitarias a partir del diseño e implementación de tareas docentes para elevar la cultura y a la vez su educación medioambiental, utilizando como alternativa los problemas de ecuaciones diferenciales desde la disciplina Matemática Superior, teniendo como sustento psicopedagógico el enfoque desarrollador, estableciendo nexos interdisciplinarios entre ellas, dándole salida a la Estrategia Curricular de Educación Ambiental.Ítem Acceso Abierto Estrategia curricular de Educación Ambiental desde la Matemática Superior(2021-03-01) Del Sol Martínez, Jorge Luis; Arteaga Valdés, Eloy; Bande González, Libán; Universidad de Cienfuegos “Carlos Rafael Rodríguez”; Universidad de Cienfuegos “Carlos Rafael Rodríguez”; Universidad Central "Marta Abreu" de Las Villas. Departamento de Ciencias de la ComputaciónEl presente trabajo se dirige a perfeccionar el desempeño de los estudiantes de carreras universitarias a partir del diseño e implementación de tareas docentes para elevar la cultura y a la vez su educación medioambiental, utilizando como alternativa los problemas de ecuaciones diferenciales desde la disciplina Matemática Superior, teniendo como sustento psicopedagógico el enfoque desarrollador, estableciendo nexos interdisciplinarios entre ellas, dándole salida a la Estrategia Curricular de Educación AmbientalÍtem Acceso Abierto Implementing Environmental Education in the Curricular Strategy at Tertiary Education from the Perspective of Mathematics(2022-03-23) Bande González, Libán; Del Sol Martínez, Jorge Luis; Universidad Central "Marta Abreu" de Las Villas; Universidad "Carlos Rafael Rodríguez" de CienfuegosEnvironmental education has become a vital topic in schools nowadays. From primary school to tertiary education, environmental education can be taught in every subject because of its versatility. However, in some universities this is not the case and some students ignore how their majors can contribute to raise their environmental education. The present work is directed to improve the performance of the students at the university level by designing and implementing teaching tasks to raise both their culture and their environmental education from the perspective of Mathematics. Some methods were applied in order to analyze the current design of the Curricular Strategy used in tertiary education and to determine how environmental education should be implemented in the Curricular Strategy without affecting its structure. Problems of differential equations from the discipline of Higher Mathematics were used as an alternative supported by a psycho-pedagogical approach. The exercises achieved the purpose stablished by the authors. Teaching tasks based on everyday life allow the students to understand the essence and get a more global vision of the object of study. This research was considered as a valid contribution for the confection of new curricular strategies and it also served as a basis to inspire some other works from the perspective of Physics and Biology.