Uso de sistemas de gestión de bases de datos paralelas para la visualización científica

Fecha

2008-12-08

Autores

Enriquez Caro, Saumel

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central “Marta Abreu” de Las Villas

Resumen

En los últimos años, los avances en la tecnología de la información han facilitado la obtención de grandes cantidades de información. La manipulación, el almacenamiento, el acceso eficiente y el análisis de esos datos representan una tarea que constituye un gran reto. La visualización científica ha surgido como una herramienta capaz de procesar y analizar estos grandes volúmenes de datos hasta el orden de los terabytes. Tradicionalmente se han empleado formatos de archivos binarios secuenciales para gestionar los datos utilizados en la visualización. Sin embargo el trabajo con estos modelos no resulta suficiente ante las demandas de la comunidad científica actual. Por lo que se necesita una solución integral que combine las ventajas de los Sistemas Gestores de Bases de Datos (SGBD), la eficiencia de los formatos nativos y las potencialidades del procesamiento paralelo. En este trabajo se hace un análisis de la factibilidad del uso de los SGBD Paralelos de código abierto para el almacenamiento y visualización de los datos científicos. Posteriormente se seleccionan aquellos sistemas con herramientas que resultan más eficientes para su implementación en un cluster de computadoras y se realiza la implementación de un caso de estudio.
In the last years, the advances in the technology of the information have facilitated the obtaining of big quantities of information. The manipulation, the storage, the efficient access and the analysis of those data represent a task that constitutes a great challenge. The Scientific Visualization provides methods and tools able to process and to analyze that huge amount of data even in the order of the terabytes. Traditionally flat binary sequential files have been used to handle the data used on the visualization. However the work with these models is not enough before the demands of the current scientific community. For what an integral solution is needed that combines the advantages of the Databases Management System (DBMS), the efficiency of the native formats and the potentialities of the parallel processing. In this work an analysis of the feasibility of the use of Parallel ObjectRelational DBMS of open source is made for the storage and visualization of the scientific data. Then some systems are selected with tools that are more efficient for their implementation in a cluster of computers and it’s implemented a case of study with this tools.

Descripción

Palabras clave

Sistemas de Gestión, Bases de Datos Paralelas, Visualización Científica, Código Abierto, Clúster de Computadoras, Caso de Estudio

Citación