Automatización de los procesos de carga en el mercado de datos Recursos Humanos de la UCLV
Date
2014-06-28
Authors
García Mendoza, Juan Luis
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Central “Marta Abreu” de Las Villas
Abstract
At the present time Extraction, Transformation and Load processes has taken boom in the development of Data Warehouses. These constitute an essential point for data extraction from heterogeneous sources, cleaning, integration and load of them towards the corresponding Data Warehouse or Data Mart, through the implementation of transformations. Human Resources department from Universidad Central “Marta Abreu” de Las Villas have a data mart populated from ETL processes that they assurance the initial load. Until this moment the jobs and transformations implemented does not allow their update beginning with change in the data. For this reason, the present work has as the main objective to implement ETL processes that guarantee the incremental load towards such data mart. Besides, OLAP cubes, static and dynamic reports are designed which allow the analysis of historical and present information. To reach these objectives DB Visual ARCHITECT 4.0 software for dimensional modelation, the SGBD PostgreSQL to data store and several tools from Pentaho suite are used, making emphasis in the development environment Spoon which belong to Pentaho Data Integration.
En la actualidad los procesos de Extracción, Transformación y Carga (ETL) han tomado auge en el desarrollo de los almacenes de datos. Estos constituyen un punto esencial en la extracción de datos desde fuentes heterogéneas, la limpieza, integración y carga de los mismos hacia el almacén o mercado de datos correspondiente, mediante la implementación de transformaciones. El departamento de Recursos Humanos (RRHH) de la Universidad Central “Marta Abreu” de Las Villas (UCLV) cuenta con un mercado de datos poblado a partir de procesos ETL que garantizan la carga inicial. Hasta el momento, las transformaciones y trabajos implementados no permiten su actualización a partir de los cambios en los datos. Por tanto, el presente trabajo de diploma tiene como objetivo implementar procesos ETL que garanticen la carga incremental hacia dicho mercado de datos. Además, se confeccionan cubos OLAP, reportes estáticos y dinámicos que permiten el análisis de la información actual e histórica. Para lograr estos objetivos se utiliza el software DB Visual ARCHITECT 4.0 para la modelación dimensional, el Sistema Gestor de Base de Datos (SGBD) PostgreSQL para almacenar los datos del mercado de datos y varias herramientas de la suite de Pentaho, haciendo énfasis en el entorno de desarrollo Spoon perteneciente al Pentaho Data Integration (PDI).
En la actualidad los procesos de Extracción, Transformación y Carga (ETL) han tomado auge en el desarrollo de los almacenes de datos. Estos constituyen un punto esencial en la extracción de datos desde fuentes heterogéneas, la limpieza, integración y carga de los mismos hacia el almacén o mercado de datos correspondiente, mediante la implementación de transformaciones. El departamento de Recursos Humanos (RRHH) de la Universidad Central “Marta Abreu” de Las Villas (UCLV) cuenta con un mercado de datos poblado a partir de procesos ETL que garantizan la carga inicial. Hasta el momento, las transformaciones y trabajos implementados no permiten su actualización a partir de los cambios en los datos. Por tanto, el presente trabajo de diploma tiene como objetivo implementar procesos ETL que garanticen la carga incremental hacia dicho mercado de datos. Además, se confeccionan cubos OLAP, reportes estáticos y dinámicos que permiten el análisis de la información actual e histórica. Para lograr estos objetivos se utiliza el software DB Visual ARCHITECT 4.0 para la modelación dimensional, el Sistema Gestor de Base de Datos (SGBD) PostgreSQL para almacenar los datos del mercado de datos y varias herramientas de la suite de Pentaho, haciendo énfasis en el entorno de desarrollo Spoon perteneciente al Pentaho Data Integration (PDI).
Description
Keywords
Automatización, Procesos de Carga, Mercado de Datos, PostgreSQL, Suite de Pentaho, Recursos Humanos, Universidad Central “Marta Abreu” de las Villas (UCLV)