Estudio del Pentaho Data Integration en los procesos de integración de datos (ETL)

Fecha

2013-06-24

Autores

López Burgos, Danay
Galindo Artiles, Yaumara

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central "Marta Abreu" de la Villas

Resumen

En la actualidad los volúmenes de datos crecen aceleradamente en todos los procesos de una organización. Con frecuencia los directivos necesitan analizar la información de diferentes departamentos de manera centralizada, lo que conlleva a la necesidad de consultar datos desde fuentes heterogéneas. Teniendo presente la diversidad de formatos, tipos y fuentes de datos en los cuales se puede encontrar dicha información, se hace imprescindible contar con procesos de extracción, transformación, limpieza, carga (ETL) y métodos de integración de datos que permitan una vista unificada con la mayor calidad posible. Para lograr lo anteriormente expuesto se utiliza la herramienta Spoon perteneciente al Pentaho Data Integration (PDI) en la implementación de transformaciones y trabajos desde su interfaz gráfica. Como resultado se logra describir y valorar críticamente la herramienta Spoon apoyados en el análisis de los patrones que agrupan los subsistemas de Kimball y de las anomalías detectadas en un caso de estudio.
Currently data volumes are growing rapidly in all process of an organization. Often managers need to analyze information from different departments in a centralized manner, which leads to the need to query data from heterogeneous sources. Bearing in mind the diversity of formats, types and data sources on which you can find this information, it is essential to have processes for extracting, transforming, cleaning, loading (ETL) and data integration methods that enable a unified view with the highest possible quality. To achieve the above the tool Spoon belonging to Pentaho Data Integration (PDI) is used in the implementation of transformations and jobs since its graphical interface. As a result achieves to describe and critically evaluate Spoon supported tool in the analysis of the patterns grouped Kimball subsystems and the anomalies detected in a case study.

Descripción

Palabras clave

Bases de Datos, Procesos de Extracción, ETL, Procesos de Transformación, Procesos de Carga, Pentaho Data Integration (PDI)

Citación