Estudio del Pentaho Data Integration en los procesos de integración de datos (ETL)
Fecha
2013-06-24
Autores
López Burgos, Danay
Galindo Artiles, Yaumara
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Central "Marta Abreu" de la Villas
Resumen
En la actualidad los volúmenes de datos crecen aceleradamente en todos los procesos de una organización. Con frecuencia los directivos necesitan analizar la información de diferentes departamentos de manera centralizada, lo que conlleva a la necesidad de consultar datos desde fuentes heterogéneas. Teniendo presente la diversidad de formatos, tipos y fuentes de datos en los cuales se puede encontrar dicha información, se hace imprescindible contar con procesos de extracción, transformación, limpieza, carga (ETL) y métodos de integración de datos que permitan una vista unificada con la mayor calidad posible. Para lograr lo anteriormente expuesto se utiliza la herramienta Spoon perteneciente al Pentaho Data Integration (PDI) en la implementación de transformaciones y trabajos desde su interfaz gráfica.
Como resultado se logra describir y valorar críticamente la herramienta Spoon apoyados en el análisis de los patrones que agrupan los subsistemas de Kimball y de las anomalías detectadas en un caso de estudio.
Currently data volumes are growing rapidly in all process of an organization. Often managers need to analyze information from different departments in a centralized manner, which leads to the need to query data from heterogeneous sources. Bearing in mind the diversity of formats, types and data sources on which you can find this information, it is essential to have processes for extracting, transforming, cleaning, loading (ETL) and data integration methods that enable a unified view with the highest possible quality. To achieve the above the tool Spoon belonging to Pentaho Data Integration (PDI) is used in the implementation of transformations and jobs since its graphical interface. As a result achieves to describe and critically evaluate Spoon supported tool in the analysis of the patterns grouped Kimball subsystems and the anomalies detected in a case study.
Currently data volumes are growing rapidly in all process of an organization. Often managers need to analyze information from different departments in a centralized manner, which leads to the need to query data from heterogeneous sources. Bearing in mind the diversity of formats, types and data sources on which you can find this information, it is essential to have processes for extracting, transforming, cleaning, loading (ETL) and data integration methods that enable a unified view with the highest possible quality. To achieve the above the tool Spoon belonging to Pentaho Data Integration (PDI) is used in the implementation of transformations and jobs since its graphical interface. As a result achieves to describe and critically evaluate Spoon supported tool in the analysis of the patterns grouped Kimball subsystems and the anomalies detected in a case study.
Descripción
Palabras clave
Bases de Datos, Procesos de Extracción, ETL, Procesos de Transformación, Procesos de Carga, Pentaho Data Integration (PDI)