Pasos del Pentaho Data Integration en un contexto Big Data
dc.contributor.advisor | Díaz de La Paz, Lisandra | |
dc.contributor.advisor | García Mendoza, Juan Luis | |
dc.contributor.author | Morejón Hernández, Yuniel | |
dc.coverage.spatial | Santa Clara | en_US |
dc.date.accessioned | 2018-03-31T22:21:57Z | |
dc.date.available | 2018-03-31T22:21:57Z | |
dc.date.issued | 2015-06-24 | |
dc.description.abstract | El término big data hace referencia a una inmensa y compleja colección de datos (estructurados, no estructurados, semi-estructurados y mixtos) la cual, debido a su gran tamaño y características, imposibilita su tratamiento por medio de los tradicionales sistemas de bases de datos y aplicaciones de procesamiento de datos. En el presente trabajo de diploma se describen las tecnologías que se utilizan en cada fase de big data (recolección, almacenamiento, procesamiento, análisis y visualización) dentro de estas tecnologías se destaca el ecosistema Hadoop. Además se caracterizan los pasos del Pentaho Data Integration relacionados con big data. Finalmente se implementan transformaciones donde se ejemplifica el uso de big data en el Pentaho Data Integration y se pone de manifiesto su relación con los pasos de limpieza de datos en aras de resolver problemas de calidad de datos detectados en la suite Sistema Integrado de Automatización de Bibliotecas y Centros de Documentación. | en_US |
dc.description.abstract | The term big data refers to a large and complex data sets (structured, non-structured, semi-structured and mixed) which, due to their large size and characteristics, precludes their treatment by traditional database systems and data processing applications. In this dissertation the technologies used in each phase of big data (collection, storage, processing, analysis and visualization) within the Hadoop ecosystem these technologies stands are described. Further characterized Pentaho Data Integration steps related to big data. Finally transformations where the use of big data is exemplified in the Pentaho Data Integration and shows their relationship to data cleansing steps in order to resolve data quality problems identified in the Integrated System of Automation of Libraries and Documentation Centers suite are implemented. | en_US |
dc.description.sponsorship | Facultad de Matemática, Física y Computación. Departamento de Ciencias de la Computación | en_US |
dc.description.status | non-published | en_US |
dc.identifier.uri | https://dspace.uclv.edu.cu/handle/123456789/9165 | |
dc.language.iso | es | en_US |
dc.publisher | Universidad Central “Marta Abreu” de Las Villas | en_US |
dc.rights | Este documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 License | en_US |
dc.subject | ABCD | en_US |
dc.subject | Almacenamiento | en_US |
dc.subject | Análisis | en_US |
dc.subject | Big Data | en_US |
dc.subject | Hadoop | en_US |
dc.subject | PDI | en_US |
dc.subject | Procesamiento | en_US |
dc.subject | Recolección | en_US |
dc.subject | Visualización | en_US |
dc.subject | Storage | en_US |
dc.subject | Analysis | en_US |
dc.subject | Processing | en_US |
dc.subject.other | Big Data | en_US |
dc.subject.other | Procesamiento de Datos | en_US |
dc.subject.other | Limpieza de Datos | en_US |
dc.subject.other | Calidad de Datos | en_US |
dc.subject.other | Ecosistema de Software | en_US |
dc.subject.other | Software Libre | en_US |
dc.subject.other | Automatizacion de Bibliotecas | en_US |
dc.title | Pasos del Pentaho Data Integration en un contexto Big Data | en_US |
dc.type | Thesis | en_US |
dc.type.thesis | bachelor | en_US |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- Tesis Yuniel Morejon Hernández.pdf
- Tamaño:
- 2.75 MB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 3.33 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: