Un data warehouse es una construcción arquitectónica de un sistema de información que proporciona a los usuarios información de soporte de decisión histórica y actual que es de difícil acceso o en los sistemas operativos tradicionales.
Las empresas con los años han reunido grandes volúmenes de datos. Almacén de datos pone estos datos a utilizar, analizar las tendencias en estos datos, que puede utilizarse para proporcionar ventaja competitiva.
Sistema ETL es el fundamento de cualquier sistema de DW
Un sistema ETL extrae datos desde sistemas de origen, refuerza la consistencia y calidad de los datos, ajusta los datos por lo separar fuente sistemas podrían utilizarse juntos, ofrece datos en un formato listo de presentación que puede ser utilizado por usuarios finales
Consume casi el 70-80% de los recursos necesarios para la implementación y mantenimiento de un DW
Sistema de misión de ETL: obtener datos de los sistemas de fuente y carga en el DW
Extracto: Extracto de los datos pertinentes
Transformación: Transformación a DW de formato de datos, claves de la construcción, limpieza de datos
Carga: Cargar datos en DW, construir agregados, etc..
DESCRIPCIÓN:
Un java basado en herramienta de ETL para la extracción de datos de diversas fuentes (XML, hojas de cálculo, archivos planos, RDBMS), aplicación de varias transformaciones (como la deduplicación, valores perdidos, la estandarización de fechas, mayúsculas, minúsculas) en el origen de datos y carga de datos estructurados en esquema en estrella se hace.
Ejemplo: para un sistema de registro de la Universidad, el archivo de origen puede contener toda la información sobre los estudiantes, cursos, Facultad, campus, año académico y semestre.