E N D
Cubos de Información Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo a factores de negocio seleccionados, proveyendo el mecanismo para la rápida y uniforme tiempo de respuesta de las complejas consultas. Estos datos organizados en Cubos, son la materia prima que el DataWare House almacena.
# Acumulación Simple Es sin duda, la más sencilla y común, consiste en realizar una sumarización o resumen de todas las transacciones comprendidas en el período de tiempo seleccionado y transportar el resultado como una única transacción hacia el DW.
# Rolling El proceso de Rolling por su parte, se aplica en los casos en que se opta por mantener varios niveles de granularidad. Para ello se almacena información resumida a distintos niveles, correspondientes a distintas agrupaciones de la unidad de tiempo. Con lo que se consigue una carga de datos en etapas que están entrelazadas por los datos en tiempo y pueden depender una de otras.
COLECCIÓN DE DATOS • Dimensiones • Variables
Dimensiones Las dimensiones de un cubo son atributos relativos a las variables, son las perspectivas de análisis de las variables (forman parte de la tabla de dimensiones). Son catálogos de información complementaria necesaria para la presentación de los datos a los usuarios, como por ejemplo: descripciones, nombres, zonas, rangos de tiempo, etc. Es decir, la información general complementaria a cada uno de los registros de la tabla de hechos.
variables • También llamadas “indicadores de gestión”, son los datos que están siendo analizados. Forman parte de la tabla de hechos. Más formalmente, las variables representan algún aspecto cuantificable o medible de los objetos o eventos a analizar. Normalmente, las variables son representadas por valores detallados y numéricos para cada instancia del objeto o evento medido. En forma contraria, las dimensiones son atributos relativos a la variables, y son utilizadas para indexar, ordenar, agrupar o abreviar los valores de las mismas. Las dimensiones poseen una granularidad menor, tomando como valores un conjunto de elementos menor que el de las variables; ejemplos de dimensiones podrían ser: “productos”, “localidades” (o zonas), “el tiempo” (medido en días, horas, semanas, etc.), ...
Ejemplificando construir un cubo de información sobre el indice de ventas (variable a estudiar) en función del producto vendido, la provincia, el mes del año y si el cliente está casado o soltero (dimensiones). Tendríamos un cubo de 4 dimensiones.
Identificando las variables • Beneficios • Gastos • Ventas Identificando las dimensiones • producto • (diferentes tipos o denominaciones de productos) • localidades • (o provincia, o regiones, o zonas geográficas) • tiempo • (medido de diferentes maneras, por horas, por días, por meses, pr años, ...) • tipo de cliente • (casado/soltero, joven/adulto/anciano, ...)
Características #. Son elementos claves en OLAP (Online Analytic Processing), una tecnología que provee rápido acceso a datos en un almacén de datos (DWH). #. Proveen un mecanismo para buscar datos con rapidez y tiempo de respuesta uniforme independientemente de la cantidad de datos en el cubo o la complejidad del procedimiento de búsqueda. #. Para definir un Cubo, se selecciona una o varias clases objetivo y se seleccionan las medidas (Campos de interés a los usuarios del cubo) dentro de esta clase. #.. Las dimensiones están compuestas de uno o mas campos de otra clase. Las dimensiones proveen la descripción categórica por el cual las medidas son separadas para su análisis por los usuarios del cubo.#. Las dimensiones son categorías descriptivas por los cuales los datos numéricos (Dimensiones) en un cubo, son separados para su análisis.#. Las medidas, son datos numéricos de interés primario para los usuarios del cubo.