110 likes | 244 Views
Capitulo 11 Línea Aérea. Integrantes: Alan Featherston Lago Melina Maggi. Introducción. Importancia de la buena identificación de las granularidades en el dominio de datos. El capítulo desarrolla el tema alrededor de un data warehouse de una línea aérea.
E N D
Capitulo 11Línea Aérea Integrantes: Alan Featherston Lago Melina Maggi
Introducción • Importancia de la buena identificación de las granularidades en el dominio de datos.El capítulo desarrolla el tema alrededor de un data warehouse de una línea aérea. • Muestra cómo cada sector consume datos en el nivel que le son pertinentes a ellos.Pierna, Segmento, Viaje e Itinerario • Técnicas para el manejo de Fecha y Hora, incluyendo calendarios específicos de países, el tratamiento del tiempo como un hecho en vez de una dimensión, y como manejar Fecha y Horas absolutas y relativas.
Objetivo Analizar actividad de viajeros frecuentes. ¿Qué vuelos toman los viajeros frecuentes? ¿Que aviones vuelan? ¿Cual fue la base de lo que pagaron? ¿Con qué frecuencia se actualizan? ¿Como ganar y canjear sus millas? ¿Responden a promociones de tarifas especiales? ¿Cuantas noches pasan y qué proporción de estos viajeros frecuentes tienen estados preferenciales?
Múltiples granularidades en la tabla de hechos Se pueden considerar 4 niveles de granularidad: • LEG:Es el más pequeño y representa el viaje de una aeronave desde que despega en un aeropuerto hasta que aterriza en otro sin paradas intermedias. • SEGMENTO:Este nivel representa una porción del viaje realizado por una única aeronave. Pueden tener asociadas una o más legs. • VIAJE: Este nivel representa la demanda real del cliente. El viaje incluye todos los segmentos necesarios para llegar desde un origen a un destino. • ITINERARIO: El boleto de avión completo o el número de confirmación de reserva.
Reúne una gran variedad de características acerca de los viajeros frecuentes Mini-dimensión que tiene una fila por cada combinación única de nivel de viajero frecuente Contiene información sobre cada vuelo Identifica la clase del viajero Identifica como fue comprado el pasaje
Combinación de dimensiones en super-dimensiones • Si existe una relación de muchos a muchos entre dos grupos de atributos de una misma dimensión deben ser modelados como dimensiones. Hay veces que nos encontramos con una situación en la que estas dos dimensiones se pueden combinar en una SUPERDIMENSION. Esta combinación debe ser vista como la excepción y no la regla. • Esta SUPERDIMENSION se puede observar en la dimensión de “Clase de servicio” la cual combina la clase del servicio comprada, la clase del servicio utilizada realmente y si hubo cambio o no. • También se puede observar en “Origen y Destino”, en esta situación los volúmenes de datos son más significativos, entonces usar roles separados de dimensiones origen y destino resulta más práctico. • De esta forma se puede tener la información precisa de cada clase de vuelo
Dimensiones de tiempo específico en países • Si el data warehouse brinda servicios en varios países, debemos generalizar el estándar de la dimensión tiempo para poder manejar calendarios multinacionales en un número incierto de países. La dimensión primaria de tiempo contiene atributos genéricos acerca del tiempo y la fecha sin importar el país. • Dimensiones de tiempo específicas de un país complementan a la tabla tiempo principal. La clave primaria junto con el nombre del país son fundamentales para la dimensión de tiempo suplementaria. La tabla tendrá datos específicos de los países como feriados, y otras fechas importantes, etc.
Hora del día como dimensión o hecho Separar la hora del día de la dimensión tiempo para evitar la explosión de datos en esta. Usar hora del día como una tabla de dimensión con una fila por cada período de tiempo. Este tipo de diseño nos permite agrupar datos por intervalos de tiempo, como también identificar períodos específicos del negocio. Cuando no es necesario agrupar o filtrar por hora del día, entonces podemos tratar al tiempo como un hecho numérico. En este caso la hora del día será expresada como la cantidad de minutos o segundos desde la medianoche.
Fecha y hora en distintos husos horarios El dilema: sí expresar el horario con respecto a un estándar (como el horario de la casa matriz) o si usar GMT. Para poder satisfacer los requerimientos de los usuarios la respuesta es los dos. El estándar nos permite ver la simultaneidad de las transacciones a través del mercado y la local nos permite entender las transacciones con respecto al momento del día. Para expresar las fechas y los horarios en husos horarios múltiples incluimos dimensiones separadas de momento del día y de fecha correspondiendo a los horarios locales y equivalentes.
Conclusión Este capítulo demuestra la gran importancia que tienen los distintos tipos de granularidad que existen en el dominio de los datos que estemos tratando, a la hora de diseñar nuestro data warehouse. Una conocimiento claro de quiénes son los principales consumidores dentro de la organización es crítico para poder realizar un diseño claro de las dimensiones y cómo éstas son afectadas por los distintos niveles de granularidad que encontramos. Es importante tener conocimiento sobre los distintos husos horarios y calendario de los diferentes países para poder brindar un sistema completo y adecuado al usuario.