260 likes | 498 Views
OLAP vs OLTP. OLAP vs. OLTP. OLTP ( On Line Transaction Processing ) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de transacciones. OLAP ( On Line Analytic Processing ) (Procesamiento analítico en línea)
E N D
OLAP vs. OLTP • OLTP (On Line TransactionProcessing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de transacciones. • OLAP (On Line AnalyticProcessing) (Procesamiento analítico en línea) Bases de datos orientadas al procesamiento analítico. OLTP OLAP Insert Delete Update Select ACID
OLAP • Permite a los usuarios de negocio examinar minuciosamente los datos a su antojo. • Normalmente, los datos en una organización se distribuyen en múltiples fuentes de datos y son incompatibles entre sí. • Un ejemplo de venta: • Los datos de punto de ventas y las ventas realizadas a través del call-center o en la web se almacenan en lugares y formatos diferentes. Para un ejecutivo obtener informes OLAP como - ¿Cuáles son los productos más populares comprados por clientes entre las edades de 15 a 30?es un proceso que lleva tiempo.
Parte del proceso de implementación OLAP consiste en extraer los datos de diferentes repositorios y hacerlos compatibles. • Hacer compatibles los datos consiste en garantizar que el significado de los datos en un repositorio coincida con el de otros repositorios. • Un ejemplo de datos incompatibles: • Las edades de los clientes se pueden almacenar como fecha de nacimiento en las compras realizadas a través de Internet y almacenarse en categorías de edad (es decir, entre 15 y 30) para ventas en las tiendas.
Data Warehouse • El objetivo del almacenamiento de datos es generar un front-endde análisis que apoye a los ejecutivos de negocios y gerentes de operaciones.
Pre-Data Warehouse • Proporciona los datos para el Data Warehouse. • Metadatos garantiza la exactitud de los datos que entran en el proceso de ciclo de vida de los datos. Asegura que los datos tienen el formato y relevancia. Limpieza de Datos • Antes de que los datos entren en el almacén de datos, la extracción, transformación y limpieza (ETL) asegura que los datos pasan el umbral de calidad de datos. • ETLsson también responsables de las tareas programadas que extraer los datos de los OLTPs.
Repositorios de Datos • El Data Warehousees la base de datos que almacena datos activos de valor de negocio para una organización. • Hay variantes de Almacenes de Datos - Data Martsy ODS. • Los Data Martsno son físicamente diferentes de los almacenes de datos. • Pueden ser vistos como pequeños data warehouses basados en un departamento en lugar de a nivel de toda la compañía. • Un Data Warehouserecoge datos y es el depositario de datos históricos. Por lo tanto, no siempre es eficiente para proporcionar análisis hasta la fecha . Aquí es donde los ODS, almacenes de datos operativos, ayudan. • Los ODSs se utilizan para mantener los datos más recientes antes de la migración hacia el Data Warehouse. • ODS se utilizan para almacenar datos que tienen una historia más profunda que OLTPs. Mantener grandes cantidades de datos en OLTPspuede reducir la velocidad de procesamiento – imaginen esperar en el cajero automático 10 minutos entre las indicaciones para las entradas.
Análisis Front End • Las aplicaciones de front-end que los usuarios de negocio a utilizan para interactuar con los datos almacenados en los repositorios. • Data Mining: es el descubrimiento de patrones útiles en los datos. Por ejemplo, ¿Cuál es la probabilidad de que un cliente migre a un competidor? • OLAP, procesamiento analítico en línea, se utiliza para analizar datos y a menudo son utilizados por los gerentes de marketing. Por ejemplo: ¿Cuántos clientes entre los 24-45 años de edad, que viven en la provincia del Guayas, compran más de $1000 dólares en el supermercado en un mes? • Las Herramientas de informes se utilizan para proporcionar informes sobre los datos. • Las Herramientas de visualización de datos se usan para mostrar datos de un repositorio de datos. A menudo, la visualización de datos se combina con la minería de datos y herramientas OLAP. La Visualización de datos puede permitir al usuario manipular los datos para mostrar la relevancia y los patrones.
OLTP • Ejemplos de OLTPs pueden incluir ERP, CRM, SCM, aplicaciones de Punto de Venta, Call Center. • Están diseñados para una velocidad de transacción óptima. • Los datos no se almacenan por un período prolongado en OLTPs, por costos de almacenamiento y las razones de velocidad de transacciones. Modelo de Datos para un OLTP
OLAPModelo Dimensional de Datos • OLAPs están diseñados para ofrecer un análisis general de lo que sucedió. • Por lo tanto el almacenamiento de datos (es decir, el modelado de datos) tiene que establecerse de manera diferente. • El método más común es el diseño de la estrella. • Son distintos a la tercera forma normal, utilizados en sistemas OLTP. El supervisor que dio la mayoría de los descuentos. La cantidad enviada en una fecha determinada, mes, año o trimestre. En cual código postal el producto A se vende más.
OLAP Para obtener respuestas, como las anteriores, a partir de un modelo de datos cubos OLAP se crean. Para los usuarios es llamado cubo mientras que para los desarrolladores modelo multidimensional. Cubos OLAP no son estrictamente cuboides - es el nombre dado al proceso de vinculación de datos desde las diferentes dimensiones. Tiempo Cliente Producto
Conceptos • Dimensión: Es una categoría de información, por ejemplo, la dimensión del tiempo. • Atributo: Es un nivel único dentro de una dimensión, por ejemplo Mes en la dimensión del tiempo. • Jerarquía: La especificación de niveles que representa la relación entre los diferentes atributos en una dimensión, por ejemplo, Año->Trimestre->Mes->Día
Conceptos • Tabla de hechos: La tabla de hechos contiene las medidas de interés. Por ejemplo, el monto de ventas puede ser esta medida. Esta medida puede ser almacenada en la tabla de hechos con la granularidad apropiada. Por ejemplo puede ser monto de ventas en cada tienda cada día.
Conceptos • Granularidad: Se refiere al mínimo nivel de información que será almacenada en la tabla de hechos. Es el nivel de detalle.
Conceptos • Tabla LookUp: Provee información detallada acerca de los atributos. Por ejemplo, una tabla LookUp para el atributo Trimestre incluiría una lista de información de todos los trimestres disponibles en el datawarehouse, y cada columna (cada trimestre) incluiría muchos campos entre ellos un id que identifique al Trimestre, y campos adicionales que especifiquen que tan particular es el trimestre (primer trimestre del año, etc.)
Enfoque Tecnológico • Desktop OLAP (DOLAP) • El cubo se forma en el cliente • Las operaciones las realiza el cliente una vez que se extrae la información de las bases. Motor Cubo Motor Cliente
Enfoque Tecnológico • Relational OLAP (ROLAP) • El visualizador pregunta al cubo creado dónde está la base, ambos creados por el RDMS (motor), si se requiere algo de otra base, los motores interactúan y el cubo se forma con esos datos. Cliente
Enfoque Tecnológico • Multidimensional OLAP (MOLAP) • El MDBMS forma la base, abstrayendo datos de otras bases RDBMS. • El cubo es creado por el MDBMS • WAC permite la manipulación del cubo. RDBMS MDBMS RDBMS Cliente
Enfoque Tecnológico • Hibrid OLAP (HOLAP): Mezcla el multidimensional con el ROLAP.
250 100 250 300 Ana 15 17 100 10 Juan 100 50 30 20 Mia 300 400 200 100 Pablo Gye Uio Cue Rio Visualizando el Cubo.. El punto cartesiano es un conjunto de valores. El cubo siempre va a tener la dimensión del tiempo.
Visualizando el Cubo.. Drill UP, Drill Down, subo y bajo según mi granularidad lo permita. Cuando se quiere cambiar de columna, se lo hace bajo ciertas condiciones, como el efecto de la columna de pivoteo, al cambiarla, cambian sus coordenadas. Ana Juan Mia Pablo 2001 Gye Uio Cue Rio 2002 2003