230 likes | 412 Views
Bases de Datos II OLAP Online Analytical Processing. Elaborado por: Guillermo Baquerizo I Término 2012-2013. Objetivos. El estudiante será capaz de aprender : el propósito del procesamiento analítico en línea .
E N D
Bases de Datos IIOLAPOnline AnalyticalProcessing Elaborado por: Guillermo Baquerizo I Término 2012-2013
Objetivos • El estudianteserácapaz de aprender: • el propósito del procesamientoanalítico en línea. • lasrelaciones entre OLAP y los almacenes de datos (DATA WAREHOUSE). • lascaracterísticas clave de lasaplicaciones OLAP. • cómorepresentarcubosmultidimensionales. • lascategorías de lasherramientas OLAP.
Conceptos • OLAP.- Se refiere a la síntesis, análisisyconsolidación de grandesvolúmenes de datosmultidimensionales. Es unasoluciónutilizada en el campo BI (Business Intelligence), para lo cualutilizacubos de informaciónypuede ser utilizado en DATA MINING (Minería de Datos).
Conceptos • Las bases de datosrelacionales se utilizanprincipalmenteparasoportarsistemas de procesamiento de transacciones en línea (OLTP, Online Transaction Processing). • Los DBMS (DataBase Management System) relacionales se handesarrolladoparapermitir la ejecucióneficiente de un grannúmero de transaccionesrelativamente simples.
Conceptos • Los DBMS relacionaleshantratado de dirigirse al mercado de los almacenes de datosyhanpromocionadosussistemascomoherramientasparaconstruirestetipo de almacenes. • Para consultasmásavanzadas se requiere el OLAP.
Esquema Sistemas Operacionales ETL Extraction Transformation Loading OLAP ERP Metadatos CRM Reportes Datos resumidos Archivos planos Data WareHouse Minería de datos
Cubosmultidimensionales • Considere un ejemplo con los datosmultidimensionalesvistosdesde: • Unatabla de 3 campos • Unamatrizbidimensional • Un cubotridimensional
Categorías • Las herramientas OLAP puedenclasificarse de acuerdo con la arquitecturautilizadaparaalmacenaryprocesar los datosmultidimensionales. Hay cuatrocategoríasprincipales: • MOLAP • ROLAP • HOLAP • DOLAP
OLAP Multidimensional (MOLAP) • Las estructuras de datos MOLAP utilizantecnologíamatricialytécnicaseficientes de almacenamientoqueminimizanlasnecesidades de espacio en disco, gracias a la gestión de datosdispersos. • Se suelencentrar en datosparaunaaplicaciónespecífica de ayuda a la toma de decisiones.
OLAP Multidimensional (MOLAP) • Problemas: • Sólopuedenalmacenarseyanalizarse de maneraeficienteunacantidadlimitada de datos. • La navegacióny el análisis de los datosestánlimitados, porque los datos se diseñan de acuerdo a requisitospreviamentedeterminados. • Los productos MOLAP requieren un conjuntodiferente de capacidadesyherramientasparaconstruirymantener la base de datos, incrementándose el costoy la complejidad de lastareas de soporte.
OLAP Multidimensional (MOLAP) Servidor de base de datos relacional y/o sistemas heredados Servidor MOLAP Solicitud de datos Conjunto de resultados Herramientas de acceso de usuario final Carga
OLAP Relacional (ROLAP) • Soportan los productos RDBMS mediantes el uso de un nivel de metadatos, evitandoasí la necesidad de crearunaestructura de datosmutidimensionalestática. Estofacilita la creación de múltiples vistas multidimensionales de la relaciónbidimensional. • Para mejorarlasprestaciones, algunosproductos ROLAP disponen de motores SQL mejoradosparasoportar la compeljidad del análisis multidimensional.
OLAP Relacional (ROLAP) • Problemas: • Rendimientoasociado con el procesamiento de consultascomplejasquerequieranefectuarmúltiplespasadas a través de los datosrelacionales. • Desarrollo de middleware parafacilitar el desarrollo de aplicacionesmultidimensionales, esdecir, software queconvierta la relaciónbidimensional en unaestructura multidimensional. • Desarrollo de unaopciónparacrearestructurasmultidimensionalespersistentes, junto con lasfuncionesparaayudar en la administración de estasestructuras.
OLAP Relacional (ROLAP) Servidor de base de datos relacional Servidor ROLAP Solicitud de datos SQL Conjunto de resultados Herramientas de acceso de usuario final Conjunto de resultados
OLAP híbrido (HOLAP) • Proporcionancapacidadeslimitadas de análisis, biensobreproductos SGBDR obienutilizando un servidor MOLAP intermedio. • Las herramientas HOLAP suministran a la máquina de escritorio los datosseleccionados en la forma de un cubo de datos, el cual se almacena, analizaymantienelocalmente.
OLAP híbrido (HOLAP) • Problemas: • La arquitecturaprovocaunasignificativaredundancia de los datosypuedecausarproblemas en lasredesquesoportenmuchosusuarios. • La capacidad de cadausuarioparaconstruir un cubo de datospersonalizadopuedeprovocarunafalta de coherencia entre los datos de los diferentesusuarios. • Sólopuedemantenerse de maneraeficienteunacantidadlimitada de datos.
OLAP híbrido (HOLAP) Servidor de base de datos relacional SQL Conjunto de resultados Solicitud de datos Servidor MOLAP Conjunto de resultados Herramientas de acceso de usuario final Carga
OLAP de Escritorio (DOLAP) • Almacenan los datos OLAP en archivossituados en la plataforma del clienteysoportan el procesamiento multidimensional del lado del cliente. • Estosdatospuedendistribuirseporadelantadoobajopetición, posiblemente a través de la web. • Aunquetambién se puedenmantener en el disco o la RAM, algunosproductos DOLAP sólopermitenacceso de lectura.
OLAP de Escritorio (DOLAP) • Problemas: • Provisión de controles de seguridadapropiadosparasoportartodos los entornos. • Hacefaltareducir el esfuerzonecesarioparaimplantarymantenerlasherramientas DOLAP. • Las formasexistentes son: correoelectrónico, web o la tradicionalarquitecturacliente-servidor. • Las tendenciasactualesapuntanhacia la utilización de máquinascliente simples.
OLAP de Escritorio (DOLAP) Servidor de base de datos relacional La distribución de los datos OLAP desde una base de datos relacional o desde un servidor MOLAP hasta el PC de escritorio o portátil se realiza utilizando correo electrónico, la web o una arquitectura tradicional cliente-servidor. Servidor MOLAP
Extensiones al lenguaje SQL • Se puedenrealizarcálculosutilizandoagregación del tipo de SUM, COUNT, MAX, MIN, AVG • Capacidades de agrupamientoampliadas: • Rollup: Nivelescrecientes de agregacióndesde el másdetalladohasta el más general. • La instrucciónes: • SELECT … GROUP BY (ListaDeColumnas) WITH ROLLUP • Cube: Similar a Rollup, peropermitetodaslasposiblescombinaciones de agregaciones. • La instrucciónes: • SELECT … GROUP BY (ListaDeColumnas) WITH CUBE