251 likes | 510 Views
PENTAHO BI (Open Source ) Introducción. Taller Técnicos PENTAHO – Junio 2011. Introducción a Pentaho BI: Enterprise & Community. Componentes de la Plataforma Pentaho Reporting Análisis de Datos (Mondrian – JPIVOT) Dashboard Pentaho Data Integration Data Mining - WEKA
E N D
PENTAHO BI (Open Source)Introducción Taller Técnicos PENTAHO – Junio 2011
Introducción a Pentaho BI: • Enterprise & Community. • Componentes de la Plataforma • Pentaho Reporting • Análisis de Datos (Mondrian – JPIVOT) • Dashboard • Pentaho Data Integration • Data Mining - WEKA • Instalación y Administración de Pentaho BI Comunity: • Consola administrativa: • Definición de Datasource • Usuarios y Roles • Repositorio • Consola de Usuario Taller Pentaho Junio 2011 UNNOBA
¿Qué es Business Intelligence? • “Inteligencia de Negocios es el proceso de convertir datos en conocimientos y el conocimiento en acción, para la toma de decisiones” DATOS ANÁLISIS CONOCIMIENTO • Tecnologías involucradas: • Data Warehouse • Reporting • Análisis OLAP (On-line AnalyticalProcessing) • Dashboards • Integración de datos (ETL – Extract, Transform and load) • Minería de datos Taller Pentaho Junio 2011 UNNOBA
Círculo virtuoso de la información DATOS ANÁLISIS ¿Qué pasó? - ¿Qué pasa ahora? - ¿Por qué pasó? - ¿Qué pasará? Taller Pentaho Junio 2011 UNNOBA
Beneficios • Crear un círculo virtuoso de la información ( datos – información – mejores decisiones – generan nuevos datos) • Permite una visión única, histórica, persistente y de calidad de la información. • Crear, manejar y mantener KPI (indicadores de rendimiento) y KGI (indicadores de metas). • Aporta información actualizada. • Reduce la brecha de orientación de negocios entre el departamento de IT y la organización. • Mejorar la competitividad como resultado de ser capaces de: • Diferenciar lo relevante de lo superfluo • Acceder más rápido a la información • Tener mayor agilidad en la toma de decisiones. ATOS ANÁLISIS CONOCIMIENTO Taller Pentaho Junio 2011 UNNOBA
¿Cuándo es necesaria la inteligencia de negocio? • La toma de decisiones es realizada en forma intuitiva. • Se detectan problemas de calidad de información. • Excel Caos = uso intensivo de Excel como herramienta de análisis. Cada usuario con un archivo personalizado, por lo que la información es inconsistente entre las áreas y el costo de sincronización elevado. • Necesidad de cruzar información entre áreas. • Se ha alcanzado una masa crítica de datos. • Es necesario automatizar los procesos de extracción y distribución de la información. ATOS ANÁLISIS CONOCIMIENTO Taller Pentaho Junio 2011 UNNOBA
¿Cómo detectar que no existe una estrategia de BI? • Los usuarios identifican al departamento de IT como origen de sus problemas de inteligencia de negocios. • El nivel jerárquico más alto considera que BI representa otro centro de costo. • El departamento de IT continúa preguntando a los usuarios finales sobre las necesidades de los reportes. • El sistema de BI está soportado por una Mesa de Ayuda • No es posible medir el uso del sistema de BI • No hay un plan para desarrollar, contratar, retener y aumentar el equipo de BI. • No existe un responsable funcional (o bien el asignado no es el adecuado). • Existen múltiples soluciones que repiten funcionalidad. • Alguien cree que es un éxito que la información consolidada esté disponible a los usuarios finales al cabo de 2 semanas. • Los usuarios creen que la información en el DW no es correcta. ATOS ANÁLISIS CONOCIMIENTO Taller Pentaho Junio 2011 UNNOBA
Fases de un Proceso BI • Fase 1: recolectar los requerimientos de información específicos • Fase 2: extraer de las diferentes fuentes de información. • Fase 3: se integran y cargan los datos en crudo en un formato utilizable para el análisis. • Fase 4: se obtendrán las respuestas a las preguntas, mediante la creación de reportes, indicadores de rendimiento, cuadros de mando, gráficos estadísticos, etc. • Fase 5: explorar los datos de manera sencilla e intuitiva. DATOS ANÁLISIS Taller Pentaho Junio 2011 UNNOBA
¿Porqué Open Source BI? • La solución elegida debería ser evaluada según los siguientes criterios: • Adaptabilidad a todos los entornos. • Sin costos de licencias • Independencia del proveedor • Garantías de permanencia. Upgrades y mejoras frecuentes • Tendencia a la calidad y utilización de estándares (XML – MDX) • Dedicación full a los servicios y a la solución de negocios. • Gran aprovechamiento de Web Services. • La comunidad del software libre DATOS ANÁLISIS Taller Pentaho Junio 2011 UNNOBA
Plataforma Pentaho Open Source BI • Características más importantes: • Aplicación web desarrollada en J2EE. Modular. • Servidor Web: puede correr en servidores compatibles con J2EE como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS. • Base de datos: vía JDBC, DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, Firebird, etc. • Sistema operativo: Multiplataforma. • Repositorio de datos basado en XML. • Todos los componentes están expuestos vía Web Services • Incluye: ETL, Reporting, OLAP, Data mining, Dashboards, etc. • Licencia: GNU GPL. DATOS ANÁLISIS Taller Pentaho Junio 2011 UNNOBA
Plataforma Pentaho Open Source BI • Estrategia “open core”: a partir de un núcleo open source se ofrecen servicios y módulos mejorados. • Existen dos versiones disponibles de Pentaho: • PentahoCommunityEdition Completamente gratuita • Pentaho Enterprise Edition Se ofrece bajo modalidad de subscripción DATOS ANÁLISIS Taller Pentaho Junio 2011 UNNOBA
Plataforma Pentaho Open Source BI • PentahoCommunityEdition • Versión comunitaria, sin costos de licencia, sin servicios de soporte asociados. • Es una suite completa con todas las funcionalidades necesarias para el correcto desarrollo de proyectos de BI. • AfPentahosoló la recomienda para: • Aficionados al BI • Académicos • Programadores de Software Abierto • Es totalmente software de código abierto, la licencia en su mayoría bajo la versión GNU. • http://community.pentaho.com/ DATOS ANÁLISIS Taller PentahoJunio 2011 UNNOBA
Plataforma Pentaho Open Source BI • Pentaho Enterprise Edition • Versión empresarial, sin costos de licencia. • Tiene asociados servicios de soporte y mantención que se pagan a través de una suscripción anual. • Es una versión certificada que además posee algunas funcionalidades mejoradas para la consola de administración, y para la construcción de tableros de control. • http://www.pentaho.com DATOS ANÁLISIS Taller PentahoJunio 2011 UNNOBA
Componentes de la Plataforma DATOS ANÁLISIS Taller PentahoJunio 2011 UNNOBA
Componentes de la Plataforma • Existen productos con diferentes enfoques y dirigidos a diferentes tipos de usuarios. • Pentaho Report Designer: Contiene dos componentes: • Un editor basado con prestaciones profesionales destinado a desarrolladores. • Un Wizard que facilita el trabajo y permite a los usuarios obtener resultados de forma inmediata. Está destinada a usuarios con menos conocimientos técnicos. • Web ad-hoc Reporting: es un Wizard vía Web basado en metadatos que extiende la capacidad de los usuarios finales para la creación de informes sencillos. Pentaho Reporting DATOS ANÁLISIS Taller PentahoJunio 2011 UNNOBA
Componentes de la Plataforma • Carácterísticas Generales: • Modelado Multi Dimensional de Datos: • Utiliza MONDRIAN como servidor OLAP de tipo ROLAP. • El modelo de los cubos se guarda en archivos XML • Lenguaje de consulta MDX • Navegación y Exploración de Datos: • utiliza JPIVOT, el cual permite análisis Ad-Hoc de los cubos de Mondrian. • Este componente como otros puede ser reemplazado por otras soluciones que se integran a Pentaho, p.e. PAT Pentaho Análisis OLAP de Datos DATOS ANÁLISIS Taller PentahoJunio 2011 UNNOBA
Componentes de la Plataforma Pentaho Análisis OLAP de Datos DATOS ANÁLISIS Taller PentahoJunio 2011 UNNOBA
Componentes de la Plataforma • Todos los componentes del modulo Pentaho Reporting y Pentaho Analysis (JPIVOT) pueden formar parte de un Dashboard. • Identificación de Indicadores (KPI’s, Key Performance Indicators) • Monitoreo / Métricas • Investigar detalles subyacentes • Drill a reportes de soporte • Seguimiento de excepciones • Alertas basadas en reglas del negocio Pentaho Dashboard DATOS ANÁLISIS Taller PentahoJunio 2011 UNNOBA
Componentes de la Plataforma • Poderosa herramienta de ETL (Extracción, Transformación y Carga del DW). • Entorno gráfico de desarrollo . Multiplataforma • Basado en dos tipos de objetos: Transformaciones (colección de pasos en un proceso ETL) y trabajos (colección de transformaciones) • Incluye cuatro herramientas: • SPOON: para diseñar transformaciones usando el entorno gráfico • PAN: para ejecutar transformaciones diseñadas con SPOON. • CHEF: para crear trabajos • KITCHEN: para ejecutar trabajos Pentaho Data Integration DATOS ANÁLISIS Taller PentahoJunio 2011 UNNOBA
Componentes de la Plataforma • Se utiliza para: • Descubrir patrones ocultos y correlaciónales en los datos • Prevenir eventos futuros basados en patrones históricos Data Mining - WEKA DATOS Taller PentahoJunio 2011 UNNOBA
Instalación • ¿Qué necesitamos descargar para poder ver la solución propuesta? • El servidor BI: • http://sourceforge.net/projects/pentaho/files/Business%20Intelligence%20Server/3.6.0-stable/ • Biserver-ce-3.6.0-stable.zip para Windows • Biserver-ce-3.6.0-stable.tar.gz para Linux • El motor Postgresql 8.3 o superior y su correspondiente JDBC • Pentaho Data Integration 4.1.0: http://sourceforge.net/projects/pentaho/files/Data%20Integration/4.1.0-stable/ • Pdi-ce-4.1.0-stable.zip para Windows • Pdi-ce-41.0-stable.tar.gz para Linux DATOS ANÁLISIS Taller PentahoJunio 2011 UNNOBA
Instalación • Al descomprimir el bi-server tendrán los siguientes directorios: Pentaho/ administrationconsole/ biserver-ce/ • Necesitarán configurar la siguiente variable de entorno: • SET JAVA_HOME= /pentaho/biserver-ce/tomcat/jre en windows • Y copiar el driver jdbc de postgresql a: • C:\pentaho360\administration-console\jdbc en Windows • Verificar que también esté el driver en: • c:\pentaho360\biserver-ce\tomcat\lib en Windows DATOS ANÁLISIS Taller PentahoJunio 2011 UNNOBA
Referencias Bibliográficas y Otros…. • Introducción al Business Intelligence – Josep Curto Díaz – ISBN: 978-84-9788-886-8 – Mayo 2010 • Pentaho 3.2 Data Integration – María Carina Roldán - ISBN 978-1-847199-54-6 – 2010 • “Proyecto de implementación de un Data Warehouse para universidades nacionales “ - Trabajo Final De Grado - Del GiudiceGlenda, Della Mea (principalmente el Anexo 1) • Toda la documentación producida por el Ing. Darío Bernabeu. • PentahoSolutions Business Intelligence and Data Warehousing with Pentaho and MySQL– Parte III - RolandBouman, Jos van Dongen - ISBN: 978-0-470-48432-6 • http://kettle.pentaho.org/ de la Community. • http://Sourceforge.net/projects/pentaho/files Taller Pentaho Junio 2011 UNNOBA