460 likes | 890 Views
Pentaho (BI Open Source). Lic. Ana Smail. Año 2010. Pentaho (BI Open Source). En el área de Business Intelligence, se ha producido recientemente un despegue espectacular en el desarrollo de soluciones e implementación de herramientas Open Source.
E N D
Pentaho (BI Open Source) Lic. Ana Smail Año 2010
Pentaho (BI Open Source) • En el área de Business Intelligence, se ha producido recientemente un despegue espectacular en el desarrollo de soluciones e implementación de herramientas Open Source. • La cantidad de proyectos libres de licencias en este segmento y el número de personas implicadas demuestran que existe capacidad para que se desarrolle de formas muy diferentes y complementarias a la vez. OSBI - Concepto Año 2010 (extraído de http://www.corebi.com)
Pentaho (BI Open Source) Por qué OSBI ? • Adaptabilidad a todos los entornos. • Sin costos de licencias • Independencia del proveedor • Seguridad • Garantías de permanencia. Upgrades y mejoras frecuentes • Tendencia a la calidad y utilización de estándares • Dedicación full a los servicios y a la solución de negocios • Gran aprovechamiento de Web Services y tecnología SOA • La comunidad del software libre Los proyectos BI deberían ser proyectos a largo plazo, porque de ellos depende no sólo el presente de nuestras decisiones, sino el futuro. Año 2010
Pentaho (BI Open Source) OSBI existentes Año 2010 (extraído de: http://redcloverbi.wordpress.com/2009/06/20/bi-open-source-%C2%BFcual/ - 20/06/2009)
Pentaho (BI Open Source) OSBI existentes • Una funcionalidad muy interesante es que admite el uso de diferentes motores OLAP que dan respuesta a la necesidad sin diferenciar si en dicho ámbito usamos una solución open source o propietaria. Por ejemplo, podemos usar Mondrian es ROLAP y PALO es MOLAP. De manera que ambos motores se complementan. • OLAP: soporta los motores Mondrian, PALO y Microsoft Analysis Services. • Informes: soporta los motores de JasperReports, BIRT y Cristal Reports. • ETL: soporta los motores de Talend, Oracle Warehouse Builder y Data Stage. • Dashboard: soporta los motores de Lazlo y Tibco. • Análisis geográfico: soporta mapserver y sbigeo. • Data Mining: soporta weka, Año 2010 (extraído de http://todobi.blogspot.com/2009/04/novedades-en-spagobi.html)
Pentaho (BI Open Source) OSBI existentes Año 2010 (extraído de http://todobi.blogspot.com/2009/04/novedades-en-spagobi.html)
Pentaho (BI Open Source) OSBI existentes • SpagoBI Server: nucleo central de SpagoBI que integra la funcionalidad de los diferentes motores, gestión de usuarios, etc. • SpagoBI Studio: entorno de desarrollo único e integrado. • SpagoBI Meta: entorno enfocado a la capa de metadatos. • SpagoBI SDK: un nuevo nivel de integración para utilizar SpagoBI con aplicaciones externas • SpagoBI Applications: para mantener los modelos verticales de análisis desarrollados con SpagoBI. • Esta es una solución enteramente Open Source. En la página oficial puede verse una demo en línea de la suite (http://spagobi.ow2.org) Año 2010 (extraído de http://todobi.blogspot.com/2009/04/novedades-en-spagobi.html)
Pentaho (BI Open Source) OSBI existentes • Es una aplicación de Inteligencia de Negocios, diseñado para el uso basado en la web. Basado en Java EE con la aplicación por defecto para correr en tomcat, OpenI es una solución para la construcción y publicación de informes de XMLA compatible con fuentes de datos OLAP, como Microsoft Analysis Services o Mondrian. Su objetivo es proporcionar análisis consolidado de los principales componentes de datos de una aplicación inteligente, incluyendo: • Fuentes de datos OLAP • Bases de datos relacionales • Los datos estadísticos modelo • Los modelos de minería de datos Página:http://openi.org/. Demo en línea : http://demo.openi.org/openi/ (usuario/pass= openi2/openi2) Año 2010
Pentaho (BI Open Source) OSBI existentes • Con qué cuenta: • Reports (Ireport & BIRT engines) • Web reports (Web interface for creation and data exploration) • Olap views (FreeAnalysis engine) • Dashboard (FreeDashboard engine) • Key Performance Indicateors (FreeMetrics engine) • Maps (Googlemap integration & Map engines) Obtener demo de: http://forge.bpm-conseil.com/ Documento de presentación de la versión 2.2: http://www.bpm-conseil.org/vanilla22/documentation/BPM_Vanilla_Presentation_200_FR.pdf Año 2010
Pentaho (BI Open Source) La plataforma Pentaho Open Source Business Intelligence Año 2010 (extraído de Todo BI - http://www.gravitar.biz - http://www.cognus.cl)
Pentaho (BI Open Source) La plataforma Pentaho Open Source Business Intelligence • La plataforma Open Source Pentaho Business Intelligence cubre muy amplias necesidades de Análisis de los Datos y de Informes empresariales. Las soluciones de Pentaho están escritas en Java y tienen un ambiente de implementación también basado en Java. • Administración y distribución de reportes, análisis y dashboards • Fácil integración de fuentes de datos, portales y aplicaciones usando estándares abiertos • Programación de tareas y autentificación integradas • Funcionalidades de customización a través de APIs, Web Services o modificación a plantillas, reglas de negocio o incluso el código fuente • Registro de auditoría integrado para seguimiento de actividades de usuarios, performance y acceso a contenido • Procesos basados en workflow que permiten implementar lógica de negocios única Año 2010
Pentaho (BI Open Source) Estado actual de la solución y componentes Año 2010
Pentaho (BI Open Source) Estado actual de la solución y componentes • Plataforma 100% J2EE, asegurando la escalabilidad, integración y portabilidad. • Servidor: puede correr en servidores compatibles con J2EE como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS. • Base de datos: vía JDBC, IBM DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, NCR Teradata, Firebird. • Sistema operativo: no hay dependencia. Lenguaje interpretado. • Lenguaje de programación: Java, Javascript, JSP, XSL (XSLT/XPath/XSL-FO). • Interfaz de desarrollo: Java SWT, Eclipse, Web-based. • Repositorio de datos basado en XML. • Todos los componentes están expuestos vía Web Services para facilitar la integración con Arquitecturas Orientadas a Servicios (SOA). Año 2010 (extraído de Todo BI)
Pentaho (BI Open Source) Estado actual de la solución y componentes Pentaho se define a si mismo como una plataforma de BI “orientada a la solución” “centrada en procesos” que incluye todos los principales componentes requeridos para implementar soluciones basados en procesos y ha sido concebido desde el principio para estar basada en procesos. Las soluciones que Pentaho pretende ofrecer se componen fundamentalmente de una infraestructura de herramientas de análisis e informes integrado con un motor de workflow de procesos de negocio, una de las capacidades BI claves de la plataforma. Año 2010 (extraído de Todo BI)
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Año 2010
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Integración de Datos • Se compone de 4 herramientas: • SPOON: permite diseñar de forma gráfica la transformación ETL. • PAN ejecuta la transformaciones diseñadas con SPOON. • CHEF permite, mediante una interfaz gráfica, diseñar la carga de datos incluyendo un control de estado de los trabajos. • KITCHEN permite ejecutar los trabajos batch diseñados con Chef. Año 2010 http://kettle.pentaho.org
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Año 2010 http://kettle.pentaho.org
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Análisis de Datos • Despliegue gráfico interactivo, con grillas de datos • Resultados explorables y navegables incluso en los gráficos • Sofisticadas capacidades OLAP, arquitectura ROLAP • Técnicas de optimización para mejoras de tiempos de respuesta Año 2010 http://kettle.pentaho.org
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Análisis de Datos • El servidor OLAP : Para obtener la funcionalidad de procesamiento analítico en línea (OLAP) se utilizan dos aplicaciones combinadas • el servidor OLAP Mondrian, y • Jpivot, • Ambos permiten realizar querys a Datamarts, y que los resultados sean presentados mediante un browser y que el usuario pueda realizar drill down y el resto de las navegaciones típicas. Año 2010 ( http://mondrian.pentaho.org )
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Análisis de Datos • Algunas cuestiones interesantes sobre Mondrian: • Mondrian utiliza MDX como lenguaje de consulta, que no tendría nada de raro si no fuera porque fue un lenguaje propuesto por Microsoft. • En noviembre de 2005 Mondrian se incorporó al proyecto Pentaho. • Mondrian funciona sobre las bases de datos estándar del mercado: Oracle, DB2, SQL-Server, MySQL,PostgreSQL... lo cual habilita y facilita el desarrollo de negocio basado en la plataforma Pentaho. • JPivot está considerado con un “proyecto hermano” de Mondrian. Al incorporarse Mondrian también lo ha hecho JPivot Año 2010 ( http://mondrian.pentaho.org )
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Dashboards • Todos los componentes del modulo Pentaho Reporting y Pentaho Análisis pueden formar parte de un Dashboard. • Identificación de Indicadores (KPI’s, Key Performance Indicators) • Monitoreo/Métricas • Investigar detalles subyacentes • Drill a reportes de soporte • Seguimiento de excepciones • Alertas basadas en reglas del negocio Año 2010
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Dashboards Año 2010
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Datamining • Pentaho está incorporando la tecnologíaWeKa. • Poderoso motor de minería de datos provee de un set de algoritmos de aprendizaje del proyecto Weka incluyendo clustering, segmentación, árboles de decisión, random forests, redes neuronales y análisis de componentes principales, entre otros. • Integración de Pentaho Data Integration, automatización de procesos de transformación de datos al formato que requiere el motor de data mining. • Los algoritmos pueden ser aplicados directamente a un set de datos o invocados desde código Java. • Provee filtros para discretización, normalización, re-muestreo, selección de atributos, transformación y combinación de atributos. • Modelos para predicción de variables nominales o numéricas. • Herramientas gráficas de diseño para preprocesamiento de datos, regresión, clustering, reglas de asociación. Año 2010 (http://www.sourceforge.net/projects/weka)
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Datamining Año 2010
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Reporting • Es una solución basada en el proyecto JFreeReport (hay quienes usan BIRT). • Permite la distribución de los resultados del análisis en múltiples formatos - todos los informes incluyen la opción de imprimir o exportar a formato PDF, XLS, HTML y texto- y permiten también la programación de tareas y ejecución automática de informes con una determinada periodicidad. Año 2010 http://reporting.pentaho.org
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Reporting • Esta herramienta cuenta con: • Implementación flexible, desde solución standalone de escritorio, a reportes interactivos basados en Inteligencia de Negocios • Amplio soporte a fuentes de datos incluyendo datos relacionales, OLAP o basados en XML • Solución proporcionada por pentaho e integrada en su suite para el desarrollo de informes Año 2010 http://reporting.pentaho.org
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Reporting • Existen tres productos con diferentes enfoques y dirigidos a diferentes tipos de usuarios: Pentaho Report Designer Pentaho Report Design Wizard Web ad-hoc reporting Año 2010 (http://reporting.pentaho.org)
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Reporting Año 2010
Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Workflow de Procesos de Negocio • Existen dos fundamentos del Workflow de Procesos de Negocio: • El motor de workflow Enhydra Shark • El estándar WPDL, auspiciado por la WorkFlow Management Coalition (WFMC), organismo que declara tener más de 300 empresas asociadas, incluyendo a las desconocidas IBM, Oracle, BEA, Adobe, SAP, TIBCO o SUN, por citar algunas de ellas. Año 2010
Pentaho (BI Open Source) COMMUNITY ó ENTERPRISE? • Existen dos versiones disponibles de Pentaho • Pentaho Community Edition • Pentaho Enterprise Edition Año 2010
Pentaho (BI Open Source) COMMUNITY ó ENTERPRISE? • Pentaho Community Edition • Versión comunitaria, sin costos de licencia, sin servicios de soporte asociados. Es una suite completa con todas las funcionalidades necesarias para el correcto desarrollo de proyectos de Business Intelligence. Aunque Pentaho soló la recomienda para: • Aficionados al BI • Académicos • Programadores de Software Abierto • Es totalmente software de código abierto, la licencia en su mayoría bajo la versión GNU General Public License versión 2, con partes bajo el LGPLv2, la Common Public License, y la Licencia Pública de Mozilla. Año 2010
Pentaho (BI Open Source) COMMUNITY ó ENTERPRISE? • Pentaho Enterprise Edition • Versión empresarial, sin costos de licencia. • Tiene asociados servicios de soporte y mantención que se pagan a través de una suscripción anual. • Es una versión certificada que además posee algunas funcionalidades mejoradas para la consola de administración, y para la construcción de tableros de control. Año 2010
(extraído de Pentaho BI Suite Enterprise Edition) Pentaho (BI Open Source) COMMUNITY ó ENTERPRISE? • Comparativa Año 2010 (extraído de Pentaho BI Suite Enterprise Edition)
(extraído de Pentaho BI Suite Enterprise Edition) Pentaho (BI Open Source) COMMUNITY ó ENTERPRISE? • Comparativa Año 2010 (extraído de Pentaho BI Suite Enterprise Edition)
Pentaho (BI Open Source) Dónde conseguir ayuda ? • Pentaho Community • Community Wiki Home • http://wiki.pentaho.com/display/COM/Community+Wiki+Home • Community Forums • http://forums.pentaho.org/ Año 2010
Pentaho (BI Open Source) Por qué Pentaho ? • Mejores productos • Cobertura completa de punta a punta de las necesidades de BI • Calidad sin igual, comunidad extensa y adopción empresarial • Arquitectura moderna, construida sobre estándares y en base a componentes • Servicios de administración • Mejor servicio • Soporte a producción disponible 24x7x365 • Atención a soporte por los verdaderos expertos Pentaho desde la primera • Llamada • Capacitación y consultoría profesional Año 2010 (extraído de Todo Bi - http://www.cognus.cl)
Pentaho (BI Open Source) Por qué Pentaho ? • Mejor valor • Licencia Open Source sin costo • Servicio de subscripción y soporte a una fracción de proveedores propietarios • Mejor relación • Completa transparencia • Relación basada 100% en la calidad de soporte al cliente Año 2010 (extraído de Todo Bi - http://www.cognus.cl)
Pentaho (BI Open Source) Herramientas cliente • Report Designer (http://reporting.pentaho.org) • Designer Studio • Aggregation Designer • Metadata Edition • Pentaho Data Integration • Schema Workbench Año 2010 (extraído de: Introducing the Pentaho BI Suite 3.5 Community Edition)
Pentaho (BI Open Source) Instalación • Qué necesitamos descargar ? • BI-Server de Pentaho, su distribución CE (Community Edition) Pentaho/ administrationconsole/ biserver-ce/ Crear un directorio /pentaho/design-tools • Schema Workbench (http://sourceforge.net/projects/mondrian/files/) • Report Designer (http://sourceforge.net/projects/pentaho/files/) • Report Wizard (http://sourceforge.net/projects/pentaho/files/) • Pentaho Design Studio (http://sourceforge.net/projects/pentaho/files/) • Pentaho Metadata (http://sourceforge.net/projects/pentaho/files/) • Data Integration (http://sourceforge.net/projects/pentaho/files/) Año 2010 (http://sourceforge.net/projects/pentaho/files/)
Pentaho (BI Open Source) Instalación • Qué necesitamos descargar ? Tendremos entonces la siguiente estructura de directorios: Pentaho/ administrationconsole/ biserver-ce/ design-tools/ schema-workbench/ report-design/ report-wizard/ design-studio/ pentaho-metada/ data-integration/ • Descargaremos el motor Postgresql 8.4 que usaremos como repositorio de datos. • PostreSQL 8.4.3-1 for windows incluye PGADMIN III • (http://www.enterprisedb.com/products/pgdownload.do) • JDBC de PostgreSQL (http://jdbc.postgresql.org/download/postgresql-8.4-701.jdbc3.jar) Para mayor información de download ver: http://wiki.pentaho.com/display/COM/Community+Edition+Downloads Año 2010 (http://sourceforge.net/projects/pentaho/files/)
Pentaho (BI Open Source) Instalación • Repositorio de la solución • Viene por default en un RDBMS, HyperSQL. Para este curso introductorio no lo cambiaremos, pero puede migrase a: • MySQL 5.x • PostgreSQL 8.x.x • Oracle 10g & 11g • Prashant Raju nos dá un buen aporte con esto: • http://www.prashantraju.com/projects/pentaho/ • En está página encontramos cómo migrar el repositorio a con los correspondientes script de migración. Año 2010 (http://sourceforge.net/projects/pentaho/files/)
Pentaho (BI Open Source) Qué deberíamos conocer ? • Apache Tomcat • Hibernate • Jetty • PostgreSQL • Quartz • Hypersonic Ver terminología usada en el proyecto Pentaho en http://wiki.pentaho.com/display/PEOpen/Pentaho+Terminology+Project Año 2010 (por Prashant Raju)
Pentaho (BI Open Source) Instalación • Configuración • Correo • /pentaho/biserver-ce/pentaho-solutions/system/smtp-email/email_config.xml • Puertos • /pentaho/biserverp-ce/tomcatt/conf/server.xml • Publicaciones • /pentaho/biserver-ce/pentaho-solutions/system/publisher_config.xml • Despliegue • /pentaho/biserver-ce/tomcat/webapps/pentaho/WEB-INF • <context-param> • <param-name>base-url</param-name> • <param-value>http://myserver.pentaho.org:8080/pentaho</param-value> • </context-param> • JAVA HOME • SET JAVA_HOME= /pentaho/biserver-ce/tomcat/jre Año 2010 (http://sourceforge.net/projects/pentaho/files/)
Pentaho (BI Open Source) Instalación • Iniciar el Business Intelligence Server • Registrar el Tomcat como un servicio • /pentaho/biserver-ce/tomcat/bin> service.bat install tomcat5 • Iniciar el servicio, desde la consola de servicios de windows. • Entrar a la Consola de Usuario ya que tenemos el servidor BI corriendo. http://localhost:8080/pentaho • Ingresar seleccionar el usuario “joe” del combo con los usuarios para demo, que es el usuario con rol de administrador. La password es “password”. Año 2010 (http://sourceforge.net/projects/pentaho/files/)
Pentaho (BI Open Source) Instalación • Iniciar la Consola de Administración • Tener en cuenta que siempre debe estar corriendo primero el servidor BI. • Ejecutar /pentaho/administration-console/start-pac.bat. Se abrirá una ventana de comandos cuya última línea mostrará: console if now started. It can be accessed using http://[servidor]:8099 • Puede ingresar a la interfase en http://localhost:8099/ o la dirección que especifique en la ventana anterior. Verá una ventana de login que pedirá usuario y clave; estas son "admin" y "password". • Creamos un nuevo Datasource para las soluciones que vamos a implementar Año 2010 (http://sourceforge.net/projects/pentaho/files/)
Preguntas Lic. Ana Smail (anasmail@unnoba.edu.ar) Año 2010