1 / 40

Capítulo 6

Capítulo 6. Fundamentos de la inteligencia de negocios Administración de Bases de Datos e Información. Comisión 5 (R. Garcia – O. Castro) Primer parcial: Viernes 4/10 Segundo parcial: Viernes 22/11 Recuperatorio de parciales: Viernes 6/12.

janae
Download Presentation

Capítulo 6

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Capítulo 6 Fundamentos de la inteligencia de negocios Administración de Bases de Datos e Información Comisión 5 (R. Garcia – O. Castro) Primer parcial: Viernes 4/10Segundo parcial: Viernes 22/11 Recuperatorio de parciales: Viernes 6/12 Comisión 6 (L. Cornacchia - R García) Primer parcial: Sábado 5/10 Segundo parcial: Sábado 23/11 Recuperatorio de parciales: Sábado 7/12

  2. OBJETIVOS DE APRENDIZAJE • Describir los conceptos básicos de la organización de archivos y los problemas de administrar los recursos de datos en un entorno tradicional de archivos. • Describir los principios de un sistema de administración de bases de datos y las características de una base de datos relacional. • Aplicar los principios importantes del diseño de bases de datos.

  3. OBJETIVOS DE APRENDIZAJE (Continúa) • Evaluar las herramientas y tecnologías para proporcionar información de bases de datos para mejorar el desempeño empresarial y la toma de decisiones. • Evaluar el rol de la política de información, la administración de datos y el aseguramiento de la calidad de datos en la administración de los recursos de datos de la organización.

  4. Organización de datos en un entorno tradicional de archivos • Conceptos de organización de archivos • Un sistema de cómputo utiliza jerarquías • Campo: agrupación de caracteres • Registro: grupo de campos relacionados • Archivo: grupo de registros del mismo tipo • Base de datos: grupo de archivos relacionados • Registro: Describe una entidad • Entidad: persona, lugar, cosa o evento sobre el cual se almacena y conserva información • Atributo: cada característica o cualidad que describe a una entidad en particular • Por ej.: ID_Estudiante, curso , grado pertenecen a la entidad CURSO

  5. Organización de datos en un entorno tradicional de archivos

  6. Organización de datos en un entorno tradicional de archivos METODOS DE ORGANIZACION Y ACCESO • METODO DE ACCESO SECUENCIAL INDEXADO (ISAM) : • CADA REGISTRO ESTA IDENTIFICADO POR UNA CLAVE • ESTAN AGRUPADOS EN BLOQUES Y CILINDROS • CLAVES INDEXADAS • METODO DE ACCESO DE ALMACENAMIENTO VIRTUAL (VSAM) : • LA MEMORIA ESTA DIVIDIDA EN AREAS E INTERVALOS • ARCHIVOS CON ESPACIO DINAMICO • VSAM ES MAS UTILIZADO PARA BASE DE DATOS RELACIONALES • METODO DE ACCESO DIRECTO • METODO DE ACCESO DIRECTO • CARA REGISTRO TIENE UN CAMPO CLAVE • EL CAMPO CLAVE ES UTILIZADO EN UN ALGORITMO DE TRANSFORMACION • EL ALGORITMO GENERA LA UBICACION PARA EL ALMACENAMIENTO FISICO DE UN REGISTRO (DIRECCION DE UN REGISTRO)

  7. Organización de datos en un entorno tradicional de archivos • Problemas con el entorno tradicional de archivos (archivos se mantienen de manera separada por departamentos diferentes) • Redundancia e inconsistencia de datos • Redundancia de datos: presencia de datos duplicados en múltiples archivos de datos • Inconsistencia de datos: el mismo atributo podría tener valores diferentes • Dependencia entre los programas y los datos: • Cuando los cambios en los programas requieren cambios a los datos • Carencia de flexibilidad • Seguridad escasa • Carencia de compartición y disponibilidad de los datos

  8. Problemas del uso de Archivos Vendedor Cliente Ventas Prg. Selección Archivo Auxiliar Archivo Ordenado Prg. Ordenador Prg. Impresión

  9. Enfoque de las bases de datos para la administración de datos • Base de datos: • Conjunto de datos organizados para servir eficientemente a muchas aplicaciones al centralizar los datos y controlar su redundancia • Sistemas de administración de bases de datos: • Interfaces entre los programas de aplicación y los archivos de datos físicos • Separa las vistas lógica y física de los datos • Resuelve los problemas del entorno de archivos tradicional • Controla la redundancia • Elimina la inconsistencia • Elimina la dependencia entre los programas y los datos • Permite la posibilidad de centralizar la administración de datos, su uso y seguridad

  10. Enfoque de las bases de datos para la administración de datos

  11. Enfoque de las bases de datos para la administración de datos • DBMS relacional • Representan los datos como tablas bidimensionales llamadas relaciones • Cada tabla contiene datos acerca de una entidad y sus atributos • Tabla: Cuadrícula de columnas y filas • Tuplas (filas) : registros para diferentes entidades • Campos (columnas): representa un atributo para entidades • Campo clave: campo utilizado para identificar únicamente cada registro • Clave principal: campo en la tabla utilizado para los campos clave • Clave externa: clave principal utilizada en una tabla segundaria para buscar campo para identificar los registros de su tabla original

  12. Enfoque de las bases de datos para la administración de datos

  13. Enfoque de las bases de datos para la administración de datos • Operaciones de un DBMS relacional: tres operaciones básicas para generar conjuntos de datos útiles • SELECCIONAR: crea un subconjunto que consta de todos los registros de la tabal que cumplen los criterios establecidos • UNIR: combina tablas relacionales para dar al usuario más información de la que está disponible en las tablas individuales • PROYECTAR: crea un subconjunto que consiste en las columnas de una tabla, creando nuevas tablas que contengan solamente la información que se requiere

  14. Enfoque de las bases de datos para la administración de datos • Operaciones Básicas • Seleccionar • Unir • Proyectar

  15. Enfoque de las bases de datos para la administración de datos Modelo Jerárquico de Datos Es una clase de modelo lógico de bases de datos que tiene su estructura de árbol Un registro se subdivide en segmentos que se interconectan en relaciones padre hijo de uno a muchos. El modelo mas común es el IMS de IBM (Information Management System). Ejemplo Reservas de pasajes aéreos. Segmento Raiz La Guardia Los Angeles Chicago Origen Primer Hijo Miami Minneapolis Detroit Destino Segundo Hijo Dic 15 Dic 16 Dic 17 Fecha Tercer Hijo 250 260 270 # Vuelo • DBMS de red: modela relaciones muchos a muchos Curso 1 Curso 2 Curso 3 Pasajeros Cuarto Hijo Lista de Pasajeros • Ambos menos flexibles que los DBMS relacionales y no soportan consultas con fines específicos, como las consultas de información en lenguaje natural. Nombres Teléfonos Facturación Etc Alumno 1 Alumno 2 Alumno 3 Alumno 4 Alumno 5

  16. Enfoque de las bases de datos para la administración de datos • DBMS orientado a objetos (OODBMS) • Almacena los datos y los procedimientos como objetos • Capaces de manejar gráficos, multimedia y subprogramas de Java • Relativamente lento comparado con los DBMS relacionales para procesar grandes cantidades de transacciones • DBMS relacional-orientado a objetos: proporciona capacidades de DBMS orientado a objetos y relacional

  17. Enfoque de las bases de datos para la administración de datos • Componentes de los sistemas de administración de bases de datos • Definición de datos: especifica la estructura del contenido de la base de datos, utilizada para crear tablas de bases de datos y para definir las características de los campos • Diccionario de datos: archivo automatizado o manual que almacena definiciones de elementos de datos y sus características • Lenguaje de manipulación de datos: se utiliza para agregar, cambiar, eliminar y recuperar la información de la base de datos • Lenguaje de Consultas Estructurado o SQL • Las herramientas para el usuario de Microsoft Access para la generación SQL • También: Muchos DBMS son populares generadores de informes (CrystalReports)

  18. Componentes de un SABD SABD Prg 1 Lenguaje de Definición de Datos Base de Datos Física Lenguaje de Manejo de Datos Prg 2 Prg 3 Diccionario de Datos

  19. Enfoque de las bases de datos para la administración de datos • Diseño de bases de datos • Diseño conceptual (lógico): modelo abstracto de la base de datos desde una perspectiva de negocios • Diseño físico: manera real en que la base de datos está organizada en dispositivos de almacenamiento de acceso directo • El proceso de diseño identifica: • Las relaciones entre los elementos de datos, los elementos de datos redundantes • La manera más eficiente de agruparlos para que cumplan los requerimientos de información de la empresa, necesidades de programas de aplicación • Normalización • Simplificar las agrupaciones complejas de datos para minimizar elementos de datos redundantes y complicadas relaciones muchos a muchos

  20. Enfoque de las bases de datos para la administración de datos

  21. Enfoque de las bases de datos para la administración de datos

  22. Enfoque de las bases de datos para la administración de datos • Diagrama entidad-relación • Utilizad por los diseñadores de bases de datos para documentar sus modelos de datos • Ilustra las relaciones entre entidades • Distribución de bases de datos: almacena en más de un lugar físico • Reduce la vulnerabilidad, incrementa los resultados • Puede partir de definiciones estándar, plantea problemas de seguridad • Particionada: unas partes de datos se almacenan y mantienen físicamente en un lugar y otras partes se almacenan y mantienen en otros lugares • Replicada: la base de datos central duplicada por completo en ubicaciones diferentes

  23. Enfoque de las bases de datos para la administración de datos 1 M 1 M M 1 Cardinalidad: Forma en que los elementos de un objeto se relacionan con Los elementos de otro objeto (Teoría de conjuntos)

  24. Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones (Para la construcción de sistemas DSS y ESS) • Para bases de datos y sistemas muy grandes, se requieren capacidades y herramientas especiales para analizar grandes cantidades de datos y para acceder datos de sistemas múltiples • Almacenes de datos (Data Warehouse) • Minería de datos (Data Mining) • Herramientas para acceder la base de datos interna a través de la Web

  25. Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones • Almacenes de datos (Data werehose) • Almacén de datos: • Almacena datos actuales e históricos que se originan en muchos sistemas de transacciones operativas esenciales • Consolida y estandariza información para que se pueda utilizar a través de la empresa, pero los datos no se pueden modificar • El sistema del almacén de datos aportará informes, análisis y herramientas de informes • Mercados de datos: • Subconjunto de un almacén de datos en el que una parte resumida o altamente enfocada de los datos de la organización se coloca en una base de datos separada por una población específica de usuarios • Por lo general se enfoca en una sola área objetivo o línea de negocios

  26. Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones (Data werehose)

  27. Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones • Inteligencia de negocios: • Herramientas para consolidar, analizar y dar acceso a extensas cantidades de datos para ayudar a los usuarios a tomar mejores decisiones de negocios • Por ej.: Una empresa analiza los datos sobre sus clientes para construir un perfil de consumidor detallado e identificar a los clientes más rentables • Las principales herramientas incluyen: • Software para consultas e informes de base de datos • Procesamiento analítico en línea (OLAP) • Minería de datos

  28. Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones

  29. Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones • Procesamiento analítico en línea (OLAP) • Soporta el análisis de datos multidimensionales • Permite ver los mismos datos utilizando múltiples dimensiones • Cada aspecto de la información (producto, precio, costo, región o periodo) representa una dimensión diferente • Por ej.: ¿cuántos lavarropas vendió Garbarino en Junio / Agosto en las sucursales del noroeste del país? • OLAP permite obtener respuestas en línea en un lapso de tiempo sumamente rápido a preguntas específicas

  30. Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones • Minería de datos: (Datamining) • Más orientada al descubrimiento de información que la OLAP • Encuentra patrones y relaciones ocultas en robustas bases de datos • Infiere reglas para predecir el comportamiento futuro • Los patrones y reglas se utilizan para orientar la toma de decisiones y predecir el efecto de tales decisiones • Uno de los usos populares de la minería de datos es ofrecer análisis detallados de patrones existentes en los datos de clientes para realizar campañas de marketing o para identificar clientes rentables.

  31. Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones • Tipos de información que se pueden obtener de la minería de datos • Asociaciones:ocurrencias enlazadas a un solo evento • Secuencias:eventos enlazados con el paso del tiempo • Clasificación:reconoce patrones que describen el grupo al cual pertenece un elemento • Agrupamiento:funciona de una manera semejante a la clasificación cuando aún no se han definido grupos; encuentra agrupamientos dentro de los datos • Pronósticos:emplea una serie de valores existentes para pronosticar qué otros valores habrá

  32. Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones • Análisis predictivo • Utiliza técnicas de minería de datos, datos históricos y suposiciones sobre condiciones futuras para predecir resultados de eventos • Por ej.: la probabilidad de que un cliente responderá a una oferta o comprará un producto específico. • La minería de datos vista como un reto para la protección de la privacidad individual • Se usa para combinar información de muchas fuentes diversas para crear una “imagen de datos” detallada sobre cada uno de nosotros –nuestros ingresos, nuestros hábitos de conducir, nuestras aficiones, nuestras familias y nuestros intereses políticos

  33. Administración de los recursos de datos • Administración de los recursos de datos: • Establecimiento de una política de información • Política de información: especifica las reglas de la organización para compartir, estandarizar la información • Administración de datos: es responsable de las políticas y procedimientos específicos; gobierno de la información • Administración de la base de datos: diseño y administración de bases de datos responsable de definir, organizar, implementar y mantener la base de datos • Aseguramiento de la calidad de datos

  34. Practica SQL

  35. Esquema de Base de Datos 1 M 1 M 1 Alumnos Examenes Materias M 1 1 Departamentos

  36. Definición de Tablas Claves Primarias

  37. Definición de Tablas Claves Secundarias

  38. Enfoque de las bases de datos para la administración de datos

  39. Sintaxis SQL Sintaxis Consulta en una sola tabla SELECTcolumna1, columna2, ... FROMtabla WHERE {condiciones1} and/or condiciones2} .......... ORDER BY {columnas} ASC/DEC Sintaxis Consulta en múltiples tablas SELECTtabla.columna, tabla.columna, ... FROMtabla1, tabla2 WHERE{tabla1.columna = tabla2.columna} AND {condiciones1} and/or condiciones2} .......... ORDER BY {columnas} ASC/DEC

  40. Ejemplo consulta en SQL Tabla ALUMNOS NLEGAJO APELLIDO CODMATERIA --- ------------ -------- 1 Velasquez 50 2 Perez 41 3 Dominguez 31 4 Gonzalez 10 ... Tabla MATERIAS CODMATERIA NOMBREMATER CODDEPTO --- -------------- --------- 10 Sistemas I 1 31 Contabilidad II 2 ... 35 Matematicas 3 50 Psicología 4 Tabla DEPARTAMENTOS CODDEPTO NOMBREDEPTO --- -------------- 1 Informatica 2 Contable 3 Exactas 4 Sociales 5 Ciencias Empresarias 6 Ciencias Industriales ...... Ejemplo Mostrar el Legajo, Apellido del Alumno, Nombre de la materia que cursa y Nombre del departamento que pertenece la materia de los alumnos cuyo promedio es superior a 7 puntos. SELECT ALUMNOS.apellido, MATERIAS.nombremater,DEPATAMENTOS.nombredepto FROM ALUMNOS,DEPARTAMENTOS, MATERIAS WHERE ALUMNOS.codmateria = MATERIAS.codmateria AND MATERIAS.coddepto = DEPARTAMENTOS.coddepto AND ALUMNOS.promedio > 7;

More Related