1 / 34

Bases de datos distribuidas

Bases de datos distribuidas. Carlos Rojas Kramer Universidad Cristóbal Colón. Orígenes. Evolución acelerada de los sistemas de información Crecimiento no planeado de la información al interior de las organizaciones Dispersión en sitios geográficamente distantes

dulcea
Download Presentation

Bases de datos distribuidas

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

  2. Orígenes • Evolución acelerada de los sistemas de información • Crecimiento no planeado de la información al interior de las organizaciones • Dispersión en sitios geográficamente distantes • Sistemas tecnológicamente diferentes

  3. Orígenes • Necesidad de compartir e integrar la información dispersa • Se requiere un tipo de tecnología diferente al tradicional • La Base de Datos Distribuida es una buena solución a lo anterior.

  4. Definición • Una Base de Datos Distribuida (BDD) es una colección de datos relacionados lógicamente, pero dispersos entre diversos sitios de una red de computadoras. [Ceri y Pelagatti] • Cada sitio en la red tiene capacidad de procesamiento autónomo y puede ejecutar aplicaciones locales.

  5. BDD (ilustración esquemática)

  6. Razones para la dispersión • Naturaleza de la información • Motivos económicos • Consideraciones de desempeño • Necesidades de fiabilidad • Requerimientos de disponibilidad • Etc.

  7. Consecuencias de la dispersión • Incremento en la complejidad de diseño • Mayores dificultades para la instrumentación de las soluciones • Administración y resolución de problemas implican aplicación de mejores recursos • Necesidad de apego a estándares

  8. Software para BDD • DDBMS = Distributed DataBase Management System • Debe permitir la creación, el uso y el mantenimiento de la BDD • Debe realizar funciones típicas de un DBMS no distribuido • También debe soportar otras funciones

  9. Funciones extra para un DDBMS • Capacidad de accesar sitios remotos y transmitir consultas y datos entre diversos sitios a través de una red de computadoras • Capacidad de rastrear la pista de distribución y de replicación de los datos en el catálogo del DDBMS

  10. Capacidad de elaborar estrategias de ejecución para consultas y transacciones que accesan datos en más de un sitio • Capacidad de mantener la consistencia en las copias de un elemento de información

  11. Capacidad de recuperarse ante caídas de sitios individuales y fallos de un enlace de comunicación • Capacidad de decidir cual de las copias de un elemento de información será accesada

  12. Componentes de un DDBMS • Componente de manejo de Base de Datos (DB) • El componente de Comunicación de Datos (DC) • El Diccionario de Datos (DD), el cual es extendido para representar información sobre la distribución de los datos sobre la red • El componente de base de datos distribuida (BDD)

  13. Tipos de DDBMs • Clasificados según su grado de: • homogeneidad / heterogeneidad • autonomía • transparencia de la distribución

  14. Grado de homogeneidad • Un DDBMS homogéneo se caracteriza principalmente por la utilización del modelo descendente para la conceptualización del diseño de la BD, en donde la fragmentación vertical u horizontal de un esquema global de datos determina la naturaleza de cada uno de los componentes de la BDD

  15. Un DDBMS heterogéneo se caracteriza por la diversidad de DBMSs, modelos de diseño, sistemas operativos, conceptualización del diseño y hardware utilizado en cada uno de sus componentes de BD

  16. La heterogeneidad debida a diversos DBMSs es común en organizaciones que crecen sin una planeación en cuanto a sus sistemas de información. • Dichos sistemas evolucionan paulatinamente en diferentes DBMSs o diferentes modelos de conceptualización, tales como: jerárquico, de red, relacional u orientado a objetos

  17. Tipos de heterogeneidad según Larson y Sheth

  18. Heterogeneidad semántica • Ocurre cuando existe una diferencia en el significado, interpretación o uso del mismo modelo de datos

  19. Sistemas de Multibase de Datos • MDBMS = multi database management system • También llamado Sistema de Base de Datos Federado • Es un tipo de DDBMS • Se compone de una colección de DBMS con alto grado de autonomía

  20. MDBMS (cont.) • Cada servidor es un DBMS centralizado independiente y autónomo que tiene sus propios usuarios locales, transacciones locales y administrador de base de datos (DBA) • Por lo mismo, cada uno posee un alto grado de autonomía local

  21. En un MDBMS cada servidor puede autorizar el acceso a porciones específicas de la BD definiendo un esquema de exportación, el cual especifica la parte de la BD a la cual puede tener acceso una cierta parte de usuarios no locales • Los MDBMS son catalogados como un sistema híbrido entre los sistemas distribuidos y los centralizados

  22. Grado de autonomía • Es el grado de independencia de operación de cada uno de los DBMS componentes del DDBMS

  23. Autonomía de diseño • La capacidad de que cada Base de Datos Componente (BDC) decida los aspectos concernientes con su diseño. Es decir, las personas involucradas son libres de decidir cualquier particularidad e incluso decidir que DBMS usar.

  24. Aspectos a considerar en la autonomía de diseño • El universo de datos relevante para el sistema • La representación (modelo de datos, lenguaje de consultas) y el nombrado de los datos • La conceptualización o interpretación semántica de los datos (heterogeneidad semántica) • Restricciones usadas para administrar los datos • La funcionalidad del sistema • La asociación y compartición con otros sistemas y • La implementación (p.e. registros y estructuras de archivos).

  25. Autonomía de comunicación • La habilidad de que una BDC decida comunicarse o no con otro componente de una misma federación

  26. Autonomía de ejecución • Es la habilidad de una BDC para ejecutar operaciones locales sin la interferencia de operaciones externas, en el orden que la BDC lo decida

  27. Autonomía de asociación • Cada BDC decide cuánto y cuándo puede compartir su funcionalidad y recursos con otros componentes, inclusive la capacidad de asociarse o retirarse de una o más federaciones

  28. Grado de Transparencia de Distribución • Si el usuario percibe un solo esquema integrado sin información alguna relativa a la fragmentación, replicación o distribución, se dice que el DDBMS tiene un alto grado de transparencia de distribución. • Si el usuario puede ver toda la fragmentación, el reparto y la aplicación, el DDBMS no tiene transparencia de distribución

  29. Distribución de los datos

  30. Fragmentación • La fragmentación de una base de datos consiste en descomponer en partes los datos, siguiendo algún patrón conveniente y relacionado con la forma como estos serán alimentados y explotados.

  31. Tipos de fragmentación • Tipos primitivos de fragmentación: • Horizontal • Vertical • Tipos derivados: • Horizontal derivada • Mixta

  32. Objetivos ideales • Separar el concepto de fragmentación de los datos del concepto de localización (o ubicación) de los mismos. • Control explícito de la redundancia • Independencia de DBMSs locales

  33. Tipos de transparencia • Transparencia de fragmentación • Transparencia de localización • Transparencia de replicación • Transparencia de correspondencia

  34. Niveles de transparencia 1. Transparencia de fragmentación 2. Transparencia de localización 3. Transparencia de correspondencia local 4. Sin transparencia

More Related