1 / 51

Bancos de Dados Pós-Relacionais

Bancos de Dados Pós-Relacionais. Bernadette Farias Lóscio DI-UFPE. Plano de Aula. Integração de BDs com outras áreas Visão dos sistemas Visão das aplicações Requisitos das novas aplicações Limitações dos BDs Relacionais Sistemas de BDs Pós-Relacionais Banco de Dados x KDD.

phil
Download Presentation

Bancos de Dados Pós-Relacionais

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Bancos de Dados Pós-Relacionais Bernadette Farias Lóscio DI-UFPE

  2. Plano de Aula • Integração de BDs com outras áreas • Visão dos sistemas • Visão das aplicações • Requisitos das novas aplicações • Limitações dos BDs Relacionais • Sistemas de BDs Pós-Relacionais • Banco de Dados x KDD

  3. BD Distribuídos Sistemas Distribuídos & Internet Sist. de Suporte a Decisão BD Multimídia BD Dimensional DW Inteligência Artificial Outras áreas Linguagens de Programação BDD Espacial Temporal BD Ativo BDOO Espaço Temporal BDOO Ativo BDD Ativo BD OO Espacial BD de Restrições BDDOO Integração de BD com outras áreas (Sistemas de BDs) Sistemas de Bancos de Dados

  4. BD Multimídia BD Distribuídos OLAP DW Digital Publishing Comércio Eletrônico Sist. de Suporte a Decisão BD Temporal Sistemas Distribuídos & Internet Aplicações de Bancos de Dados Outras áreas Inteligência Artificial Restrições integridade Linguagens de Programação CAD/CAM/SIGs Data Mining Diagnóstico BDOO Monitoramento BDD BD Espacial DW BD Ativo Integração de BD com outras áreas (Aplicações)

  5. Requisitos das Novas Aplicações de BD • Visualização dos dados: • Multidimensional • Multigranular • Integração entre dados e programas: • Integrar funcionalidades comuns de muitas aplicações de BDs no SGBD • Integração com sistemas de raciocínio e representação de conhecimento • Integração com linguagens de programação

  6. Requisitos das Novas Aplicações de BD • Recuperação de Informações através da Internet/Intranet: • Distribuição dos dados • replicação e reconciliação • interoperabilidade • semântica do esquema • linguagem de consulta • autonomia • confiabilidade/origem • segurança • Integração de Informações Heterogêneas

  7. Resumindo... • Abstrações para facilitar a interação DADOS + CONSULTAS + USUÁRIO Requisitos das Novas Aplicações de BD • Manipulação de objetos complexos: • Multimídia e Objetos n-dimensionais • Novos tipos de Dados • Consultas multiresolução • Suporte para Interface com o usuário • Objetos reais com estrutura e comportamento

  8. Limitações dos BDs Relacionais • Não possuem mecanismos para a definição e manipulação de tipos de dados complexos • Não suportam itens de dados de grandes tamanhos • Permitem apenas consultas com noções precisas • Não permitem consultas ad-hoc • Baixa performance e dificuldades de implementação para aplicações mais complexas

  9. declaratividade robustez simplicidade (usa poucos conceitos poderosos) fundamentos formais tecnologia madura e eficiente para: oferecer persistência garantir segurança gerenciar memória secundária controlar transações “Pontos Fortes” dos BDs Relacionais • Extensões ou novos modelos devem oferecer:

  10. BD x DSS: BD Multidimensional Data Warehouse/Data Mart BD Temporal BD x Aplicações: BD Ativo BD Orientado a Objetos BD Objeto-Relacional BD x IA: BD Dedutivo BD Dedutivo OO BD de Restrições BD x Sist. Distribuídos/Internet: BD Distribuídos BD Federados Arquitetura de Mediadores BD x Agentes BD Multimídia BD x SIG BD Espacial Sistemas de BDs Pós-Relacionais

  11. 5 1 8 6 NORDESTE PERNAMBUCO CEARÁ FORTALEZA ... SOBRAL SUDESTE RIO DE JANEIRO SÃO PAULO BD x DSS BD Multidimensional • Armazena os dados em arrays multidimensionais com um número fixo de dimensões • Permite uma visualização multidimensional e multigranular dos dados • Dimensões: diferentes perspectivas de visualização dos dados (podem ser compostas por múltiplos níveis) • Elementos (ou membros): posições segundo uma dimensão • Medidas: conteúdo de uma célula Fev./99 Tempo Jan./99 P1 P2 P3 P4 Produto

  12. Produto Loja Tempo Unidades Monitor MW Jan/99 5 Fev/99 Monitor MW 1 Mar/99 Monitor MW 8 Abr/99 Monitor MW 6 Fev/99 Impressora PCC 5 Mar/99 Scanner MW 3 Obter respostas a questões típicas de análise dos negócios de uma empresa geralmente requer a visualização dos dados segundo diferentes perspectivas BD x DSS BD Multidimensional - Exemplo Tabela relacional Loja PCC 5 MW Impressora 5 1 8 6 Monitor 3 Scanner Produto Jan/99 Fev/99 Mar/99 Abr/99 Tempo

  13. Características: Orientado por temas Integrado Variante no tempo Não volátil Questões críticas: Integração de dados e metadados de várias fontes Qualidade dos dados: limpeza e refinamento Resumir e agregar os dados Sincronização das fontes com o DW Problemas de desempenho (unir em um mesmo ambiente os BDs corporativos operacionais e o DW) BD x DSS Data Warehouse • Contém dados extraídos (selecionados, depurados e integrados) do ambiente de produção da empresa, sendo otimizado para processamento de consultas ad-hoc e não para transações

  14. BD x DSS Data Mart • É uma implementação de um DW no qual o escopo dos dados é limitado, contém dados agregados apenas a nível departamental • Uma maneira de construir um DW é através da criação e integração progressiva de data marts • Problemas: • escalabilidade em situações onde pequenos data marts iniciais crescem em múltiplas dimensões • integração de dados (diferentes estruturas)

  15. BD x DSS OLAP (On-Line Analytical Processing) • Processamento e ferramentas voltados para análise de dados típica do suporte à decisão • Os dados são apresentados através de uma visão multidimensional e multigranular • A visão dos dados é independente de como eles estão armazenados (MOLAP x ROLAP) • Eficiente para consultas ad-hoc complexas • Exemplos de consultas: • Quais os produtos que vendem bem? • Qual o "ranking" dos vendedores da Região Nordeste?

  16. OLTP Modelo de dados Relacional Dados Atômicos Apenas informações atuais Orientados ao Processo Poucos tipos de consultas simples Atualizações e leituras rápidas OLAP Modelo de dados Multidimensional Dados Agregados Também informações históricas Orientados ao Negócio Grande variedade de consultas complexas Apenas leitura BD x DSS OLAP x OLTP

  17. BD x DSS BD Temporais • Bancos de dados temporais apresentam rótulos temporais associados aos dados. • (i) bancos de dados de tempo de transação: associam aos dados o o instante em que foram inseridos no banco de dados; • (ii) bancos de dados de tempo de validade: associam aos dados o seu tempo de validade na realidade modelada; • (iii) bancos de dados bitemporais: associam o tempo de transação e o tempo de validade • Aspectos temporais podem ser: pontuais, intervalos de tempo ou relacionamentos abstratos (antes, depois, durante,...)

  18. BD x Aplicações BD Ativo • SGBD capaz de responder automaticamente a eventos ocorrendo: • internamente (ex: atualizações no BD, restrições de integridade) • externamente (ex: dispositivos de monitoramento, falhas de hardware) • Capaz de monitorar e reagir a circunstâncias específicas de relevância para a aplicação (o comportamento reativo da aplicação é colocado dentro do SGBD) • Abordagem comum: regras Evento-Condição-Ação especificando comportamento reativo Evento:descreve um acontecimento Condição:examina o contexto onde o evento ocorreu Ação:descreve as tarefas que devem ser executadas

  19. Especificação de eventos e condições a serem monitoradas Consultas e atualizações Ações Eventos externos BD x Aplicações BD Ativo (cont.) Vantagens: • Não acarreta mudanças nas aplicações • Incrementa a funcionalidade dos SGBDs • Atende aos requisitos de restrições temporais das aplicações SGBD Ativo

  20. BD x Aplicações BD Ativo - Exemplo Empregado(#emp, nome, salario, #gerente) Gerente(#gerente, #depto) Regra1: on update to salario of empregado if new.salario > update.gerente.salario do abort Regra2: on update to salario of empregado or insert to empregado if new.salario > update.gerente.salario do instead <informe o administrador do sistema> Regras podem ser disparadas e executadas da seguinte forma: • immediate • deferred • detached

  21. BD x Aplicações Regras Ativas - Aplicações • Manutenção: • Restrições de Integridade • Visões materializadas • Descrever o comportamento/semântica das aplicações • monitorar vendas em um BD para controle de estoque • Em conjunto com dispositivos de monitoramento, podem ser usadas para registrar e responder a situações externas ao BD • aplicações médicas • sistemas de monitoramento de tráfego aéreo

  22. Funcionalidades dos BDs: • dados persistentes • gerenciamento de grandes conjuntos de dados • gerenciamento de memória secundária • gerenciamento de transações • linguagem de consulta declarativa BD x Aplicações BD Orientado a Objetos (BDOO) • Combina o paradigma OO com a tecnologia de BD • Um SGBDOO é um SGBD com um modelo de dados OO • Os requisitos para suportar um modelo de dados OO são: • identidade de objetos • objetos complexos • classes • encapsulamento • herança • overriding, overloading e ligação dinâmica • extensibilidade

  23. BD x Aplicações BD Orientado a Objetos (cont.) • OO em BD combina conceitos de várias áreas: • Linguagens de Programação: tipos de dados abstratos e encapsulamento • Tecnologia de Software: extensibilidade e reusabilidade de código e o princípio da modularização • Modelagem de dados: relações aninhadas ou generalizações do modelo relacional, juntamente com os modelos de dados semânticos

  24. nome_sub rua localização Exemplo - Modelo ER cor fabricante modelo nome idade 1 n 1 possui_frota domicílio Veículo Pessoa #pessoa n 1 produz é-um rua 1 1 salário 1 localização 1 administra Companhia Empregado #companhia qualificação 1 1 n nome_comp possui trabalha gerencia 1 n Subsidiária 1

  25. classe3: Endereço: [ rua: String, localização: String] classe4: Pessoa: [ nome: String, idade: Integer; domicilio: Endereço, Frota: {Veiculos}] classe5: Empregado is-a Pessoa: [ qualificações: {String}, salário: Integer; Familiares: {Pessoa}] classe1: Companhia: [ nome: String, matriz: Endereço; Subsidiarias: {Subsidiaria}, Presidente: Empregado] classe2: Subsidiaria: [ nome: String, escritório: Endereço; Gerente: Empregado, Empregados: {Empregado}] BD x Aplicações BD Orientado a Objetos - Exemplo

  26. BD x Aplicações BD Objeto Relacional (BDOR) • Combina os benefícios do modelo Relacional com a tecnologia de Orientação a Objetos • O modelo de dados OR é uma extensão do modelo Relacional: • permite estender o banco de dados com tipos e funções específicas da aplicação • A linguagem de consulta OR (SQL3) é uma extensão da linguagem SQL para suportar o modelo de objetos • As extensões incluem consultas envolvendo objetos, atributos multivalorados, TADs, métodos e funções como predicados de busca em uma consulta

  27. BD x Aplicações BD Objeto Relacional - Exemplo Criação de Tipos: • CREATE TYPE Subsidiaria • ( • NomeSub String, • Escritório endereço, • Empregados SET(REF(Empregado)), • ); CREATE TYPE Endereço ( RuaNo VARCHAR(60), Cidade VARCHAR(40), ); CREATE TYPE empregado ( nome CHAR(20), salário DECIMAL(10,2), ); • CREATE TYPE Companhia • ( • NomeComp String, • Matriz endereço, • Subsidiarias SET(REF(Subsidiaria)), • Presidente REF(Empregado), • ); Criação de Tabelas: CREATE TYPE Fornecedor ( CodFornec CHAR(4) NomeFornec VARCHAR(40) EndFornec endereço, ); CREATE TABLE Fornecedor OF Fornecedor CREATE TABLE empregados OF Empregado

  28. BD x IA Funcionalidades dos BDs: • dados persistentes • gerenciamento de grandes conjuntos de dados • gerenciamento de memória secundária • gerenciamento de transações • linguagem de consulta declarativa BD Dedutivo (BDD) • Utiliza regras para deduzir ou inferir informações adicionais a partir dos fatos armazenados no BD • Um BDD possui dois tipos principais de especificações: • Fatos (são similares as tabelas dos BDs Relacionais) • Regras (são similares as visões em BDs Relacionais) • Os requisitos para suportar dedução são: • linguagem declarativa • predicados • variáveis lógica • unificação de termos com variáveis • mecanismo de dedução

  29. BD x IA BD Dedutivo (cont.) • A linguagem Datalog é um subconjunto de Prolog utilizada em sistemas de BDD para definir regras e fatos • A notação usada em Datalog é baseada em predicados com um número fixo de argumentos usados para definir fatos e regras • se todos os argumentos de um predicado são constantes, então o predicado estabelece que um certo fato é verdade • se um predicado tem variáveis como argumentos, então ele é considerado uma consulta, ou parte de uma regra ou restrição

  30. BD x IA Uma consulta pode retornar: 1. As diferentes combinações de constantes que, quando unificadas às variáveis, podem tornar o predicado verdadeiro 2. Verdadeiro ou falso BD Dedutivo - Exemplo Consultas superior(paula, Y)? superior(paula, maria) superior(joão, maria) Fatos supervisiona(helena, maria) supervisiona(joão, luís) supervisiona(joão, josé) supervisiona(paula, helena) supervisiona(paula, pedro) ... Regras superior(X,Y) :- supervisiona(X,Y) superior(X,Y) :- supervisiona(X,Z), supervisiona(Z,Y) subordinado(X,Y) :- supervisor(Y,X)

  31. BD x IA BD Dedutivo Orientado a Objetos (BDDOO) • BDD: • alta capacidade de inferência • fundamentos formais • pobre poder de modelagem • BDOO: • rica capacidade de modelagem • alta extensibilidade • falta de consenso sobre o modelo de dados • baixa capacidade de inferência • fundamentos não tão bem formalizados quando os de BDD • BDDOO: • deve combinar as vantagens dos dois métodos acima

  32. BD x IA BDDOO BD Dedutivo Orientado a Objetos • Requisitos OO: • identidade de objetos • objetos complexos • classes • encapsulamento • herança • overriding, overloading • e ligação dinâmica • extensibilidade • Requisitos Raciocínio: • linguagem declarativa • predicados • variáveis lógica • unificação de termos • com variáveis • mecanismo de dedução • Requisitos BD: • dados persistentes • gerenciamento de grandes conjuntos de dados • gerenciamento de memória secundária • gerenciamento de transações • linguagem de consulta declarativa

  33. A hierarquia é-um: empl::person student::person child(person)::person faculty::empl manager::empl yuppie::young yuppie::midaged article::report cacm::article jacm::article john:student john:empl sally:student sally:empl alice:child(john) mary:faculty bob:faculty bob:manager phil:empl 20:young 30:yuppie 40:midaged BD x IA BDDOO - Exemplo • codd70:cacm • flogic94:jacm • cs1:dept • cs2:dept • integer:datatype • string:datatype • “CS”:string • “Mary”:string • “Bob”:string • ms:degree • phd:degree

  34. BD x IA BDDOO - Exemplo (cont.) • Assinatura de Classes: • faculty [boss=>(faculty, manager); age=>midaged; highestDegree=>degree; papers->>article; highestDegree*->phd; avgSalary->50000] • person [name=>string; friends=>>person; children=>>child(person); • empl [affiliation=>dept; boss=>empl; jointWorks@empl=>>report] • dept [assistants=>>(student, empl); mngr=>empl]

  35. BD x IA BDDOO - Exemplo (cont.) • Fatos da base (BD extensional) • bob [name-> “Bob”; age->40; affiliation->cs1[dname-> “CS”; mngr ->bob; assistants->> {john, sally}]] • mary [name-> “Mary”; highestDegree->ms; friends->>{bob, sally} affiliation->cs2[dname->”CS”]] • Regras dedutivas: • E[boss->M] :- E:empl ^ D:dept ^ E[affiliation->D[mngr->M:empl]] • X [jointWorks@Y->>Z] :- Y:faculty ^ X:faculty ^ Y [papers->>Z] ^ X [papers->>Z]

  36. BD x IA BDDOO - Exemplo (cont.) • Consultas: • Quem são os empregados de meia idade do departamento CS e quem são os seus gerentes? • ?- X:empl ^ X [boss-> Y; age->Z:midaged; affiliation->D[dname->”CS”]]. • Quem publicou juntamente com Mary no Jornal da ACM? • ?- mary[jointWorks@Y->>jacm90]. • Onde Mary tem publicações em conjunto com Phil? • ?- mary[jointWorks@phil->>Z].

  37. BD x IA Entrada: BD de Restrições Saída: BD de Restrições Consulta de Restrições Consulta Relacional Entrada: BD Relacional Saída: BD Relacional Banco de Dados de Restrições • Generalizam BD Relacionais através de representações finitas de relações infinitas • Modelo de Dados de Restrições:

  38. BD x IA (c1,d1) (a1,d1) (c2,d2) (a2,d2) (a1,b1) (c1,b1) (a2,b2) (c2,b2) Banco de Dados de Restrições - Exemplo Problema: Um BD consiste em um conjunto de retângulos em um plano, e queremos computar os pares de retângulos distintos onde existe uma interseção • Representação Relacional: • Tuplas: (n,a,b,c,d) • Consulta: {(n1,n2)|n1 n2  (a1,a2,b1,b2,c1,c2,d1,d2)(R(n1,a1,b1,c1,d1)  R(n2,a2,b2,c2,d2)  ( x,y{a1,a2,b1,b2,c1,c2,d1,d2}) (a1  x  c1  b1  y  d1  a2  x  c2  b2  y  d2))}

  39. BD x IA (c1,d1) (a1,d1) (c2,d2) (a2,d2) (a1,b1) (c1,b1) (a2,b2) (c2,b2) Banco de Dados de Restrições - Exemplo Problema: Um BD consiste em um conjunto de retângulos em um plano, e queremos computar os pares de retângulos distintos onde existe uma interseção • Representação com Restrições: • R (z,x,y) • Tupla generalizada: (z=n  (a  x  c)(b  y  d)) • Consulta: {(n1,n2)|n1 n2  ( x,y)(R(n1,x,y)  R(n2,x,y)}

  40. Rede de Comunicação SGBD Distribuído BD x Internet/Sist.Distribuídos BD Distribuídos Fortaleza São Paulo Banco de Dados 1 Banco de Dados 2 Brasília Salvador Banco de Dados 4 Banco de Dados 3

  41. BD x Internet/Sist.Distribuídos BD Distribuídos • Classificação quanto ao grau: • de Heterogeneidade • de Autonomia Local • de Transparência de Distribuição/Integração • Enfoques para Integração de Informações: • Materializado :as informações relevantes são extraídas, filtradas e integradas previamente, de formas a agilizar as consultas • Virtual: as informações são extraídas das fontes de informação somente quando requisitadas • BD Federados • Mediadores

  42. Esquema Global BD x Internet/Sist.Distribuídos Enfoque Fortemente Acoplado BD Federados - Arquitetura Esquema Externo 1 Esquema Externo 2 Esquema Externo n … Esquema Exportado 1 Esquema Exportado 2 Esquema Exportado n … Esquema Componente 1 Esquema Componente n … Esquema Local 1 Esquema Local n … DBS Componente 1 DBS Componente n …

  43. Consultas através de mediadores: 1.As consultas são submetidas ao sistema, via mediador, e este as transforma em subconsultas a serem enviadas às bases de dados. 2. As subconsultas geradas pelo mediador devem ser traduzidas para linguagens de consultas de cada SGBD componente. 3. Os resultados das consultas são traduzidos e a resposta é devolvida ao usuário BD x Internet/Sist.Distribuídos Enfoque Fracamente Acoplado Mediadores - Arquitetura Mediador 1 Mediador 2 Tradutor 1 Tradutor 2 Tradutor 3 BD1 BD2 BD3

  44. BD x Internet/Sist.Distribuídos BD x Agentes • Dedução embutida • Atualização de DW/Data Mart • Personalização de interfaces • Variedades de aplicações integrando BD com Internet • Os agentes podem ter diferentes funções: • notificação • mediação • aquisição de conhecimento

  45. BD x Internet/Sist.Distribuídos BD Multimídia • Armazenam informações que se originam de diferentes tipos de mídia: textos, imagens, áudio e vídeo • Os requisitos para suportar dados multimídia são: • Novos tipos de Dados • Qualidade do Serviço • Consultas multiresolução • Suporte para Interface com o usuário

  46. BD x Internet/Sist.Distribuídos BD Multimídia - Aplicações • Gerenciamento de documentos • os dados podem incluir projetos de engenharia, registros médicos, etc • Disseminação do conhecimento • bibliotecas digitais, livros eletrônicos e repositórios de informação • Monitoramento e controle em tempo real • juntamente com BD Ativo pode ser muito útil para o controle de operações nucleares, pacientes em UTIs, sistemas de transporte, etc

  47. BD x SIG BDs Espaciais • Oferecem tipos de dados espaciais em seu modelo de dados e linguagem de consulta • Estes sistemas devem: • combinar informações geométricas e temáticas • ser o mais geral possível • ter uma semântica formalmente definida • ser independente de SGBD, mas cooperativo com qualquer SGBD • usar técnicas de implementação eficientes para operações em objetos n-dimensionais • ter uma interface visual para os usuários • Aplicações: • Sistemas de Informação Geográficas • CAD/CAM • Robótica

  48. Banco de Dados x KDD • Vantagens da aprendizagem a partir de BDs: • Os dados são armazenados de maneira mais ou menos estruturada • Algum conhecimento do domínio é implicitamente armazenado no BD • Ferramentas de consultas, manipulação de dados e transações estão disponíveis • O número de BD com dados aplicáveis as técnicas de mineração é grande e continua crescendo!

  49. Banco de Dados x KDD • Restrições da aprendizagem a partir de BDs: • O volume de dados é tipicamente muito grande • Os dados podem conter ruídos e informações incompletas • Os dados não foram coletados com o propósito de descoberta de conhecimento • Conhecimento pode ser descoberto a partir de diferentes fontes de dados • Dados relacionais • Dados OO • Dados textuais • Dados temporais • Dados espaciais • Dados na Web • Dados de DW

  50. Bibliografia • Database research: achievements and opportunities for the 21st century • The emergence of post-relational databases byRichard Currier, Chairman - Strategic Marketing - April 1997 • The Asilomar Report on Database Research • Fundamentals of Database Systems • Database Issues in Knowledge Discovery and Data Mining

More Related