570 likes | 690 Views
2. Bases de dados relacionais (3ª aula) ○ Modelo Entidade-Associação (revisões) ○ Conceitos básicos de bases de dados relacionais (revisões) ○ A 3ª forma normal (revisões) ○ Structured Query Language – SQL (revisões) Geodatabases no ArcGIS 9.x ○ Criação de uma geodatabase
E N D
2 Bases de dados relacionais (3ª aula) ○ Modelo Entidade-Associação (revisões) ○ Conceitos básicos de bases de dados relacionais (revisões) ○ A 3ª forma normal (revisões) ○ Structured Query Language – SQL (revisões) Geodatabases no ArcGIS 9.x ○ Criação de uma geodatabase ○ Criação de uma feature class armazenada numa geodatabase ○ Importação de uma shapefile para uma geodatabase Graça Abrantes
Desenvolvimento de uma base de dados Realidade Modelo conceptual (e.g. Modelo Entidade-Associação) Modelo lógico (e.g. Modelo Relacional)
Modelos conceptuais de tipo E-A • Os modelos de tipo E-A são compostos por entidades e associações. • As entidades representam objectos reais (concre-tos ou abstractos) e fenómenos que possuem uma descrição que é determinada pelos problemas que se pretendem resolver por meio da Base de Dados. • exemplos: pessoas, parcelas, fontes de poluição, ... • As associações representam relacionamentos relevantes entre entidades. • exemplos: uma pessoa é proprietária de parcela(s), parcela é utilizada para cultura(s), ...
Tipo de entidades e atributos • As entidades que possuem uma descrição comum são representadas por um tipo de entidade, o qual é caracterizado por um conjunto de atributos. • exemplos: pessoa é descrita por nome, nº de contribuinte, data de nascimento, ...; parcela é descrita por coordenadas geográficas, tipo de uso, ... • Os valores que tomam cada um dos atributos de um tipo de entidade permitem descrever e distinguir entre si as entidades que pertencem a um mesmo tipo de entidade. • exemplos: o atributo data de nascimento pode tomar o valor 2008/03/03 ou ...; o atributo tipo de uso (de parcelas) pode tomar o valor agrícola ou florestal ou industrial ou urbano ou ...
Exemplo Num sistema de informação geográfica, um tipo de entidade pode ser constituído por parques de campismo. Cada parque de campismo pode ter um conjunto de atributos (e.g. designação, capacidade, proprietário, ...). Um segundo tipo de entidade poderia ser constituído por unidades territoriais (e.g. concelhos), tendo atributos (e.g. código, designação). Parques de campismo e concelhos podem estar relacionados.
Situado Concelho Actua Empresa Diagrama do modelo conceptual: exemplo PqCampismo
Atributos de um tipo de Associação Um tipo de associação pode possuir atributos que permitam descrever as características próprias de cada associação. • por exemplo, cada empresa tem um certo número de trabalhadores em cada concelho.
designação capacidade proprietário PqCampismo Situado NIF nome código designação número trab. Concelho Actua Empresa Diagrama do modelo conceptual
Grau de um tipo de associação • Um tipo de associação caracteriza-se pelo número de tipos de entidade que envolve, podendo ser unária, binária (o caso mais frequente), ternária, ... • no exemplo anterior, as associações Situado e Actua são binárias
Multiplicidade (ou cardinalidade) de um tipo de associação Um tipo de associação binária pode ser: • de um para um (1:1) quando cada entidade só pode ocorrer numa única associação desse tipo; • de um para muitos (1:n) quando cada entidade de um tipo só pode ocorrer numa associação, mas as entidades do outro tipo podem ocorrer em mais do que uma associação desse tipo; • de muitos para muitos (n:n) quando não existe nenhuma restrição ao número de ocorrências de cada entidade em associações desse tipo.
Multiplicidade (continuação) A multiplicidade de um tipo de associação binária é indicada por 4 números: número mínimo e máximo de entidades que ocorrem numa associação, em cada sentido. A multiplicidade é frequentemente 0,1 ou 1,1 ou 0,n ou 1,n, mas pode ser diferente (2,2 ou 2,n, por exemplo).
designação capacidade proprietário PqCampismo Situado NIF nome código designação número trab. Concelho Actua Empresa Exemplo 0:n 1:n 1:1 1:n 1:n n:n
Criação de um modelo conceptual de dados 1. Identificar tipos de entidade e seus atributos 2. Identificar tipos de associação e seus atributos 3. Definir multiplicidades dos tipos de associação
Modelo lógico: SGBD relacional • Baseiam-se num conjunto de conceitos teóricos apresentados em 1970 por E. F. Codd. • Vantagens dos SGBD relacionais: • simplicidade dos conceitos que utilizam • existência de definições formais para os conceitos • permitiram uma rápida divulgação • permitiram a adesão de diversos fabricantes de software; • adequação à representação de muitos dos aspectos que constituem a realidade
Relação • Nas bases de dados relacionais a estrutura fundamental é a relação. • Uma relação é definida por um esquema e por uma tabela. • Um esquema é composto: • pelo nome da relação • pelos nomes dos atributos
1. Esquema Exemplos: PqCampismo(designação, capacidade, prop) Concelho(código,designação)
Atributos • Um atributo Ai toma valores num conjunto Di chamado domínio do atributo. • O domínio determina o tipo de valores que o atributo pode tomar. • Dado U={A1, A2,...,An}, uma relação R sobre U é um subconjunto de D1 x D2 x ... x Dn. • A cada tuplo deste produto cartesiano dá-se o nome de instância da relação R.
2. Tabela • O conjunto das instâncias da relação R constituí uma tabela em que - as linhas são as instâncias (ou registos) -as colunas são os atributos (ou campos)
Observações • os valores de cada atributo pertencem a um mesmo domínio; • o valor de um atributo é sempre atómico; • isto é, numa tabela, no cruzamento de uma linha com uma coluna só pode existir um valor de atributo; • numa relação não podem existir instâncias iguais; • a ordem porque se encontram as instâncias de uma relação e os seus atributos é irrelevante; • podem existir instâncias sem valores em alguns dos seus atributos; neste caso o atributo diz-se opcional e o seu valor é null; • os nomes (ou identificadores) dos atributos que constituem o esquema de uma relação são únicos nessa relação.
Chave(s) de uma relação • Um conjunto de atributos que tomam valores diferentes para cada instância da relação é uma chave da relação. • cada instância pode ser identificada pelo valor da chave: o valor da chave nunca se repete. • Uma chave pode ser composta por um ou mais atributos. • Atributo primário: pertence à chave • Atributo não primário: não pertence à chave
Chave primária e chave estrangeira • Nos SGBD relacionais, para representar as associações existentes entre as várias entidades utilizam-se esquemas de relações em que figuram atributos comuns. • Chave primária de uma relação é um subcon-junto mínimo de atributos cujos valores permitem identificar de modo único cada uma das instâncias dessa relação. • Uma chave estrangeira de uma relação é um conjunto de atributos que é chave primária de outra relação.
Passagem do modelo E-A para relacional • Um modelo de tipo E-A descreve de uma forma natural e simples a realidade. • Os modelos deste tipo são suficientemente flexíveis para poderem ser utilizados eficazmente numa fase em que a estruturação dos dados é ainda confusa. • A estas vantagens pode ainda adicionar-se a facilidade com que é possível efectuar a sua passagem para um SGBD relacional, bem formalizado e comercializado por diversos fornecedores de software.
Regras para transformação de um modelo E-A num esquema relacional (1) Cada tipo de entidades do modelo E-A traduz-se por uma relação em que a chave primária e os atributos provêm do tipo de entidade.
Regras para transformação de um modelo E-A num esquema relacional (2) Um tipo de associação de 1:n (um para muitos) entre dois tipos de entidades Ei e Ej que tenha uma multiplicidade igual a 0,1 ou 1,1 para um tipo de entidade Ei traduz-se por uma chave estrangeira na relação R que é tradução de Ej. Ei Ej 1,n 1,1 Ri Rj
Regras para transformação de um modelo E-A num esquema relacional (2') Um tipo de associação de 1:1 (um para um) entre dois tipos de entidades Ei e Ej é tratado como um caso especial do tipo de associação 1:n • traduz-se por uma chave estrangeira na relação que é tradução de Ej ou de Ei; • se apenas para um destes tipos entidades a multiplicidade for 1,1 (sendo para a outra 0,1) dá-se preferência à relação que traduz este tipo de entidade, • no caso contrário é indiferente qual a relação que é escolhida.
Regras para transformação de um modelo E-A num esquema relacional (3) Um tipo de associação n:n (muitos para muitos) traduz-se por uma relação R em que a chave primária inclui as chaves estrangeiras que são chave primária dos tipos de entidade que a constituem; os outros atributos são a tradução dos tipos de atributos da associação (se esta possuir algum). Ei Ej 1,n 1,n Ri Rj R
Nota: se nas associações n:n as chaves estrangeiras não são suficientes para formar a chave primária da relação R, na constituição desta devem também ser utilizados outros atributos de forma a ser obtida uma chave primária.
Modelo relacional: 1ª forma normal • Todos os atributos tomam valor único. Exemplo: Em vez de Fazer:
Modelo relacional - Dependências funcionais • Dada um relação R definida sobre um conjunto de atributos U={A1, A2, …, An}, diz-se que o atributo Ak depende funcionalmente do atributo Ai (AiAk) se e só se sempre que duas instâncias tiverem o mesmo valor em Ai tiverem também o mesmo valor em Ak.
Modelo relacional: 2ª forma normal • A relação tem que estar na 1ª forma normal • Não existem dependências funcionais entre atributos que não pertencem à chave primária e partes da chave primária • a 2ª forma normal só é relevante quando a chave primária de uma tabela é composta por mais do que um atributo
Modelo relacional: 3ª forma normal • A tabela tem que estar na 2ª forma normal • Não existem dependências funcionais entre atributos que não pertencem à chave primária
Normalização • A passagem de uma forma normal para outra pode implicar a decomposição de uma tabela num conjunto de tabelas.
Exemplo: 2ª FN 3ª FN Exemplo: dada a tabela na 2ª forma normal Fazer: e
Tabela normalizada (3ª forma normal) • Numa tabela que verifica as primeiras três formas normais, qualquer atributo que não pertence à chave primária depende completamente e exclusivamente da totalidade dessa chave.
Exemplo: Suponha que tem que estruturar um tema relativo a árvores notáveis numa estrutura de dados vectoriais de um sistema de informação geográfica (SIG). Para cada árvore pretende registar o nome comum, o nome científico, a família, a altura da árvore e o diâmetro do tronco (DAP). Existe um milhar de árvores notáveis na região de interesse, havendo várias espécies representadas por diversos indivíduos. Como estruturaria essa informação no SIG?
Consistência, redundância e formas normais Para evitar redundâncias e para facilitar a manutenção da consistência dos dados na base de dados, as tabelas devem verificar as formas normais. A primeira forma normal é obrigatoriamente respeitada por uma relação. A segunda forma normal é obrigatoriamente respeitada por uma relação cuja chave primária seja simples. A segunda forma normal nas relações que possuem chave primária composta e a terceira forma normal asseguram a não existência de um certo tipo de redundâncias na base de dados.
Structured Query Language (SQL) • SQL é uma linguagem normalizada (ANSI) para consultas e actualizações de bases de dados relacionais.
A instrução SELECT • As consultas a uma base de dados relacional fazem-se em SQL recorrendo à instrução SELECT. Esta instrução permite criar conjuntos de registos de uma ou mais tabelas da base de dados seleccionados segundo diversos critérios.
A cláusula WHERE: selecção de linhas SELECT atributo1, atributo2, .... (ou *) FROM tabela1, tabela 2, ... WHERE condição; onde o argumento de WHERE é uma condição que os registos seleccionados verificam; podem ser utilizados operadores relacionais (<, <=, >, >=, =, <>) , operadores lógicos (NOT, AND, OR) e os operadores IN, IS, BETWEEN e LIKE.
A cláusula WHERE (exemplos) • select * from conc where area > 500000000 • select * from conc where concelho like ‘A%’ • select * from rios where "TIPO" = 'Principal' or "DESIGNACAO" in ( 'Fronteira terrestre' , 'Fronteira marítima' )
Cruzamento de tabelas (“join”) • A cláusula FROM especifica o(s) nome(s) da(s) tabela(s) em que se encontram os registos a seleccionar. • A instrução SELECT produz o produto cartesiano das tabelas especificadas, isto é, cada registo do resultado é composto por um registo de cada uma dessas tabelas. • Num cruzamento (join) de tabelas a cláusula WHERE é utilizada para seleccionar no resultado do produto cartesiano os tuplos que correspondem a registos em que o valor de uma chave estrangeira é igual ao valor de uma chave primária.
Exemplo (cruzamento ou join): SELECT * FROM conc,ValorAcrescentado WHERE DTCC=codigo; onde codigo é a chave primária da tabela ValorAcrescentado e DTCC é a correspondente chave estrangeira na tabela conc.
A cláusula GROUP BY e as funções de agregação • As funções de agregação aplicam-se a selecções de registos. Podem ser utilizadas as funções SUM, AVG, MAX, MIN e COUNT,... • A utilização de funções de agregação é feita frequentemente em conjunto com a cláusula GROUP BY. Esta especifica os conjuntos de registos seleccionados que são objecto da(s) função(ões). • Quando é utilizada a cláusula GROUP BY, só podem ser indicados na cláusula SELECT os atributos incluídos na cláusula GROUP BY (para além daqueles que são argumento de uma função).
GROUP BY Group by indica o atributo que define o agrupamento Select atrib1 From tabela_entrada Group by atrib1 Se se quiser também incluir no resultado da operação uma função f dos valores do atributo atrib2, aplicada a cada grupo definido da forma acima: Select atrib1, f(atrib2) From tabela_entrada Group by atrib1
Dissolve vs GROUP BY • Num SIG, a operação de “dissolução” de objectos espaciais (dissolve) corresponde a uma pesquisa com cláusula GROUP BY na tabela do tema que se quer “dissolver”.
SELECT DT as conc.DT, area AS SUM(conc.area) FROM conc GROUP BY conc.DT;
Outro exemplo: Suponha que pretende estruturar para uma determinada região um tema relativo a culturas agrícolas numa estrutura de dados vectoriais de um sistema de informação geográfica (SIG). Para cada parcela de terreno ocupada por uma determinada cultura pretende-se registar (i) o nome comum da espécie, (ii) o nome científico, (iii) o rendimento médio da cultura na região, (iv) a data da sementeira ou plantação e (v) a área da parcela. A região de interesse é um concelho rural do norte de Portugal, com um elevado índice de desagregação das parcelas. • Que estrutura de dados deve usar? • Explique porque é vantajoso usar duas tabelas na base de dados do sistema de informação geográfica, uma referente a objectos espaciais, outra com informação não espacial. • Como deve proceder para – através de pesquisas à base de dados que estruturou – obter informação, para cada tipo de cultura, sobre a primeira data de sementeira/plantação na região?