Tabelas Hash

1. Tabelas Hash Prof. Thales Castro

2. Motiva��o

3. Motiva��o

4. Fun��es Hashing Os registros com as chaves s�o armazenados nessa tabela, e endere�ados a partir de uma fun��o de transforma��o sobre a chave de pesquisa A essa fun��o d�-se o nome de Fun��o HASHING Seja M o tamanho da tabela: A fun��o de hashing mapeia as chaves de entrada em inteiros dentro do intervalo [1..M] Formalmente: A fun��o de hashing h(kj) ? [1,M] recebe uma chave kj ? {k0,..,km} e retorna um n�mero i, que � o �ndice do subconjunto mi ? [1,M] onde o elemento que possui essa chave vai ser manipulado

5. Fun��es Hashing M�todo pelo qual: As chaves de pesquisa s�o transformadas em endere�os para a tabela (fun��o de transforma��o); Obt�m-se valor do endere�o da chave na tabela HASH Tal fun��o deve ser f�cil de se computar e fazer uma distribui��o equiprov�vel das chaves na tabela Existem v�rias fun��es Hashing, dentre as quais: Resto da Divis�o Meio do Quadrado M�todo da Dobra M�todo da Multiplica��o Hashing Universal

6. Resto da Divis�o Forma mais simples e mais utilizada Nesse tipo de fun��o, a chave � interpretada como um valor num�rico que � dividido por um valor O endere�o de um elemento na tabela � dado simplesmente pelo resto da divis�o da sua chave por M (Fh(x) = x mod M), onde M � o tamanho da tabela e x � um inteiro correspondendo � chave 0 <= F(x) <= M

7. Resto da Divis�o Ex: M=1001 e a seq��ncia de chaves: 1030, 839, 10054 e 2030 Chave Endere�o 1030�� 29 10054�� 53 839�� 838 2030�� 29

8. Resto da Divis�o � Desvantagens Fun��o extremamente dependente do valor de M escolhido M deve ser um n�mero primo Valores recomend�veis de M devem ser >20

9. Fun��es Hash Seja qual for a fun��o, na pr�tica existem sin�nimos � chaves distintas que resultam em um mesmo valor de hashing. Quando duas ou mais chaves sin�nimas s�o mapeadas para a mesma posi��o da tabela, diz-se que ocorre uma colis�o.

10. Tratamento de Colis�es Algumas solu��es conhecidas

11. Tabelas Hash- Colis�es Qualquer que seja a fun��o de transforma��o, existe a possibilidade de colis�es, que devem ser resolvidas, mesmo que se obtenha uma distribui��o de registros de forma uniforme; Tais colis�es devem ser corrigidas de alguma forma; O ideal seria uma fun��o HASH tal que, dada uma chave 1 <= I <= 26, a probabilidade da fun��o me retornar a chave x seja PROB(Fh(x)= I) = 1/26, ou seja, n�o tenha colis�es, mas tal fun��o � dif�cil, se n�o imposs�vel

12. Resto da Divis�o - Colis�o No exemplo dado, M=1001 e a seq��ncia de chaves: 1030, 839, 10054 e 2031 Chave Endere�o 1030�� 29 10054�� 53 839�� 838 2030�� 29

13. Tratamento de Colis�es Alguns dos algoritmos de Tratamento de Colis�es s�o: Endere�amento Fechado Endere�amento Aberto Hashing Linear Hashing Duplo

14. Endere�amento Fechado Tamb�m chamado de Overflow Progressivo Encadeado Algoritmo: usar uma lista encadeada para cada endere�o da tabela Vantagem: s� sin�nimos s�o acessados em uma busca. Processo simples. Desvantagens: � necess�rio um campo extra para os ponteiros de liga��o. Tratamento especial das chaves: as que est�o com endere�o base e as que est�o encadeadas

15. Endere�amento Fechado





20. Hashing Linear Tamb�m conhecido como Overflow Progressivo Consiste em procurar a pr�xima posi��o vazia depois do endere�o-base da chave Vantagem: simplicidade Desvantagem: se ocorrerem muitas colis�es, pode ocorrer um clustering (agrupamento) de chaves em uma certa �rea. Isso pode fazer com que sejam necess�rios muitos acessos para recuperar um certo registro. O problema vai ser agravado se a densidade de ocupa��o para o arquivo for alta

21. Hashing Linear

22. Hashing Linear - Implementa��o

23. Hashing Linear - Implementa��o

24. Hashing Linear

25. Hashing Duplo Tamb�m chamado de re-hash Ao inv�s de incrementar a posi��o de 1, uma fun��o hash auxiliar � utilizada para calcular o incremento. Esta fun��o tamb�m leva em conta o valor da chave. Vantagem: tende a espalhar melhor as chaves pelos endere�os. Desvantagem: os endere�os podem estar muito distantes um do outro (o princ�pio da localidade � violado), provocando seekings adicionais

26. Hashing Duplo

27. Hashing Duplo - Implementa��o

28. Hashing Duplo - Implementa��o

29. Endere�amento Aberto �Remo��o

30. Endere�amento Aberto: Remo��o

31. Tabelas HASH Din�mica

32. Endere�amento Aberto � Expans�o

33. Endere�amento Aberto � Expans�o

34. Endere�amento Aberto �Expans�o

35. Quando n�o usar Hashing?

36. FIM

Tabelas Hash

Tabelas Hash

Presentation Transcript

Hash Tables

Trabalho com tabelas de decisão

TABELAS

TABELAS DE PREÇOS DOS UTENSÍLIOS

Mapeamento de Objetos para Tabelas Relacionais

Hash functions

Hash Tables

Hash Functions

TABELAS 2 x 2

TABELAS

Tabelas

Hash Tables

Tecniche HASH

Tabelas e Gráficos

Personalizando Tabelas

Introdução ao html - tabelas

TABELAS PROCESSUAIS

Criação de Tabelas

Data Frames ( tabelas ) e Matrizes

Hash

Hashing - Hash Maps and Hash Functions

Hash Tables