300 likes | 391 Views
Star Schema Benchmark SSB. Samara Martins do Nascimento <smn@cin.ufpe.br>. Roteiro. TPC TPC-H SSB Esquema do SSB Detalhes do Esquema SSB Consultas do Benchmark Medição de Desempenho Configuração do SSB. TPC. Transaction Processing Performance Council Organização fundada em 1985.
E N D
Star Schema BenchmarkSSB Samara Martins do Nascimento <smn@cin.ufpe.br>
Roteiro • TPC • TPC-H • SSB • Esquema do SSB • Detalhes do Esquema SSB • Consultas do Benchmark • Medição de Desempenho • Configuração do SSB
TPC • Transaction Processing Performance Council • Organização fundada em 1985. • Define benchmarks de Bancos de Dados.
TPC-H • Usado para avaliar o desempenho de consultas em Data Warehouse. • Benchmark que define uma aplicação que armazena dados históricos relativos a pedidos e vendas de uma empresa.
SSB • Usado para avaliar o desempenho de um DW. • Baseado no TPC-H.
Esquema do SSB • Formado a partir do esquema TPC-H • Lineitem + Order = Lineorder • Excluímos alguns atributos de Lineitem e Order. • Excluímos Partsupp • Por causa da granularidade. • Adicionamos a tabela de dimensão Date.
Esquema do SSB • Proposta do SSB • Tabela de Fatos: Lineorder • Tabelas de Dimensão: • Customer, Part, Supplier e Date.
Esquema do SSB • Reduzir o número de acesso ao disco. • Liberando o buffer. • Tenta minimizar a sobreposição de consultas.
Detalhes do Esquema SSB • Excluímos a Tabela Partsupp • Devido a granularidade • Lineorder = Temporal. • Partsupp = Periodica. • Transações que adicionam novas linhas a Lineorder não modificarão Partsupp.
Detalhes do Esquema SSB • Tabela de Fatos Lineorder • Combinamos • Lineitem e Order do esquema TPC-H. • Excluímos O_Comment, L_Comment • Consultas a DW não analisam comentários.
Detalhes do Esquema SSB • Tabela de Dimensão Part • Diminuimos o tamanho de P_Name • 55 bytes para 22 bytes. • Excluímos P_Comment, com O_Comment • Não usando comentários no DW.
Detalhes do Esquema SSB • Tabela de Dimensão Supplier • Reduzimos o numero de Fornecedores • Não deve haver muitos fornecedores por Cliente
Detalhes do Esquema SSB • Tabela de Dimensão Date • Foi mantida por se tratar de DW de vendas.
Consultas do Benchmark • Baseados no conjunto de consultas do TPC-H. • Mas, muitas consultas não podem ser consideradas dentro do esquema do SSB.
Consultas do Benchmark • Q1 • Baseada na consulta TPCQ6 do TPC-H. • Quantifica a renda a partir da eliminação de certos descontos da empresa, dada uma porcentagem de produtos enviados em um determinado ano.
Medição do Desempenho • Pode resultar num relatório • Qualquer objeto que seja criado para acelerar o desempenho seja claramente explicado.
Medição do Desempenho • Os relatórios devem conter: • Os planos de consulta; • O número de linhas acessadas; • O tempo execução da consulta; • O tempo da CPU utilizada • E a utilização de entrada e saída
Configuração do SSB • O arquivo de configuração do SSB é chamado dbgen. • O dbgen é um robusto gerador de populações de banco de dados. • A linguagem de programação utilizada é C/C++.
Configuração do SSB • Para gerar os arquivos do SSB é necessário utilizar alguns parâmetros. • De acordo com a tabela requisitada, os parâmetros variam. • O dbgen é acessado pelo prompt de comando do sistema operacional.
Configuração do SSB • É necessário preparar a Base de Dados com antecedência. • Todas as tabelas deverão existir antes de importar os dados que o arquivo gerou para a base.
Configuração do SSB • Uma coluna a mais deve ser criada em todas as tabelas do SSB. • O arquivo .tbl gerado considera o delimitador como um campo.
Configuração do SSB • Para povoar a tabela deve-se executar o comando COPY part FROM 'c://part.tbl' USING DELIMITERS '|';
Referências • Artigo 2009: • http://www.cs.umb.edu/~poneil/StarSchemaB.pdf
Samara Martins do Nascimento <smn@cin.ufpe.br> Star Schema BenchmarkSSB