560 likes | 720 Views
Ferramentas de ETL Por: Ellison Siqueira (erms). Ferramentas de ETL. Fonte dos dados: Banco de Dados de Exemplo do MS Acess Formato: Access (.mdb) Nome do Banco Northwind Descrição da base
E N D
Ferramentas de ETL Por: Ellison Siqueira (erms)
Ferramentas de ETL • Fonte dos dados: • Banco de Dados de Exemplo do MS Acess • Formato: • Access (.mdb) • Nome do Banco • Northwind • Descrição da base • A base contém dados fictícios de uma empresa onde são registradas informações sobre vendas e estoque de produtos. • Ferramentas • DTS (Microsoft) – Data Transformation Services • Kettle (Pentaho)
Ferramentas de ETL • Destino dos Dados: • DW em MS SQL Server • Nome do Banco • DWNorthwind • Descrição • Base de dados no modelo estrela. Os assuntos do modelo são Vendas e Estoque • Objetivos • Extrair os dados da base Access, aplicar transformações e carregá-las no banco SQL Server
Modelos SQL • Este Slide possui um comentário que contém o Script de criação da base de dados do DW.
Ferramentas ETL • Considerações • A validação de chaves do banco de dados do DW não será desativada • Assim, o processo primeiro deve ser aplicado as Dimensões e, depois, aos Fatos
Ferramentas ETL Microsoft DTS
Microsoft DTS • É disponibilizado através do SQL Server Enterprise Manager • Exige a “presença” de um servidor SQL Server ativo, mesmo que o Processo de ETL não envolva bases SQL Server • A Ferramenta aplica o conceito de pacotes. Atividades do processo de ETL são agrupadas nestes pacotes.
Microsoft DTS • Criar um novo pacote e inserir as conexões
Microsoft DTS • Conexões Acces e SQL Server
Microsoft DTS • Criação das transformações
Microsoft DTS • Criação das transformações
Microsoft DTS • Criação das transformações
Microsoft DTS • Auxílio na seleção dos dados na fonte
Microsoft DTS • Criação das transformações • Tipos de Transformações
Microsoft DTS • Transformação ActiveX Script
Microsoft DTS • Transformação ActiveX Script
Microsoft DTS • Transformação ActiveX Script
Microsoft DTS • Transformações - Dimensões • Clientes • Fornecedores • Funcionários • Transportadoras • Produtos • Tempo Obs: Este Slide contém comentários com os comandos SQL de seleção das fontes e os scripts ActiveX das dimensões, quando o script for necessário
Microsoft DTS • Criação das transformações - salvar Pacote
Microsoft DTS Este Slide também possui comentários com instruções SQL e Scripts ActiveX • Criação das transformações • Repetir o mesmo para os Fatos • Vendas • Estoque
Microsoft DTS • Criação de Pacote para automação do processo • O pacote deve • (1) Excluir os dados do DW; • (2) Exportar os dados das tabelas de dimensão; e, • (3) Exportar os dados das tabelas de fato • É necessário • (1) A criação de uma conexão com a base SQL Server para possibilitar apagar os dados; • (2) Um script SQL que apegue os dados; • (3) Em caso de sucesso na eliminação dos registros, chamar o pacote de extração dos dados das dimensões; e, • (4) Em caso de sucesso na extração dos dados das tabelas de dimensão, chamar o pacote de extração dos dados das dimensões.
Microsoft DTS • Criação de Pacote para automação do processo Aqui tem um comentário com o SQL para eliminar os dados das tabelas de fato e dimensão
Ferramentas ETL Kettle http://kettle.pentaho.org/
Kettle • Ferramentas • Spoon • Pan • Chef • Kitchen
Kettle • Welcome to Spoon
Kettle • Spoon
Kettle • Mais opções ao usuário
Kettle • Transformações Primeiro é necessário criar conexões ODBC para as bases de dados de entrada e saída
Kettle • Assistente para conexão - Access
Kettle • Assistente para conexão - Access
Kettle • Assistente para conexão – SQL Server
Kettle • Assistente para conexão – SQL Server
Kettle • Conexões criadas e Transformação salva
Kettle • ETL Mini Dimensões
Kettle • ETL Dimensões
Kettle • Componentes utilizados • Input -> Input table • Transform -> Select values • Output -> Insert/Update • Scripting -> Java Script Value • Transform -> Calculator • Join -> Database Join
Kettle • Input Table Informar a conexão • Script SQL para Dimensões • Cliente • Fornecedor • Funcionário • Transportadora • Produto • Tempo Este Slide possui os scripts SQL em comentários
Kettle • Select Values
Kettle • Criar Relação entre componentes
Kettle • Insert/Update
Kettle • Java Script Value • Script Java Script para • Nome + Sobrenome • Status Produto • Manipula Datas Este slide contém os scripts dentro de comentários
Kettle • Calculator
Kettle • Database Join Script Join Localização
Kettle • ETL Fatos • Criar uma nova transformação (conexão e componentes) para as tabelas de fato • Scrits SQL • Vendas • Estoque • Script Java Script • ValorEstoque Este Slide também possui os Scripts • Scrits Join
Kettle • Criação do Job de automação