580 likes | 605 Views
Como se familiarizar com seu banco de dados usando o SPSS. Profa. Suzi Camey GPPG - Hospital de Clínicas Depto de Estatística - UFRGS. Construção de BD. O banco de dados (BD) pode ser construído diretamente no SPSS ou em qualquer tipo de planilha eletrônica (como por exemplo Excel)
E N D
Como se familiarizar com seu banco de dados usando o SPSS Profa. Suzi Camey GPPG - Hospital de Clínicas Depto de Estatística - UFRGS Como se familiarizar com seu banco de dados
Construção de BD • O banco de dados (BD) pode ser construído diretamente no SPSS ou em qualquer tipo de planilha eletrônica (como por exemplo Excel) • Principal desvantagem: ausência de um sistema de controle de entrada de dados • Alternativa: EpiData que pode ser obtido gratuitamente no endereço • http://www.epidata.dk/ Como se familiarizar com seu banco de dados
Construção de BD • Usando o Excel lembrar que: • Colocar o nome de cada variável na primeira linha da planilha; • Cada linha representa um sujeito; • Cada coluna é uma variável; • Dados perdidos (missing): é mais fácil deixar a casela vazia; • Não colocar letras em colunas destinadas à variáveis numéricas. Como se familiarizar com seu banco de dados
Construção de BD • Usando o Excel lembrar que: • Cada variável só pode aparecer uma vez no banco, não podendo haver 2 colunas com o mesmo nome. • Não incluir no nome de uma variável acentos, cedilhas, espaços ou caracteres especiais (%, vírgulas, pontos, *, & ...), pois dependendo da versão do SPSS, eles serão lidos de um jeito diferente. • Mesmo já existindo a numeração padrão do excel, deve existir uma coluna enumerando os casos no arquivo. Como se familiarizar com seu banco de dados
Construção de BD • Usando o Excel lembrar que: • Para facilitar a digitação, algumas linhas e algumas colunas podem ficar “fixas” na planilha. Por exemplo se você quer fixar o nome do paciente (coluna b) e o nome das variáveis (linha 1), então deve colocar o cursor na célula B2 e clicar em “Janela” no menu superior, e depois em “congelar painéis”. Neste caso, em qualquer ponto da planilha que você estiver, sempre aparecerá o nome do paciente e o nome da variável. Como se familiarizar com seu banco de dados
Construção de BD Depois clique aqui. Primeiro posicione o cursor nesta casela. Como se familiarizar com seu banco de dados
Construção de BD • Caso você use a versão 2010 do Excel: • Para facilitar a digitação, algumas linhas e algumas colunas podem ficar “fixas” na planilha. Por exemplo se você quer fixar o nome do paciente (coluna b) e o nome das variáveis (linha 1), então deve colocar o cursor na célula B2 e clicar em “Exibição” no menu superior, e depois em “Congelar Painéis”. Neste caso, em qualquer ponto da planilha que você estiver, sempre aparecerá o nome do paciente e o nome da variável. Como se familiarizar com seu banco de dados
Construção de BD Depois clique aqui. Primeiro posicione o cursor nesta casela. Como se familiarizar com seu banco de dados
Construção de BD • O ideal é que daqui em diante os próximos passos sejam executados no arquivo milsa.xls Como se familiarizar com seu banco de dados
Construção de BD Vamos iniciar o uso do SPSS. Como exemplo vamos usar o arquivo milsa.xls. O ideal é que daqui em diante os próximos passos sejam executados nesse arquivo, que pode ser obtido em: http://www.mat.ufrgs.br/~camey/HCPA/ Como se familiarizar com seu banco de dados
Quando abrimos o SPSS ele tem a seguinte aparência: Iniciando o SPSS Clicar aqui Como se familiarizar com seu banco de dados
Escolher tipo de arquivo Lendo dados do Excel Clicar aqui Como se familiarizar com seu banco de dados
Escolher tipo de arquivo Lendo dados do Excel Clicar aqui Como se familiarizar com seu banco de dados
Escolher arquivo: primeiro escolher o subdiretório onde o arquivo se encontra. Lendo dados do Excel Clicar 2x aqui Como se familiarizar com seu banco de dados
Escolher a planilha Lendo dados do Excel Escolher esta opção se houver o nome das variáveis na 1a. linha do arquivo Excel Aqui pode ser escolhida a planilha do arquivo Excel Clicar aqui Como se familiarizar com seu banco de dados
Rótulos das variáveis e categorias, no. de casas decimais e dados perdidos Definições: pelo Menu Clicar aqui Como se familiarizar com seu banco de dados
Rótulos das variáveis Definições: pelo Menu Nesta coluna podemos colocar os rótulos das variáveis. Basta clicar em uma das caselas e digitar o rótulo. Como se familiarizar com seu banco de dados
Rótulos das variáveis Definições: pelo Menu Neste exemplo ficaria assim Como se familiarizar com seu banco de dados
Rótulos das categorias Definições: pelo Menu Nesta coluna podemos colocar os rótulos das categorias. Clicando na 2a. casela. Como se familiarizar com seu banco de dados
Rótulos das categorias Definições: pelo Menu Clique aqui Como se familiarizar com seu banco de dados
Rótulos das categorias Definições: pelo Menu Aqui digite o valor Aqui digite o rótulo Como se familiarizar com seu banco de dados
Rótulos das categorias Definições: pelo Menu Para a variável civil fica assim. Após adicionar cada “Value” e seu “Label” deve-se clicar aqui. Como se familiarizar com seu banco de dados
Definições: pelo Menu Rótulos das categorias: colocar rótulos das variáveis abaixo. • Instrução: • 1: Ensino Fundamental • 2: Ensino Médio • 3: Superior • Região: • 1: capital • 2: interior Como se familiarizar com seu banco de dados
Casas decimais Definições: pelo Menu Nesta coluna podemos definir o no. de casas decimais. Basta clicar em uma das caselas e digitar o no. de casas decimais ou usar as setas. Como se familiarizar com seu banco de dados
Dados perdidos Definições: pelo Menu Nesta coluna podemos definir quais são os códigos para valores perdidos. Como se familiarizar com seu banco de dados
Dados perdidos Definições: pelo Menu Clicar aqui Como se familiarizar com seu banco de dados
Dados perdidos Definições: pelo Menu Podem ser definidos até 3 valores diferentes. No nosso exemplo o valor perdido é definido pelo número 9. Como se familiarizar com seu banco de dados
Definições: pela sintaxe Agora vamos definir rótulos das variáveis e categorias, no. de casas decimais e dados perdidos construindo um arquivo de sintaxe. Esse método é útil principalmente quando se pretende fazer análises parciais do banco de dados, pois cada vez que lemos um BD do Excel temos que reaplicar as definições. Como se familiarizar com seu banco de dados
Definições: pela sintaxe Clicar aqui Como se familiarizar com seu banco de dados
Definições: pela sintaxe Esta é a janela do arquivo de sintaxe. O arquivo de sintaxe pode ser construído em qualquer editor de texto e é conveniente que seja salvo com a terminação .sps Como se familiarizar com seu banco de dados
Definições: pela sintaxe Nomes dos comandos Como se familiarizar com seu banco de dados
Definições: pela sintaxe Nomes das variáveis a serem definidas Como se familiarizar com seu banco de dados
Definições: pela sintaxe Rótulo da variável Nome da categoria Número da categoria Código do valor perdido Como se familiarizar com seu banco de dados
Definições: pela sintaxe Os rótulos devem estar entre aspas simples e o código do dado perdido está entre parênteses. Todos os comandos devem terminar com ponto final. Agora você deve definir os rótulos de variáveis e categorias para todas as variáveis! Como se familiarizar com seu banco de dados
Definições: pela sintaxe Clicando aqui após selecionar o comando com o mouse, o comando será executado. Como se familiarizar com seu banco de dados
Definições: pela sintaxe Lembrar de salvar a sintaxe! Como se familiarizar com seu banco de dados
Lembrar de salvar o banco de dados! Como se familiarizar com seu banco de dados
“Limpeza” do BD • Após colocar todos os rótulos e definir quais são os valores perdidos devemos fazer uma distribuição de frequências de todas as variáveis para detectar possíveis erros de digitação. Como se familiarizar com seu banco de dados
“Limpeza” do BD Clicar aqui Como se familiarizar com seu banco de dados
“Limpeza” do BD • Clicar aqui depois de selecionar todas as variáveis com o mouse. • Depois clicar em OK. Como se familiarizar com seu banco de dados
“Limpeza” do BD • Quando esse comando é executado, uma nova janela é aberta: a janela de resultados. Como se familiarizar com seu banco de dados
“Limpeza” do BD • Aqui temos todas as variáveis analisadas, o número de casos válidos e o número de casos perdidos. • Por exemplo: temos 13 observações perdidas na variável “Região onde mora” e 23 observações válidas. Como se familiarizar com seu banco de dados
“Limpeza” do BD • Agora vamos fazer uma análise de cada uma das variáveis buscando inconsistências. Como se familiarizar com seu banco de dados
“Limpeza” do BD Variável Número do sujeito: • Como esta é a variável de identificação dos casos não podemos ter nenhuma freqüência diferente de 1, pois neste caso teríamos dois sujeitos com a mesma identificação. Como se familiarizar com seu banco de dados
“Limpeza” do BD Variável Estado civil: Aqui encontramos um problema: na distribuição de frequência aparece um código 4. Temos que identificar qual o caso e corrigi-lo. Como se familiarizar com seu banco de dados
“Limpeza” do BD Temosvárias maneiras de localizar o caso. Uma delas é marcando a coluna da variável onde se encontra o problema e depois clicar em “Find”. Como se familiarizar com seu banco de dados
“Limpeza” do BD Digitar aqui o valor “estranho” e depois em “Find Next”. Como se familiarizar com seu banco de dados
“Limpeza” do BD Depois de identificado o sujeito... Como se familiarizar com seu banco de dados
“Limpeza” do BD ... verificar o erro e corrigi-lo. Como se familiarizar com seu banco de dados
“Limpeza” do BD Variável Grau de instrução: • Aqui não há inconsistência. • Uma das possíveis observações que podemos fazer é: há 33,3% de pessoas que concluíram o Ensino Fundamental. Como se familiarizar com seu banco de dados