160 likes | 370 Views
Aula Prática. Condições de Normalidade Teste de Hipótese Prof. Renata M. C. R. Souza Alunos: raaf@cin.ufpe.br dcfq@cin.ufpe.br. Tópicos Abordados. Base de Dados Condições de Normalidade Exemplo Teste de Aderência Exemplo Teste de Hipótese Paramétrico exemplo Não- Paramétrico
E N D
Aula Prática Condições de Normalidade Teste de Hipótese Prof. Renata M. C. R. Souza Alunos: raaf@cin.ufpe.br dcfq@cin.ufpe.br
Tópicos Abordados • Base de Dados • Condições de Normalidade • Exemplo • Teste de Aderência • Exemplo • Teste de Hipótese • Paramétrico • exemplo • Não- Paramétrico • exemplo
Condições de Normalidade • Verificar se amostra segue uma distribuição normal ou não • Histograma – fazer a análise pela quantidade, ou seja, por linha; • Box-Plot – faz a análise por variáveis, ou seja, por coluna. • Teste de Aderência.
Histograma • Histograma simétrico , distribuição Normal • A freqüência é mais alta no centro e decresce gradualmente para as caudas de maneira simétrica (forma de sino). A média e a mediana são aproximadamente iguais e localizam-se no centro do histograma (ponto de pico).
Box-Plot O Box-Plot é um gráfico no formato de caixa, cujos limites são o 1º quartil e o 3º quartil, que representam 25% e 75% dos dados respectivamente. Esta caixa é dividida por uma linha, a mediana, que significa 50% dos dados. Existem também dois eixos,ligados à caixa estendendo-se aos extremos, isto é ao menor e ao maior valor dos dados, excluindo os valores discrepantes (outliers). De um extremo ao outro, temos o espalhamento dos dados. • Quando a mediana divide exatamente no meio(simetria) a caixa.
Base de Dados - IRIS • Problema de Classificação de flores e possui 4 variáveis, são elas: • 1. sepal length in cm • 2. sepal width in cm • 3. petal length in cm • 4. petal width in cm • 5. class: • Iris Setosa • Iris Versicolour • Iris Virginica • http://archive.ics.uci.edu/ml/machine-learning-databases/iris • www/~raaf/ESAP
Exemplo – Pratica1.r • Pratica1.r • Ler os dados da população • hist(conjuntos) • boxplot(conjuntos)
Exercícios • Pratica2.r • Criar uma amostra de uma classe • Pratica3.r • Criar amostras usando as três classes • Ao final calcular a média • Pratica4.r • Criar amostras usando as três classes • Ao final calcular a média
Teste de Hipótese • Caso a amostra seja normal • Supõe que a distribuição é normal • Teste de Hipóteses paramétricos • Student T test • P-value – quanto menor melhor para rejeitar H0 • Caso a amostra NÃO seja normal • Não faz suposição de distribuição de probabilidade • Teste de hipótese não paramétricos • Wilcoxntest • P-value - quanto menor melhor para rejeitar H0
Exemplo • Hip1 <- wilcox.test(MEDIA1,MEDIA2,alternative=c("less")) • alternative = c("two.sided", "less", "greater") • analisar p-value • Rej1 = ifelse (Hip1$p.value<0.05,1,0) • Hip2 <- t.test(MEDIA1,MEDIA2,alternative=c("less")) • alternative = c("two.sided", "less", "greater") • Analisar p-value • Rej2 = ifelse (Hip2$p.value<0.05, 1, 0) • Pratica4.r • Testar as duas médias da amostra utilizando teste de hipótese
Condições de Normalidade • Teste de Aderência • A idéia é de comparar as freqüências observadas com as freqüências esperadas. • H0: a amostra é selecionada de uma população que segue uma determinada distribuição. • Ha: a amostra não é selecionada de uma população que segue uma determinada distribuição.
Exemplo usando Kolmogorov-Smirnov • H0: segue a mesma distribuição normal • H1:não segue a mesma distribuição normal • X = rnorm(100) e Y=runif(100) • hist(X) , hist(Y) • ks.test(X,Y) • Two-sample Kolmogorov-Smirnov test • data: x and y • D = 0.55, p-value = 1.458e-13 • alternative hypothesis: two-sided • Conclusão: Se o p-value menorque o valor D, entãorejeita HO e aceita H1.Logo, as distribuiçõesnãosãoiguais
Exemplo usando Kolmogorov-Smirnov • H0: segue a mesma distribuição normal • H1:não segue a mesma distribuição normal • X = rnorm(100) e Y=rnorm(100) • hist(X) ,hist(Y) • ks.test(X,Y) • Two-sample Kolmogorov-Smirnov test • data: x and y • D = 0.11, p-value = 0.5806 • alternative hypothesis: two-sided • Conclusão: Se o p-value maiorque o valor D, então NÃO rejeitaHO.Logo, ?????
Exemplo Prático no R • Selecione duas amostras • www/~raaf/ESAP; • setwd("C://Desktop//Disciplina Prof.Renata“) • conjunto1 <- read.table("irisA.txt",sep=",“) • Análise descritiva dos dados • média, mediana, desvio-padrão e variância • mean(conjunto1), median(conjunto1) • sd(conjunto1) e var(conjunto1)
Exemplo Prático no R • Condições de Normalidade • Histograma = hist() • Box – Plot = boxplot() • Teste de Aderência • chisq.test • ks.test • Teste de Hipótese • Paramétrico = t.test • Não –Paramétrico = wilcox.test
Referencias • http://www/~rmcrs/ESAP/arquivos/TestesAderencia.pdf • http://cran.r-project.org/