120 likes | 261 Views
Aula Prática. Condições de Normalidade Teste de Hipótese Prof. Renata M. C. R. Souza Alunos: raaf@cin.ufpe.br dcfq@cin.ufpe.br. Tópicos Abordados. Base de Dados Condições de Normalidade Exemplo Teste de Aderência Exemplo Teste de Hipótese Paramétrico Não- Paramétrico.
E N D
Aula Prática Condições de Normalidade Teste de Hipótese Prof. Renata M. C. R. Souza Alunos: raaf@cin.ufpe.br dcfq@cin.ufpe.br
Tópicos Abordados • Base de Dados • Condições de Normalidade • Exemplo • Teste de Aderência • Exemplo • Teste de Hipótese • Paramétrico • Não- Paramétrico
Base de Dados - IRIS • Problema de Classificação de flores e possui 4 variáveis, são elas: • 1. sepal length in cm • 2. sepal width in cm • 3. petal length in cm • 4. petal width in cm • 5. class: • Iris Setosa • Iris Versicolour • Iris Virginica • http://archive.ics.uci.edu/ml/machine-learning-databases/iris
Exemplo mean(amostrafinal1) - 3.489 median(amostrafinal1) - 3.25 sd(amostrafinal1) - 0.7722985 0.4342528 1.7934529 0.7537661 var(amostrafinal1) - 0.5964449 0.1885755 3.216473 0.5681633
Condições de Normalidade • Verificar se amostra segue uma distribuição normal ou não • Histograma – fazer a análise pela quantidade, ou seja, por linha; • Box-Plot – faz a análise por variáveis, ou seja, por coluna. • Teste de Aderência.
Condições de Normalidade • Teste de Aderência • A idéia é de comparar as freqüências observadas com as freqüências esperadas. • H0: a amostra é selecionada de uma população que segue uma determinada distribuição. • Ha: a amostra não é selecionada de uma população que segue uma determinada distribuição.
Exemplo usando Qui-Quadrado • H0: segue a mesma distribuição • H1:não segue a mesma distribuição • chisq.test (freqüência esperada, freqüência observada) • chisq.test(rbind(c(50,50,50),c(3,22,90))) • X-squared = 60.4282, df = 2, p-value = 7.554e-14 • chisq.test(rbind(c(50,50,50),c(17,17,16))) • X-squared = 0.0302, df = 2, p-value = 0.985
Exemplo usando Kolmogorov-Smirnov • H0: segue uma distribuição normal • H1:não segue uma distribuição normal • ks.test (amostra, freqüência acumulada) • y<- c(73.9, 74.2, 74.6, 74.7, 75.4, 76, 76 ,76 ,76.5 ,76.6, 76.9, 77.3,77.4,77.7) • ks.test(y,”pnorm”,mean(y),sd(y)) • D = 0.1614, p-value = 0.859 • data: conjuntos • ks.test(conjuntos,"pnorm",mean(conjuntos),sd(conjuntos)) • D = 0.3563, p-value < 2.2e-16
Teste de Hipótese • Caso a amostra seja normal • Supõe que a distribuição é normal • Teste de Hipóteses paramétricos • Student T test • P-value – quanto menor melhor para rejeitar H0 • Caso a amostra NÃO seja normal • Não faz suposição de distribuição de probabilidade • Teste de hipótese não paramétricos • Wilcoxntest • P-value - quanto menor melhor para rejeitar H0
Exemplo Prático no R • Selecione duas amostras • www/~raaf/ESAP • setwd("C://Desktop//Disciplina Prof.Renata“) • conjunto1 <- read.table("irisA.txt",sep=",“) • Análise descritiva dos dados • média, mediana, desvio-padrão e variância • mean(conjunto1), median(conjunto1) • sd(conjunto1) e var(conjunto1)
Exemplo Prático no R • Condições de Normalidade • Histograma = hist() • Box – Plot = boxplot() • Teste de Aderência • chisq.test • ks.test • Teste de Hipótese • Paramétrico = t.test • Não –Paramétrico = wilcox.test
Referencias • http://www/~rmcrs/ESAP/arquivos/TestesAderencia.pdf • http://cran.r-project.org/