290 likes | 508 Views
III - Amostragem. Prof. Herondino. População e amostra. População uma população é o conjunto de todos os itens, objetos, coisas ou pessoas a respeito das quais a informação é desejada para a solução de um problema. Amostra
E N D
III - Amostragem Prof. Herondino
População e amostra • População • uma população é o conjunto de todos os itens, objetos, coisas ou pessoas a respeito das quais a informação é desejada para a solução de um problema. • Amostra • Uma amostra é um grupo de itens selecionados por um método cuidadosamente concebido e projetado a partir de uma população.
Amostragem Simples ou ocasional • Todos os elementos da população têm igual probabilidade de serem escolhidos. Para uma população finita o processo deve ser sem reposição. • Todos os elementos da população devem ser numerados. Para realizar o sorteio dos elementos devemos usar a Tabela de Números Aleatórios.
Amostragem Sistemática • Sendo N o tamanho da população e n o tamanho da amostra desejado, define-se a quantidade chamado intervalo de amostragem. • Faz-se um sorteio entre os números 1, 2, 3, ..., K, e se obtém o valor i, onde será o meu primeiro elemento, os demais elementos poderão ser calculados pelo termo geral de uma progressão aritmética.
Exemplo • Suponha que uma empresa de telefonia fixa deseja saber o grau de satisfação de seus usuários com serviços prestados. O número de assinantes é da ordem de 50.000 e nos desejamos selecionar uma amostra aleatória de 1.000 assinantes com o intuito de obter a avaliação sobre os serviços. • Solução via Amostragem Aleatória Simples: • Devemos ter os assinantes numerados sequencialmente • de 1 a 50.000 e somente após seriam selecionados os 1.000 assinantes. Vejamos usando o Excel.
Exemplo: sorteio entre os números 1, 2, 3, ..., K
Amostragem estratificada • É um processo de amostragem usado quando nos deparamos com populações heterogêneas, no qual pode-se distinguir subpopulações mais ou menos homogêneas, denominados estratos. • Após a determinação dos estratos, seleciona-se uma amostra aleatória de cada uma subpopulação (estrato). • As diversas subamostras retiradas das subpopulações devem ser proporcionais aos respectivos números de elementos dos estratos e guardarem a proporcionalidade em relação a variabilidade de cada estrato, obtendo-se uma estratificação ótima
Exemplo • Vamos obter uma amostra estratificada de 10% da população para a pesquisa da estatura de 90 alunos de uma escola sendo que destes 54 sejam meninos e 36 sejam meninas. • São, portanto dois estratos (gênero feminino e gênero masculino) e queremos uma amostra de 10% da população. Numeramos os alunos de 1 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90, meninas.
Tabela de Números Aleatórios 57 28 92 90 80 22 56 79 53 18 53 03 27 05 40 28 22 53 18 03 – para os meninos; 57 90 80 56 – para as meninas;
Com reposição das amostras Sem reposição das amostras
Dados • A palavra "dados" é um termo relativo, tratamento de dados comumente ocorre por etapas, e os "dados processados" a partir de uma etapa podem ser considerados os "dados brutos" do próximo. (Wikipédia) • Dados Brutos • Em informática dados brutos (raw data) designam os dados/valores recolhidos e estocados tal qual foram adquiridos, sem terem sofrido o menor tratamento (Wikipédia)
Dados Brutos • Suponhamos o seguintes dados Brutos como sendo a idade de alunos de uma turma de informática 14 12 13 11 12 13 16 14 14 15 17 14 11 13 14 15 13 12 14 13 14 13 15 16 12 12
Frequência • A frequência de uma observação é o número de repetições dessa observação no conjunto de observações, ou ainda, é o número de vezes que conjuntos de dados aparecem em uma “população”.
Distribuição de Frequência Simples ( ) Dados ou variável (Idade) Frequência (nº de Alunos)
Frequências Relativas • A frequência relativa é o valor da frequência absoluta dividido pelo número total de observações.
Regras de arredondamento na Numeração Decimal • Norma ABNT NBR 5891 • 1) Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for inferior a 5, o último algarismo a ser conservado permanecerá sem modificação • Exemplo: 1,333 3 arredondado à primeira decimal tornar-se-á 1,3
Regras de arredondamento na Numeração Decimal • 2) Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for superior a 5, ou, sendo 5, for seguido de no mínimo um algarismo diferente de zero, o último algarismo a ser conservado deverá ser aumentado de uma unidade • Exemplo • 1,666 6 arredondado à primeira decimal tornar-se-á: 1,7.4,850 5 arredondados à primeira decimal tornar-se-ão : 4,9.
Regras de arredondamento na Numeração Decimal • 3) Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for 5 seguido de zeros, dever-se-á arredondar o algarismo a ser conservado para o algarismo par mais próximo. Consequentemente, o último a ser retirado, se for ímpar, aumentará uma unidade. • Exemplo: 4,550 0 arredondados à primeira decimal tornar-se-ão: 4,6.
Regras de arredondamento na Numeração Decimal 4) Quando o algarismo imediatamente seguinte ao último a ser conservado for 5 seguido de zeros, se for par o algarismo a ser conservado, ele permanecerá sem modificação. • Exemplo:4,850 0 arredondados à primeira decimal tornar-se-ão: 4,8.
Atividade - III • Verificar a altura em centímetro de cada aluno da turma e construir uma sequência de Dados Brutos; • A partir dos Dados Brutos obtidos, construir a distribuição de frequência absoluta simples, a frequência relativa, frequência acumulada e frequência relativa acumulada. Para o arredondamento utilize a regra da ABNT 5891.
Histograma • Um histograma é uma representação gráfica de uma única variável que representa a frequência de ocorrências (valores dos dados) dentro de categorias de dados. • O histograma tanto pode ser representado para as frequências absolutas como para as frequências relativas.
Histograma de frequência acumulada (ou ogiva) • histograma de frequência acumulada (ou ogiva) é a representação gráfica do comportamento da frequência acumulada.
Distribuição de Frequência em Classe • Quando tratamos de variáveis quantitativas contínuas os valores observados devem ser tabulados em intervalos de classes. • Para a determinação dessas classes não existe uma regra pré estabelecida, sendo necessário um pouco de tentativa e erro para a solução mais adequada. • 1. Definir o número de classes • Se n representa o número de observações (na amostra ou na população, conforme for o caso) o número aproximado de classes pode ser calculado por Número de Classes = arredondando os resultados. • Eexemplo : • Se n = 18 e podemos adotar um número de 5 classes, que será razoável.
2. Calcular a amplitude das classes • Essa será obtida conhecendo-se o número de classes e amplitude total dos dados. • A amplitude total dos dados é o resultado da subtração valor máximo - valor mínimo da série de dados
2. Preparar a tabela de seleção com os limites de cada classe • O limite superior de cada classe é aberto (e consequentemente, o limite inferior de cada classe é fechado), ou seja, cada intervalo de classe não inclui o valor de seu limite superior, com exceção da última classe
Referência • HAIR, Joseph F. et al. Análise Multivariada de Dados. 5ª Porto Alegre, Rs: Bookman, 1998. 51 p.