470 likes | 663 Views
Curso de verão 2013 laboratório em planos complexos de amostragem. Amostragem por conglomerados em múltiplos estágios Questões sobre tamanhos de amostras Sorteio das unidades de amostragem Efeito do delineamento na precisão das estimativas. Amostragem por conglomerados em múltiplos estágios.
E N D
Curso de verão 2013laboratório em planos complexos de amostragem • Amostragem por conglomerados em múltiplos estágios • Questões sobre tamanhos de amostras • Sorteio das unidades de amostragem • Efeito do delineamento na precisão das estimativas
Amostra de conglomerados em múltiplos estágios • Conglomerados: unidades de amostragem que contém vários elementos • Múltiplos estágios • sorteio de unidades dentro de unidades sorteadas anteriormente • conglomerados sorteados no 1º. Estágio UPA: áreas geográficas pequenas, que cobrem toda a população • Em inquéritos • Amostras do país ou de regiões do país ou de estados UPA município • Amostras em municípios UPA setor censitário
Fração de amostragem • AAS f = n/N = m/M • Amostragem em dois estágios f = f1* f2 • Amostragem em três estágios f = f1* f2 * f3
Questões sobre o tamanho da amostraDois estágios de seleção • Cálculo de n – número de pessoas - considerando o parâmetro a ser estimado • Definição dos domínios – n para cada domínio • Cálculo de m – número de domicílios • Cálculo do número de setores censitários e de domicílios por setor
Objetivo Estimar prevalências • Parâmetro proporção • Estimador na AAS
Tamanho de amostra para proporçõesAmostragem aleatória simples
Erro de amostragem • Semi-amplitude do intervalo de confiança d d • Consequência de que • 1,96 indica nível de confiança de 95%
Exemplos • Para estimar a proporção de idosos com HA no município X • ISA-Capital 2008 52% • d=5% IC:[47%;57%] • n=384 • Para estimar a proporção de idosos com depressão no município X • ISA-Capital 2008 25% • d=5% IC:[20%;30%] • n=288 • Para estimar a proporção de idosos com rinite no município X • ISA-Capital 2008 12% • d=5% IC:[7%;17%] ???? • n=100
Variâncias • Amostragem aleatória simples • Amostragem por conglomerados de tamanhos desiguais
No planejamento de inquéritos • deff=2 Dependerá • da homogeneidade intraclasse • da distribuição da amostra pelas unidades primárias de amostragem
Domínios • Cálculo de n deve ser feito para cada domínio. • Domínio – parte da população para a qual estimativas separadas são planejadas (Kish pág.75) • Podem ser definidos por critérios: 1) geográficos 2) demográficos
Tamanho de amostra em domínios • Tamanho mínimo de amostra n=500 • Amostra proporcional • tam.total =n/(menor prop)=500/0,10=5000 • Amostras de tamanhos iguais • tam.total=5*n=2500
INQUÉRITOS Tamanho da amostra de pessoas tamanho da amostra de domicílios Transformação de n m m número de pessoas a serem sorteadas dividido pela média de pessoas por domicílio na faixa etária de interesse
Não resposta • Acréscimo pela taxa de não resposta (máxima a ser tolerada) Diminui o erro de amostragem das estimativas, mas não o vício causado pela não resposta
Definindo número de setores censitários e de domicílios por setor Para um dado m busca-se menor deff O efeito do delineamento depende: • da estratégia elaborada para o processo de sorteio - número de setores e domicílios por setor • da composição interna dos conglomerados - homogeneidade intra conglomerados
Tamanho ótimo de b Ca custo associado ao conglomerado c custo por elemento
Considerando a razão de custos adotada pelo SEADE (na PCV) 20
Número de setores censitários a = n / b escolher a>=30
Sorteio no 1º. estágioSorteio com probabilidade proporcional ao tamanho • Metodologia de eleição da maior parte dos inquéritos • Medidas de tamanho determinam probabilidade de seleção probabilidades diferentes para as UPAs • Probabilidades de seleção das UPAS combinadas com frações de amostragem adequadas nos estágios seguintes equiprobabilidade • Principal atrativo amostras de tamanhos aproximadamente iguais nas UPAs
Fração de amostragemPrimeiro estágio é o tamanho do setor i M é o número total de domicílios
Sorteio no 1º. estágioSorteio PPT - probabilidade proporcional ao tamanho 1º. passo – soma acumulada • considerando o setor censitário como UPA • a cada setor é atribuído um intervalo de números • tamanho do intervalo = número de domicílios de cada setor
Sorteio no 1º. estágioSorteio PPT - probabilidade proporcional ao tamanho • 2º. Passo – Calcula-se o intervalo de amostragem (total de domicílios / número de setores da amostra) • 3º. Passo – Sorteia-se um número aleatório dentro do 1º. intervalo (início casual) • 4º. Passo – Acumula-se o intervalo de amostragem sucessivamente • Os setores da amostra serão os que tiverem nos seus “intervalos de números” os números sorteados
No exemplo • Total de domicílios: 276080 • Total de setores da amostra: 70 • Intervalo de amostragem: 276080/70=3944 • Início casual entre 1 e 3944: 232 • Setor 02 é o primeiro setor sorteado (seu intervalo é 161 a 419) • Outros números sorteados: 232 + 3944 = 4176 (setor 22) 4176 + 3944 = 8120 (setor 44) 8120 + 3944 = 12064 (setor 68) ...
Fração de amostragemSegundo estágio • Se Mi é também o número de domicílios encontrado em campo (número atual de domicílios) • Ex: Mi=360 e b=120 f2=1/3 Será incluído na amostra 1 domicílio cada 30
Sorteio no 2º. estágio Sorteio de domicílios • Calcula-se o intervalo de amostragem domicílios do setor / b sendo b o número de domicílios a ser sorteado no setor • Sorteia-se um início aleatório no 1o. intervalo (início casual) • Soma-se o intervalo de amostragem sucessivamente • Os números assim identificados correspondem aos domicílios sorteados
Se Mi não é igual a tamanho atual1ª. opção • Seleção de domicílios com fração fixa (b/Mi) é o número de domicílios sorteado no setor é o número de domicílios do censo (utilizado no sorteio do 1º. estágio) é o número de domicílios existentes no momento da pesquisa (atual)
Se Mi não é igual a tamanho atual – 1ª. opção Vantagem • Fração de amostragem global é a mesma para todas as UPAs – amostra equiprobabilística Desvantagens • Sem controle do tamanho final da amostra • Número de domicílios nas UPAs podem variar muito
1ª opção • No exemplo: • Mas tamanho atual é 278 • Serão sorteados 46 domicílios que corresponde a 1/6 dos domicílios atualmente existentes.
Se Mi não é igual a tamanho atual 2ª. opção • Fixar b (o número de domicílios é o mesmo em todos os setores) • Frações de amostragem distintas nos setores ponderação
2ª opção • No exemplo: • Mas tamanho atual é 278 • Serão sorteados 43 domicílios mas a fração de amostragem nesse setor foi de 6,5
Peso do delineamentoPeso básico • Inverso da fração de amostragem • Se amostra equiprobabilística • Se há diferenças entre probabilidades utilizadas no sorteio, para cada elemento i
Peso do delineamento • Peso resultante da utilização de diferentes probabilidades de seleção inverso da fração de amostragem • Causas 1) tamanhos atuais das UPAs diferentes dos tamanhos utilizados em seu sorteio e sorteio de um número constante de domicílios nos setores 2) sorteio de números de elementos nos estratos ou domínios não proporcionais ao tamanho dos estratos/domínios
Ajuste de não resposta • Variável utilizada no ajuste – variável para a qual há informação também para os não respondentes. Usual – geográficas. • Suposição – em cada categoria da variável de ajuste os respondentes são amostras das pessoas sorteadas – as perdas são ao acaso • Dentro das categorias – amostra de respondentes é inflada para atingir número sorteado
Ajuste de pós estratificação • A distribuição da amostra segundo variáveis sóciodemográficas é igualada à distribuição da população • Utilização de dados da população - externos, portanto, à pesquisa.