520 likes | 722 Views
Pesquisa Experimental. Prof. Raul Sidnei Wazlawick UFSC-CTC-INE 2012. Pesquisa Observacional e Experimental. Numa pesquisa observacional (ou de levantamento ) as características de uma população são levantadas (observadas ou medidas), mas sem manipulação.
E N D
Pesquisa Experimental Prof. Raul Sidnei Wazlawick UFSC-CTC-INE 2012
Pesquisa Observacional e Experimental • Numa pesquisa observacional(ou de levantamento) as características de uma população são levantadas (observadas ou medidas), mas sem manipulação. • É o caso de um censo demográfico, pesquisas eleitorais, pesquisas de mercado, inspeção da qualidade, etc. • Em todos esses casos, se quer ter idéia de uma certa população tal qual ela é na natureza ou no processo. • Nas pesquisas experimentais, grupos de indivíduos (ou animais, ou objetos) são manipulados para se avaliar o efeito de diferentes tratamentos. • É o caso de se verificar o rendimento de um processo químico para diferentes temperaturas de reação, as quais são manipuladas de acordo com o interesse prático.
Pesquisa Experimental • População • Amostragem • Variáveis • Média e Variância • Correlação
Pesquisa Experimental • População • Amostragem • Variáveis • Média e Variância • Correlação
População • População é o conjunto de elementos (indivíduos, objetos, etc.) que formam o universo de nosso estudo e que são passíveis de serem observados, sob as mesmas condições. • Num processo de inspeção da qualidade, a população pode ser considerada como o conjunto de todos os itens que saem da linha de produção. • Numa pesquisa de mercado, a população é o conjunto de possíveis consumidores.
Pesquisa Experimental • População • Amostragem • Variáveis • Média e Variância • Correlação
Censo • A palavra censo refere-se à pesquisa de todos os elementos de uma população. • Geralmente realizamos um censo quando: • A população é pequena. • As variáveis são fáceis de serem medidas ou observadas. • Necessitamos resultados exatos.
amostragem POPULAÇÃO: todos os possíveis consumidores Amostra: um subconjunto dos consumidores inferência Amostragem • Grande parte das pesquisas científicas ou de resoluções de problemas de engenharia são feitos por amostragem, ou seja, observamos apenas um subconjunto de elementos da população. • A amostragem é particularmente interessante quando: • a população é grande ou infinita • as observações ou mensurações têm alto custo • as medidas exigem testes destrutivos • necessidade de rapidez • etc.
Técnicas de Amostragem • Amostragem aleatória simples. • Amostragem sistemática. • Amostragem estratificada. • Amostragem de conglomerados. • Convenção: • N é o tamanho da população • n é o tamanho da amostra
Amostragem aleatória simples • Para a seleção de uma amostra aleatória simples precisamos ter uma lista completa dos elementos da população. • Esse tipo de amostragem consiste em selecionar a amostra através de sorteios, sem restrição.
Amostragem Sistemática • Um processo mais simples é sortear o primeiro elemento e extrair os demais sistematicamente. • Mais especificamente: • calcula-se o intervalo de seleção, dado por l=N/n, desprezando as decimais. • sorteia-se o primeiro elemento do conjunto {1, 2, ..., I}; e • completa-se a amostra extraindo um elemento a cada I elementos.
Amostragem Estratificada • A técnica da amostragem estratificada consiste em dividir a população em subgrupos, que denominaremos de estratos. • Esses estratos devem ser internamente mais homogêneos do que a população toda, com respeito às variáveis em estudo.
Amostragem de Conglomerados • Tende a produzir uma amostra que gera resultados menos precisos, quando comparada com uma amostra aleatória simples de mesmo tamanho. • Contudo, seu custo financeiro tende a ser bem menor, especialmente em amostragens de grandes populações.
Amostragem Acidental ou a Esmo • Toma-se amostras a esmo (exemplo, alguns alunos em uma universidade). • Não produz resultados tão confiáveis quanto as outras formas.
Tamanho da Amostra • Um fator importante na determinação do tamanho da amostra é a variabilidade da população em termos da variável em estudo. • Por exemplo, uma amostra de sangue pode ser bem pequena, pois o sangue é razoavelmente homogêneo em nosso corpo. • Por outro lado, populações com variâncias grandes exigem amostras maiores
Outra questão importante é a relação entre tamanho da população (N) e tamanho da amostra (n). • Considerando uma precisão desejada para as estimativas de interesse, a relação entre N e n não é linear
Tamanho de Amostra • Toda amostra comporta um erro amostral, que é a diferença entre o parâmetro obtido e o seu valor real (média, por exemplo). • Pode-se calcular um tamanho mínimo de amostra para permitir um erro amostral mínimo (E) dentro de um determinado nível de confiança.
A dificuldade para obter este tamanho de amostra para garantir um erro mínimo é que muitas vezes a variância da população não é conhecida a priori. • Em alguns casos essa variância pode ser obtida a partir de uma amostragem piloto.
Uma amostra muito grande custará muito caro e levará muito tempo para ser verificada. • Uma amostra muito pequena poderá apresentar grande erro. • Portanto, deve-se determinar o tamanho mínimo da amostra para encontrar uma proporção em uma população finita.
Pesquisa Experimental • População • Amostragem • Variáveis • Média e Variância • Correlação
Variáveis • Uma variável, é o nome que se dá a um fenômeno que pode ser medido e que varia conforme a medição. • Se não variasse seria uma constante e não teria maior interesse para a pesquisa.
Definições constitutivas e operacionais • Definições constitutivas são definições de dicionário • Uma definição operacional atribui significado a um constructo ou variável especificando as atividades ou “operações” necessárias para medi-lo ou manipulá-lo.
Variáveis discretas e contínuas • O domínio de uma variável pode ser discreto ou contínuo. • A idéia de contínuo vem do fato de que entre dois valores sempre existe um terceiro. • Já as variáveis discretas assumem seus valores em conjuntos cujos elementos podem ser ordenados ou em conjuntos finitos (categóricas).
Variável Medida • Uma variável medida é aquela cujo fenômeno vai ser observado pelo pesquisador. • Por exemplo, quantas vezes um usuário de uma ferramenta vai olhar no manual para obter informações para desempenhar a tarefa que lhe foi proposta. • Essa variável tem como domínio o conjunto dos números naturais e seus valores não são determinados pelo observador, mas simplesmente medidos.
Variável Manipulada • A variável manipulada é aquela que o experimentador vai deliberadamente modificar para realizar seu experimento. • Por este motivo, esse tipo de variável também é chamado de variável experimental.
Mas porque pesquisadores manipulam uma ou mais variáveis enquanto observam outras? • É porque eles querem encontrar dependências entre essas variáveis. • A princípio pode-se testar a dependência entre quaisquer variáveis manipuladas e observadas. • Mas nem sempre esse teste fará sentido. • Antes de analisar uma dependência experimentalmente o pesquisador usualmente desenvolve uma teoria ou hipótese.
Variáveis Dependentes e Independentes • A variável independente é aquela que, se supõe, influencia outra. • A variável dependente é a influenciada. • Dependência pode ser medida por correlação.
Para chegar na correlaçãoprecisaremos antes de um pouco de matemática.
Pesquisa Experimental • População • Amostragem • Variáveis • Média e Variância • Correlação
Média • Usualmente a média é considerada uma medida importante na avaliação de conjuntos de valores • Por exemplo, ao avaliar um determinado sistema, o pesquisador contabiliza o tempo de interação de cada pessoa dentre um conjunto previamente definido.
Média • Por exemplo, se quatro pessoas foram analisadas e os tempos medidos em minutos foram 10, 12, 14, 9, então se pode dizer que o tempo médio observado foi de 11,25 minutos.
Variância • Considere-se as três séries de valores abaixo: • <10, 12, 14, 9> • <1, 20, 2, 22> • <11, 11, 11, 12> • É possível notar certa semelhança entre elas? • Aparentemente são conjuntos bem diferentes. • Mas todos têm a mesma média: 11,25.
Variância • A observação do distanciamento dos elementos em relação à média é chamada de variância. • Então, além da média, o pesquisador deve ficar atento também à variância do conjunto de valores, já que esta complementa a caracterização do conjunto.
Cálculo da variância • Para cada elemento, subtraia a média do conjunto deste elemento: <10-11,25, 12-11,25, 14-11,25, 9-11,25> = <-1,25, 0,75, 2,75, -2,25> <1-11,25, 20-11,25, 2-11,25, 22-11,25> = <-10,25, 8,75, -9,25, 10,75> <11-11,25, 11-11,25, 11-11,25, 12-11,25> = <-0,25, -0,25, -0,25, 0,75> Agora, cada valor representa a distância do elemento para a média do conjunto
Eleve os valores resultantes ao quadrado: <-1,252, 0,752, 2,752, -2,252> = <1,5625, 0,5625, 7,5625, 5,0625> <-10,252, 8,752, -9,252, 10,752> = <105,0625, 76,5625, 85,5625, 115,5625> <-0,252, -0,252, -0,252, 0,752> = <0,0625, 0,0625, 0,0625, 0,5625> Isso faz com que todas as distâncias fiquem positivas e aumenta a influência de elementos mais distantes da média.
Some os resultados: 1,5625+0,5625+7,5625+5,0625 = 14,75 105,0625+76,5625+85,5625+115,5625 = 382,75 0,0625+0,0625+0,0625+0,5625 = 0,75 Isso gera um valor absoluto da variância acumulada
Divida pelo número de elementos do conjunto menos 1: 14,75/3 = 4,9166... 382,75/3 = 127,5833... 0,75/3 = 0,25 Isso gera a distância média, ou seja, independente do número de elementos no conjunto. Poderia ser n ao invés de n-1, mas a variância de um conjunto com apenas 1 elemento deve ser indeterminada.
é a variância do conjunto X representa cada um dos elementos do conjunto X é a média do conjunto X é o número de elementos do conjunto X
Desvio-Padrão • O desvio-padrão é uma medida também bastante utilizada para analisar conjuntos e é definido simplesmente como a raiz quadrada da variância
Pesquisa Experimental • População • Amostragem • Variáveis • Média e Variância • Correlação
Dependência • Variáveis manipuladas realmente influenciam as variáveis experimentais? • Existe dependência entre elas? • A co-variância pode dizer!
Co-variância (exemplo) • O valor de pontos de caso de uso estimado por um método Y produz uma estimativa melhor do que um outro método Y’? • Onde “melhor” significa com “alta dependência em relação ao conjunto de tempos X”.
Covariância de Y 149,2 / 9 = 16,57777...
Covariância de Y’ -70,4 / 9 = -7,822222...
Correlação • É uma medida de variância normalizada (entre -1 e 1)
Voltando ao exemplo • Correlação de Y e X: 0,928041193. • Correlação de Y’ e X: -0,39445403. • Existe correlação entre Y e X? • Existe correlação entre Y’ e X?
Valores mínimos de correlação para ser considerada significativa com 95% de certeza.