620 likes | 768 Views
O que é Estatística, afinal de contas?. Estatística é o ramo da Matemática que estuda métodos para: Coletar, Organizar, Apresentar e Analisar dados. Com o objetivo de desenvolver ferramentas que auxiliem a tomada de decisões. 1. Os dados podem ter duas formas: 1. Categorias
E N D
O que é Estatística, afinal de contas? Estatística é o ramo da Matemática que estuda métodos para: • Coletar, • Organizar, • Apresentar e • Analisar dados. Com o objetivo de desenvolver ferramentas que auxiliem a tomada de decisões. 1
Os dados podem ter duas formas: 1. Categorias Ordinais ou Nominais 2. Numéricos Discretos ou Contínuos 2
Conceitos • Dados Bruto • Rol • Amplitude Total • Base de Dados é uma coleção de observações • Observações é um conjunto de valores de um mesmo indivíduo ou objeto. • Variável é uma seqüência de medidas de uma mesma característica. • Dados é o valor assumido da variável de uma observação. 3
Conceitos • População é o conjunto formado por indivíduos ou objetos que tem pelo menos uma variável comum e observável. • Amostra é qualquer subconjunto de uma população 4
Formas de Representação de Dados • Os dados coletados em uma pesquisa podem ser representados por meio de: • Tabelas (normalmente banco de dados) • Gráficos Ex.: Gráficos de Barras, Pizza, Diagrama de Pareto, etc... 5
Tabelas 6
Organização de Dados Numéricos Diagramas de folhas Ordenados Dados Numéricos Histogramas Distribuições Tabelas Polígonos 9
Distribuição de Frequências • Forma de representar dados ou categorias a partir das quantidades de cada uma das suas classes • Tabelas de distribuição acumulada • Histogramas 10
Medidas de Posição As medidas de Posição (ou de Tendência Central) são medidas que procuram representar, quando organizados em ordem crescente (ou decrescente) os termos centrais de uma amostra. • As principais medidas de posição são: • Média Aritmética • Mediana • Moda 14
Média Aritmética Considere um conjunto de dados (x1, x2, x3, ..., xi, ..., xn) a média aritmética entre esses números é dada por 15
Mediana Considere um conjunto com n números organizado em ordem crescente (ou decrescente) a mediana desse conjunto é Se n é ímpar então a mediana é Se n é par então a mediana é 16
Moda Considere um conjunto com n números, dizemos que a moda é o número mais frequente. Observações: Podemos ter mais de uma moda. Podemos não ter moda. 17
Medidas de Dispersão Medidas de dispersão objetivam mensurar a regularidade de um conjunto de números. • Algumas Medidas de Dispersão • Amplitude • Desvio Médio Absoluto • Variância • Desvio Padrão 18
Amplitude É a diferença entre o maior número e o menor número do conjunto. Vantagens X Desvantagens 19
Desvio Absoluto Considere um conjunto de dados (x1, x2, x3, ..., xi, ..., xn) com média o desvio médio absoluto será dado por 20
Variância Considere um conjunto de dados (x1, x2, x3, ..., xi, ..., xn) com média a variância será dado por 21
Desvio Padrão Considere um conjunto de dados (x1, x2, x3, ..., xi, ..., xn) com média o desvio padrão será dado por 22
Distribuições Discretas São exemplos de distribuições discretas Distribuição Uniforme Distribuição Binomial 23
Distribuições Contínuas São exemplos de distribuições discretas Distribuição Uniforme Distribuição Normal Distribuição Exponencial 24
Valor Esperado e Variância de uma Distribuição Valor esperado de uma distribuição Variância de uma distribuição 25
Distribuição Binomial Se p é a probabilidade de um evento acontecer em uma única tentativa ( sucesso ) e q = 1 – p é a de que o evento não ocorra ( insucesso ), então a probabilidade do evento ocorrer exatamente X vezes, em N tentativas é dado por: Média = µ = np Variância = σ2 =npq Desvio padrão = σ = 26
Distribuição Normal Distribuição de probabilidade contínua cuja função é Com média µ e desvio padrão σ. 27
Conceito Amostragem é o processo de seleção de um conjunto de indivíduos pertencente a uma população, de modo que as características dessa população possa ser estudada através dessa seleção. Uma amostra pode ser selecionada com reposição ou sem reposição. 29
Conceito População e Amostra Qualquer conjunto de elementos ou indivíduos apresentando uma característica comum, toma o nome de população. Fixada uma população, qualquer conjunto constituído unicamente por elementos dessa população é denominada amostra dessa população. 30
Conceito • Sendo • N número de elementos na população • n número de elementos na amostra. • O número de amostras, com reposição, de tamanho n que podemos obter de uma população de N n elementos é Nn. • O número de amostras, sem reposição, de tamanho n que podemos obter de uma população de elementos é 31
Vantagens de Censos Estudo de populações muito pequenas Informações requeridas para pequenas áreas geográficas ou classificações muito detalhadas Permite construção de cadastros 32
Vantagens da Amostragem Custo menor Velocidade maior Tempo menor Precisão controlada Redução da carga de coleta sobre unidades da população Necessidades especializadas 33
Obtenção de uma Amostra • Os passos principais para a obtenção de uma amostra são • Definição de OBJETIVOS e RECURSOS • Obtenção do CADASTRO • Planejamento e SELEÇÃO da amostra • ESTIMAÇÃO das quantidades de interesse • AVALIAÇÃO da qualidade das estimativas 34
Tipos de Amostras • As amostras podem ser probabilísticas ou não probabilísticas • Dentre as amostras probabilísticas podemos ter • Aleatórias • Sistemáticas • Estratificadas • Conglomeradas (Clusters) 35
Amostra Aleatória simples Uma amostra de uma população é denominada aleatória simples quando é escolhida ao acaso (sem a adoção de nenhum critério prévio) dentro da população. Essa seleção pode ocorrer com ou sem reposição do elemento. 36
Amostras Sistemáticas Uma amostra de uma população é denominada sistemática quando dividimos a população em subconjuntos e dentro de cada subconjunto os elementos são escolhidos ao acaso. Note que essa forma de obter amostras é similar à aleatória simples. 37
Amostras Extratificadas Uma amostra de uma população é denominada estratificada quando dividimos a população em subconjuntos, porém agora seguindo algum critério e, dentro de cada subconjunto os elementos são escolhidos ao acaso. Note que essa forma de obter amostras difere da sistemática por existir um critério para a divisão da população. 38
Amostras Cluster Uma amostra de uma população é denominada estratificada quando dividimos a população em subconjuntos, porém agora seguindo diversos critérios e, dentro de cada subconjunto os elementos são escolhidos ao acaso. Note que essa forma de obter amostras difere da estratificada por existirem diversos critérios para a mesma divisão da população. 39
Inferência Estatística Consiste no estudo do comportamento da população e suas características, através de amostras extraídas dessa população. Tais amostras devem ser relacionadas de modo a preservar as mesmas características e comportamento da população. 40
Estimação Processo de generalizar a informação da amostra para a população da qual foi tirada Estimador é a expressão matemática do processo de cálculo das estimativas Estimativa é o valor de um estimador calculado com a amostra observada para estimar a quantidade populacional de interesse 41
Distribuição por Amostragem Considere-se uma amostra aleatória simples de tamanho n: X1, X2, ..., Xn proveniente de uma população definida pela variável aleatória X, com função de distribuição F(X). Chama-se estatística dessa amostra a qualquer função g(X1, X2, ..., Xn ), dos seus valores X1, X2, ..., Xn. Quando se consideram todas as realizações da amostra, os valores das estatísticas mencionadas definem uma distribuição de probabilidade que coincide com aquela da variável aleatória g(X1, X2, ..., Xn), que se denomina distribuição por amostragem da característica g(X1, X2, ..., Xn). 42
Distribuição por Amostragem Seja uma amostra de um universo X com média µ e variância σ2. Seja a média amostral de uma amostra aleatória de tamanho n, então: 43
Teste de Hipótese Teste de Hipótese é um conjuntos de procedimentos que permitem verificar a validade ou não de uma suposição sobre uma população. A base para essa verificação são as informações fornecidas por uma amostra aleatória. Formulada uma hipótese sobre a população são obtidas as informações através de uma amostra aleatória. 44
Hipóteses Hipótese Básica ou hipótese nula é a hipótese a ser validada pelo teste – H0 Hipótese alternativa é a hipótese contraria a hipótese nula – H1 Erro do primeiro tipo : Rejeitar a hipótese nula quando ela for verdadeira. Erro do segundo tipo : Aceita a hipótese nula quando ela for falsa. 45
Hipóteses O nível de significância: é a probabilidade do erro do primeiro tipo P(aceita H1/H0 verdadeiro ) = α Grau de confiança do teste: é a probabilidade de aceitar a hipótese nula, quando ela for verdadeira P(H0/H0)= 1 α Probabilidade de ocorrência do erro do segundo tipo: é a probabilidade de aceitar a hipótese nula quando ela for falsa P(H0/H1) = β 46
Avaliações 47
Testes paramétricos Teste de média. H0) µ = µ0 H1) µ µ0 O estimador ótimo do parâmetro θ da população, no caso µ, permitirá medir a divergência entre as informações da amostra e o verdadeiro valor do parâmetro do universo. O estimador ótimo de µ é 48
Critérios de Decisão Realizada a amostra de tamanho n, calculamos que é o valor observado de Se L1 < < L2 ⇒Aceita-se H0, com um nível de significância α. Se [ L1 ; L2 ] ⇒ Rejeita-se H0 49
Testes Paramétricos Teste de média. H0) µ = µ0 H1) µ < µ0 Se > L ⇒Aceita-se H0 , com um nível de significância α. Se < L ⇒ Rejeita-se H0 50