330 likes | 440 Views
ESTATÍSTICA. Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com. Estatística: o que é?.
E N D
ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com
Estatística: o que é? • O primeiro uso da palavra ESTATÍSTICA parece datar de 1589 (dc) e apareceu em um trabalho do historiador Girolomo Ghilini, quando se referiu a uma “ciência civil, política, estatística e militar”. (Berquó, 1981) • As expressões “statistics”, “statist” e “statistical” parecem ter sido derivadas do latim status com duplo significado: estado político e situação das coisas.
DEFINIÇÃO • No Aurélio (primeira edição) apresentam-se as seguintes definições: • Parte da matemática em que se investigam os processos de obtenção, organização e análise de dados sobre uma população ou uma coleção de seres quaisquer, e os métodos de tirar conclusões e fazer ilações ou predições com base nesses dados;
DEFINIÇÃO • Qualquer parâmetro de uma amostra, como, por exemplo, a sua média, o seu desvio-padrão, a sua variância.
Cronologia de Alguns Conceitos e FatosImportantes da Estatística Antes de Cristo: • 5000 - Registros egípcios de presos de guerra • 3000 - Jogos de dados (Objetos de ossos) • 2000 - Censo Chinês • 1100 - Registros de dados em livros da Dinastia Chinesa • 585 - Thales de Mileto usa a geometria dedutiva • 540 - Pitágoras (Aritmética e Geometria) • 430 - Philolaus obtém dados de Astronomia e Hippocrates estuda doenças a partir da coleta de dados
400 - Estabelecido o Censo Romano - Descrição detalhada de coleta de dados em livros de Constantinopla • 100 - Horácio usa um ábaco de fichas como instrumento de “cálculo portátil” • 120 - Menelaus apresenta tabelas estatísticas cruzadas • 620 - Surge em Constantinopla um Primeiro Bureau de Estatística • 695 - Utilização da média ponderada pelos árabes na contagem de moedas • 826 - Os árabes usam cálculos estatísticos na tomada de Creta • 840 - O astrônomo persa Yahyâ Abî Mansûr apresenta tabelas de dados de astronomia
1303 - Origem dos números combinatórios (Shihchieh Chu) • 1405 - O persa Ghiyat Kâshî realiza os primeiros cálculos de probabilidade com a fórmula do binômio • 1447 - Surgem as primeiras tabelas de mortalidade construídas pelos sábios do Islã • 1530 - Lotto de Firenze – Primeira Loteria Pública • 1550 - Número Combinatório (Cardano) • 1654 - Pierre de Fermat e Blaise Pascal estabelecem os Princípios do Cálculo das Probabilidades
1656 - Huygens publica o primeiro tratado de Probabilidade • 1660 - Fundação da Royal Society of London • 1662 - Primeiros estudos demográficos (Graunt) • 1679 - Distribuição de Pascal, Tratado do Triângulo Aritmético e conceito de Valor Esperado (Pascal) • 1693 - Edmund Halley publica tabelas de mortalidade e cria os fundamentos da Atuária • 1713 - Distribuição Binomial (Bernoulli) • 1718 – De Moivre publica Doutrina das Chances • 1730 - Distribuição Normal (De Moivre) e Fórmula de Stirling para n!
1733 - Teorema Central do Limite (De Moivre) • 1763 - Inferência Estatística (Reverendo Thomas Bayes) • 1764 - Probabilidade Condicional e Teorema de Bayes • 1775 - William Morgan se torna o primeiro atuário • 1777 - Primeiro exemplo de uso da verossimilhança na estimação de parâmetro (Daniel Bernoulli) • 1800 - A França estabelece o seu Bureau de Estatística
1800 - A França estabelece o seu Bureau de Estatística • 1805 - Método dos Mínimos Quadrados (Legendre) • 1810 - Teorema Central do Limite (Laplace) • 1812 - Théorie Analytique des Probabilités – sendo a base da Inferência (Laplace) • 1820 - Várias sociedades de Estatística são criadas • 1834 - Primeiro Computador Analítico (Charles Babbage) e Fundação do Journal of the Royal Statistical Society – B • 1835 - Lei dos Grandes Números (Poisson)
1836 - Distribuição Gama • 1837 - Distribuição de Poisson • 1839 - Fundação da American Statistical Association (ASA) • 1846 - Uso de Quantis (Quetelet) • 1853 - Distribuição de Cauchy e Primeira Conferência Internacional de Estatística em Bruxellas (Quetelet) • 1867 - Desigualdade de Chebyshev
1885 – Fundação do ISI (International Statistical Institute) • 1887 - Teoria de Regressão (Galton) e Índice de Marshall • 1892 - Coeficiente de Correlação (Edgeworth) • 1894 - Método dos Momentos e Uso pela primeira vez dos termos momento e desvio padrão (Karl Pearson) • 1895 - Sistema de Distribuições e Coeficiente de Variação (Karl Pearson) • 1896 - Métodos de Captura e Recaptura (Petersen) • 1897 - Coeficiente de Correlação de Produto de Momentos (Pearson e Sheppard) e Distribuição de Pareto
1900 - Teste Qui-quadrado (Karl Pearson), Cadeias de Markov e Coeficiente de Associação (Yule) • 1901 - Fundação da Biometrika (Pearson, Weldon e Galton) • 1904 - Análise Fatorial (Spearman), Coeficiente de Contingência (K. Pearson), Coeficiente de Spearman e Expansão de Edgeworth • 1908 - Distribuição nula do coeficiente de correlação e distribuição t de Student (William Gosset) e Análise Fatorial (Spearman) • 1912 - Método de Máxima Verossimilhança (Sir Ronald Fisher) e Índice de Gini • 1922 - Definição de Verossimilhança, Consistência e Suficiência (Fisher) e Prova Rigorosa do Teorema Central do Limite (Lindeberg)
1923 - Tabela ANOVA (Fisher) e Processo de Wiener • 1925 - Livro Clássico “Statistical Methods for Research Workers”, Método escore para parâmetros e definição de p-valor (Fisher) • 1926 - Planejamento de Experimentos (Fisher) e Conceito de Hipótese Altermativa (Gosset) • 1928 - Distribuições Não- Centrais (Fisher), Intervalos de Confiança, Razão de Verossimilhanças e Poder dos Testes (Neyman e Pearson) e Distribuição de Wishart • 1930 -Controle de Qualidade nas indústrias, Inferência Fiducial (Fisher) e Distância de Mahalanobis, Tempo Médio de Espera na Fila M/G/1 (Pollaczek) e Fundação da Econometrica • 1931 - Noção de Espaco Amostral (von Mises), Cartas de Controle de Qualidade (Shewhart) e Teste de Fisher-Yates
1932 - Distribuição de Gumbel • 1933 - Lema de Neyman & Pearson, Distância de Kolmogorov, Componentes Principais (Hotteling), Fundamentos de Probabilidade (Kolmogorov) e Permutabilidade (DeFinetti) • 1934 - Estatística Ancilar, Família Exponencial e Princípios da Verossimilhança (Fisher), Distribuição F (Snedecor), Análise de Confluência (Frisch) e Teorema de Cochran • 1938 - Distribuição Assintótica da Razão de Verossimilhanças (Wilks) • 1939 - Distribuição de Weibull e início dos Métodos Bayesianos (Jeffreys) • 1976 - Enfoque Bayesiano em Modelos de Espaço de Estados (Harrison e Stevens)
1977 - Algoritmo EM (Dempster, Laird e Rubin), Análise Exploratória de Dados (Tukey), Distribuições g e h (Tukey) e Performance dos estimadores de MV em pequenas amostras (Bowman e Shenton) • 1990 - Métodos MCMC no contexto Bayesiano (Gelfand e Smith) e Mineração de Dados (“Data Mining”), Momentos L (Hosking) e Teoria da Perturbação Estocástica (Stewart)
Ao longo do século XX, os métodos estatísticos foram desenvolvidos como uma mistura de ciência, tecnologia e lógica para a solução e investigação de problemas em várias áreas do conhecimento humano.
Estatística • Conjunto de técnicas e métodos de pesquisa que entre outros tópicos envolve o planejamento do experimento a ser realizado, a coleta qualificada dos dados, a inferência, o processamento, a análise e a disseminação das informações.
Estatística • Ciência que tem por objetivo, fornecer métodos e técnicas para lidarmos, racionalmente, com situações sujeitas a incertezas.
As aplicações da Estatística • Na prática, a Estatística pode ser empregada como ferramenta fundamental/multidisciplinar em várias outras ciências. • Na área médica, por exemplo, a Estatística fornece metodologia adequada que possibilita decidir sobre a eficiência de um novo tratamento no combate à determinada doença.
As informações estatísticas são concisas, específicas e eficazes, fornecendo assim subsídios imprescindíveis para as tomadas racionais de decisão. Neste sentido, a Estatística fornece ferramentas importantes para que as empresas e instituições possam definir melhor suas metas, avaliar sua performance, identificar seus pontos fracos e atuar na melhoria contínua de seus processos.
A Estatística subdivide-se em três áreas: • descritiva • probabilística e • inferencial.
A Estatística Descritiva • Como o próprio nome já diz, se preocupa em descrever os dados. A estatística inferencial, fundamentada na teoria das probabilidades, se preocupa com a análise destes dados e sua interpretação. • A estatística descritiva, cujo objetivo básico é o de sintetizar uma série de valores de mesma natureza, permitindo dessa forma que se tenha uma visão global da variação desses valores, organiza e descreve os dados de três maneiras: por meio de tabelas, de gráficos e de medidas descritivas.
CONCEITOS FUNDAMENTAIS E DEFINIÇÕES Para se obter bons resultados numa análise estatística, além dos métodos aplicados, também é necessário ter clareza nos conceitos utilizados. A seguir são apresentados alguns desses conceitos.
A estatística trabalha com dados, os quais podem ser obtidos por meio de uma população ou de uma amostra, definida como: • População: conjunto de elementos que tem pelo menos uma característica em comum. Esta característica deve delimitar corretamente quais são os elementos da população que podem ser animados ou inanimados.
Amostra: subconjunto de elementos de uma população. Este subconjunto deve ter dimensão menor que o da população e seus elementos devem ser representativos da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhecimento que se tem da população e da quantidade de recursos disponíveis. A estatística inferencial é a área que trata e apresenta a metodologia de amostragem.
Após a determinação dos elementos pergunta-se: o que fazer com estes? Pode-se medi-los, observá-los, contá-los surgindo um conjunto de respostas que receberá a denominação de variável.
Variável: é a característica que vai ser observada, medida ou contada nos elementos da população ou da amostra e que pode variar, ou seja, assumir um valor diferente de elemento para elemento. • Não basta identificar a variável a ser trabalhada, é necessário fazer-se distinção entre os tipos de variáveis:
Tipos de variáveis • Alguns conjuntos de dados consistem em números, enquanto outros são não numéricos. Utiliza-se a nomenclatura de dados (ou variáveis) qualitativos e quantitativos. Variáveis Quantitativas Qualitativas Discretas Contínuas
Tipos de Variáveis • As variáveis podem ser categóricas (qualitativas) ou numéricas (quantitativas) • Variáveis qualitativas:São características de uma população que não pode ser medidas. • Ordinais – Ex: Grau de gravidade de uma doença • Nominais – Ex: Presença de um sintoma • Variáveis quantitativas: São características de uma população que pode ser quantificadas. • Discretas – Ex: Número de cirurgias • Contínuas– Ex:Idade, Pressão Arterial
Exercícios: Identifique cada número como discreto ou contínuo • Cada cigarro Camel tem 16,13 mg de alcatrão 2. O altímetro de um avião da American Airlines indica uma altitude de 21.359 pés 3. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinante de um serviço de informação on-line. 4. O tempo total gasto anualmente por um motorista de táxi de Nova York ao dar passagem a pedestres é de 2367 segundos. Apresente dois exemplos de dados discretos ou contínuos de sua empresa / pesquisa.