480 likes | 650 Views
SEMINÁRIOS EM CIÊNCIAS ATUARIAIS E ESTATÍSTICA. 2009. Seminários em Ciências Atuariais e Estatística – MAD236. Horário: quartas de 13-15h Sala: LIG- sala 02 Professores responsáveis: Natalie H. Hurtado e Marina Paez. Cronograma. Datas dos seminários: Março 18, 25
E N D
Seminários em Ciências Atuariais e Estatística – MAD236 • Horário: quartas de 13-15h • Sala: LIG- sala 02 • Professores responsáveis: Natalie H. Hurtado e Marina Paez
Cronograma Datas dos seminários: Março18, 25 Abril 01, 08, 15, 29 Maio 06, 13, 20, 27 Junho 03, 10 São ao todo 12 seminários.
Informações importantes • A presença é obrigatória! O(a) aluno(a) poderá ter no máximo duas faltas. • A avaliação será com base em dois relatórios de temas a serem escolhidos entre os seminários apresentados. • Relatório 1 Escolha entre o seminário de 18 de março e 29 de abril, para ser entregue no dia 6 de maio. • Relatório 2 Escolha entre o seminário de 6 de maio e 10 de junho, para ser entregue no dia 17 de junho. • Na avaliação também será levado em conta a participação nos seminários.
Página de informações da disciplina • http://www.haanwinckel.com/seminarios/2009.html
Cronologia de Alguns Conceitos e FatosImportantes da Estatística(Gauss M. Cordeiro, 2006) Antes de Cristo: • 5000 - Registros egípcios de presos de guerra • 3000 - Jogos de dados (Objetos de ossos) • 2000 - Censo Chinês • 1100 - Registros de dados em livros da Dinastia Chinesa • 585 - Thales de Mileto usa a geometria dedutiva • 540 - Pitágoras (Aritmética e Geometria) • 430 - Philolaus obtém dados de Astronomia e Hippocrates estuda doenças a partir da coleta de dados • 400 - Estabelecido o Censo Romano - Descrição detalhada de coleta de dados em livros de Constantinopla • 100 - Horácio usa um ábaco de fichas como instrumento de “cálculo portátil”
Depois de Cristo: • 120 - Menelaus apresenta tabelas estatísticas cruzadas • 620 - Surge em Constantinopla um Primeiro Bureau de Estatística • 695 - Utilização da média ponderada pelos árabes na contagem de moedas • 826 - Os árabes usam cálculos estatísticos na tomada de Creta • 840 - O astrônomo persa Yahyâ Abî Mansûr apresenta tabelas de dados de astronomia • 1303 - Origem dos números combinatórios (Shihchieh Chu) • 1405 - O persa Ghiyat Kâshî realiza os primeiros cálculos de probabilidade com a fórmula do binômio • 1447 - Surgem as primeiras tabelas de mortalidade construídas pelos sábios do Islã • 1530 - Lotto de Firenze – Primeira Loteria Pública • 1550 - Número Combinatório (Cardano)
continuação • 1654 - Pierre de Fermat e Blaise Pascal estabelecem os Princípios do Cálculo das Probabilidades • 1656 - Huygens publica o primeiro tratado de Probabilidade • 1660 - Fundação da Royal Society of London • 1662 - Primeiros estudos demográficos (Graunt) • 1679 - Distribuição de Pascal, Tratado do Triângulo Aritmético e conceito de Valor Esperado (Pascal) • 1693 - Edmund Halley publica tabelas de mortalidade e cria os fundamentos da Atuária • 1713 - Distribuição Binomial (Bernoulli) • 1718 – De Moivre publica Doutrina das Chances • 1730 - Distribuição Normal (De Moivre) e Fórmula de Stirling para n! • 1733 - Teorema Central do Limite (De Moivre) • 1763 - Inferência Estatística (Reverendo Thomas Bayes) • 1764 - Probabilidade Condicional e Teorema de Bayes • 1775 - William Morgan se torna o primeiro atuário
1777 - Primeiro exemplo de uso da verossimilhança na estimação de parâmetro (Daniel Bernoulli) • 1800 - A França estabelece o seu Bureau de Estatística • 1805 - Método dos Mínimos Quadrados (Legendre) • 1810 - Teorema Central do Limite (Laplace) • 1812 - Théorie Analytique des Probabilités – sendo a base da Inferência (Laplace) • 1820 - Várias sociedades de Estatística são criadas • 1834 - Primeiro Computador Analítico (Charles Babbage) e Fundação do Journal of the Royal Statistical Society - B • 1835 - Lei dos Grandes Números (Poisson) • 1836 - Distribuição Gama • 1837 - Distribuição de Poisson • 1839 - Fundação da American Statistical Association (ASA)
1846 - Uso de Quantis (Quetelet) • 1853 - Distribuição de Cauchy e Primeira Conferência Internacional de Estatística em Bruxellas (Quetelet) • 1867 - Desigualdade de Chebyshev • 1876 - Primeiro uso de um Método do tipo Monte Carlo (Forest) • 1885 – Fundação do ISI (International Statistical Institute) • 1887 - Teoria de Regressão (Galton) e Índice de Marshall • 1892 - Coeficiente de Correlação (Edgeworth) • 1894 - Método dos Momentos e Uso pela primeira vez dos termos momento e desvio padrão (Karl Pearson) • 1895 - Sistema de Distribuições e Coeficiente de Variação (Karl Pearson) • 1896 - Métodos de Captura e Recaptura (Petersen) • 1897 - Coeficiente de Correlação de Produto de Momentos (Pearson e Sheppard) e Distribuição de Pareto • 1900 - Teste Qui-quadrado (Karl Pearson), Cadeias de Markov e Coeficiente de Associação (Yule)
1901 - Fundação da Biometrika (Pearson, Weldon e Galton) • 1904 - Análise Fatorial (Spearman), Coeficiente de Contingência (K. Pearson), Coeficiente de Spearman e Expansão de Edgeworth • 1908 - Distribuição nula do coeficiente de correlação e distribuição t de Student (William Gosset) e Análise Fatorial (Spearman) • 1912 - Método de Máxima Verossimilhança (Sir Ronald Fisher) e Índice de Gini • 1922 - Definição de Verossimilhança, Consistência e Suficiência (Fisher) e Prova Rigorosa do Teorema Central do Limite (Lindeberg) • 1923 - Tabela ANOVA (Fisher) e Processo de Wiener • 1925 - Livro Clássico “Statistical Methods for Research Workers”, Método escore para parâmetros e definição de p-valor (Fisher) • 1926 - Planejamento de Experimentos (Fisher) e Conceito de Hipótese Altermativa (Gosset) • 1928 - Distribuições Não- Centrais (Fisher), Intervalos de Confiança, Razão de Verossimilhanças e Poder dos Testes (Neyman e Pearson) e Distribuição de Wishart • 1930 -Controle de Qualidade nas indústrias, Inferência Fiducial (Fisher) e Distância de Mahalanobis, Tempo Médio de Espera na Fila M/G/1 (Pollaczek) e Fundação da Econometrica • 1931 - Noção de Espaco Amostral (von Mises), Cartas de Controle de Qualidade (Shewhart) e Teste de Fisher-Yates
1932 - Distribuição de Gumbel • 1933 - Lema de Neyman & Pearson, Distância de Kolmogorov, Componentes Principais (Hotteling), Fundamentos de Probabilidade (Kolmogorov) e Permutabilidade (DeFinetti) • 1934 - Estatística Ancilar, Família Exponencial e Princípios da Verossimilhança (Fisher), Distribuição F (Snedecor), Análise de Confluência (Frisch) e Teorema de Cochran • 1938 - Distribuição Assintótica da Razão de Verossimilhanças (Wilks) • 1939 - Distribuição de Weibull e início dos Métodos Bayesianos (Jeffreys) • 1976 - Enfoque Bayesiano em Modelos de Espaço de Estados (Harrison e Stevens) • 1977 - Algoritmo EM (Dempster, Laird e Rubin), Análise Exploratória de Dados (Tukey), Distribuições g e h (Tukey) e Performance dos estimadores de MV em pequenas amostras (Bowman e Shenton) • 1990 - Métodos MCMC no contexto Bayesiano (Gelfand e Smith) e Mineração de Dados (“Data Mining”), Momentos L (Hosking) e Teoria da Perturbação Estocástica (Stewart)
Estatística: o que é? • O primeiro uso da palavra ESTATÍSTICA parece datar de 1589 (dc) e apareceu em um trabalho do historiador Girolomo Ghilini, quando se referiu a uma “ciência civil, política, estatística e militar”. (Berquó, 1981) • As expressões “statistics”, “statist” e “statistical” parecem ter sido derivadas do latim status com duplo significado: • estado político; e situação das coisas.
DEFINIÇÃO • No Aurélio (primeira edição) apresentam-se as seguintes definições: • Parte da matemática em que se investigam os processos de obtenção, organização e análise de dados sobre uma população ou uma coleção de seres quaisquer, e os métodos de tirar conclusões e fazer ilações ou predições com base nesses dados; • Qualquer parâmetro de uma amostra, como, por exemplo, a sua média, o seu desvio-padrão, a sua variância.
Estatística: o que é ? Para Sir Ronald A. Fisher (1890-1962): Estatística é o estudo das populações, das variações e dos métodos de redução de dados.
“Eu gosto de pensar na Estatística como a ciência de aprendizagem a partir dos dados... “ Estatística: o que é? Jon KettenringPresidente da American Statistical Association, 1997
Estatística: o que é? • Uma boa definição é “Estatística é um conjunto de técnicas e métodos que nos auxiliam no processo de tomada de decisão na presença de incerteza.”
A Incerteza • A incerteza esta presente em todos os momentos em nossa vida. • Toda atividade humana é baseada em previsões e tomadas de decisão sob incerteza. • Por exemplo, a decisao de carregar um guarda-chuvas ou o horario de sair de casa para chegar a universidade.
Estatística: o que é? • Calyampudi R. Rao (1920- ), um estatístico indiano famoso apresenta a seguinte equação: Essa parte da equação Representa o papel fundamental do estatístico conhecimento da quantidade de incerteza conhecimento incerto + conhecimento útil =
Quantificação da Incerteza • Não há uma forma definida de quantificar incertezas e o assunto é bastante controverso. A primeira tentativa séria foi feita pelo Reverendo Thomas Bayes (?-1761) que foi dito ter 59 anos quando morreu em 17/04/1761 – não se sabe quando ele nasceu. • Bayes introduziu o conceito de uma distribuição a priori sobre o conjunto das hipóteses possíveis, indicando os graus de crença para as diferentes hipóteses, antes dos dados serem observados, que nós denotaremos por p(h). • Essa distribuição a priori junto com o conhecimento da distribuição de probabilidade dos dados d dada a hipótese h, denotada por p(d|h), capacita-nos obter a distribuição de probabilidade total (marginal) dos dados observados, denotada por p(d).
Agora estamos em posição de calcular a distribuição condicional da hipótese dados os dados observados: que é chamada distribuição a posteriori ou distribuição de incertezas sobre as hipóteses à luz dos dados observados. • A partir de um conhecimento a priori das hipóteses alternativas e dos dados observados, obtemos um conhecimento novo sobre as hipóteses possíveis e a solução de Bayes é, de fato, logicamente sólida.
Alguns estatísticos, porém, sentem-se desconfortáveis sobre a introdução de uma distribuição a priori em um problema, a menos que a escolha de tal distribuição seja feita de maneira objetiva – por exemplo, baseada na evidência observacional do passado e não na crença de um indivíduo. Esforços foram empreendidos pelos fundadores da estatística moderna K. Pearson, R.A. Fisher, J. Neyman, A. Wald, para desenvolver teorias de inferência sem usar distribuições a priori. Esses métodos, porém, apresentam muitas vezes dificuldades lógicas. (Rao, 1996)
Do determinismo ao estocástico Por muito tempo acreditou-se que todo evento natural tinha uma característica pré-determinada. Formulação mais extrema disso idéia de Laplace “existência de um demônio matemático, um espírito dotado de uma capacidade ilimitada de dedução matemática, que seria capaz de prever todos os eventos futuros no mundo, se em um dado momento ele conhecesse todas as magnitudes que caracterizam o estado presente.”
Entretanto, • existem dificuldades tanto lógicas, quanto práticas na formulação de leis determinísticas para fenômenos naturais; • é impossível medir o estado verdadeiro de um sistema em qualquer tempo dado. Na teoria do Caos tal fenômeno é chamado – Efeito Borboleta. • é preciso quantificar a nossa incerteza a respeito desses fenomenos.
CHANCE: inerente na natureza Três grandes desenvolvimentos se deram aproximadamente na mesma época em meados do século XIX em três campos distintos de averiguação. • O estatístico social belga Adolphe Quetelet (1796-1874) usou os conceitos de probabilidade ao descrever um fenômeno social e biológico.
CHANCE: inerente na natureza 2) O botânico austríaco Gregor Mendel (1822-1884) formulou suas leis de hereditariedade, através de simples mecanismos de chance, como lançar dados.
CHANCE: inerente na natureza 3) O físico austríaco Ludwig Boltzmann (1844-1906) deu uma interpretação estatística para uma das proposições mais fundamentais de física teórica, a segunda lei da termodinâmica. As leis básicas da física foram elas próprias expressas em termos probabilísticos, particularmente no nível microscópico das partículas fundamentais.
o comportamento aleatório é considerado como uma parte indispensável e inerente do funcionamento normal de muitos tipos de coisas. modelos estocásticos foram construídos para explicar o comportamento de sistemas dados. Exemplos de tais descrições são: o movimento Browniano, cintilações causadas por radioatividade, o princípio da incerteza de Heisenberg, as distribuições de velocidade de Maxwell de moléculas de massas iguais. Todas eles indicando o caminho para a mecânica quântica.
“Nós vimos como a Física Clássica lutou em vão para resignar-se ao crescimento de observações quantitativas com idéias preconcebidas sobre causalidade, derivadas da experiência de todo dia, mas elevou-se a um nível de postulados metafísicos, e como ela lutou uma batalha perdida contra a intrusão da chance. Hoje a ordem foi revertida: chance tornou-se uma noção primária, mecânica uma expressão de suas leis quantitativas, e a evidência esmagadora de casualidade com todos os seus atributos no domínio da experiência ordinária é satisfatoriamente explicada pela lei estatística dos grandes números.” (Max Born - 1882-1970)
POSSIBILIDADE DE FALHA NO CONHECIMENTO CIENTÍFICO • Todo conhecimento científico, sendo baseado em evidência que é formalmente incompleta, é somente provável e nunca absolutamente certo. • Todas as predições baseadas em conhecimento científico. Devem, portanto, poder falhar e, de fato, mostrarem-se erradas a longo prazo. • A longa história da filosofia e da ciência é em grande parte a história da emancipação progressiva da mente humana da teoria das verdades auto-evidentes e dos postulados de certeza total com a marca da verdade científica.
Em todo o campo da ciência os processos matemáticos dedutivos de inferência absolutamente certa estão sendo substituídos pelos métodos estatísticos de inferência incerta.
Exemplos de situações em que se usa Estatística • Mensuração das mudanças no meio-ambiente para avaliar os efeitos do aquecimento global; • Mensuração da poluição do ar para avaliar os efeitos na saúde da população; • Mensuração das mudanças nos padrões populacionais para avaliar que tipos de moradia são necessários e em que localizações; • Análise de experimentos sobre o uso de fertilizantes para maximizar a produção de milho; • Mensuração da eficácia de diferentes medicamentos para encontrar o melhor, e identificar efeitos colaterais; • Cálculo de quão provável duas pessoas têm o mesmo perfil de DNA.
Exemplo: Medicamentos genéricos Problema: verificar a eficácia do remédio que está sendo criado, comparando-o com o que já existe no mercado. Legislação brasileira: dois medicamentos são bioequivalentes se o intervalo de confiança de 90% para x estiver entre 80 e 125%.
Etapas para o teste de bioequivalência: • 1. Clínica: os medicamentos são analisados segundo sua monografia inscrita na Farmacopéia Brasileira. A diferença de teor do fármaco deve ser inferior a 5%. • No mínimo 24 voluntários recebem os medicamentos em períodos alternados. O n.º de períodos é escolhido de modo a assegurar a validade estatística.
Etapas para o teste de bioequivalência: • 3. estatística: analisa-se a variância de CMAX (concentração máxima) e ASC (área sob a curva) para avaliar os efeitos de grupo, de voluntários, de período e de tratamento.
Análise dos resultados: Concluiu-se que o remédio testado é equivalente ao já existente.
Resumindo: • A Estatística utiliza métodos matemáticos para solucionar problemas reais de tomada de decisão quando há incerteza. • Em situações nas quais poderíamos contar unicamente com a sorte, temos um instrumento, que nos possibilita aumentar as chances de tomar a melhor decisão. • Na prática, a Estatística pode ser empregada como ferramenta fundamental em várias outras ciências.
Formação de Graduação • A base da formação de graduação de um estatístico deve estar fundamentada em cálculo, álgebra linear, teoria das probabilidades e inferência estatística, técnicas e linguagens computacionais, métodos de análise estatística. • Por conta da grande variedade de possibilidades de atuação, cerca de 25% do currículo é composto por disciplinas complementares.
Formação de Graduação • As disciplinas complementares são escolhidas de acordo com o interesse do estudante. • No momento temos um convênio com o Hospital Universitário Clementino Fraga Filho, que oferece bolsas de Iniciação Científica para alunos do curso. • As atividades envolvem apoio aos médicos do hospital, que têm muitos dados, mas não sabem como analisá-los.
Pós-Graduação • O Instituto de Matemática oferece cinco pós-graduações nas áreas: matemática (mestrado e doutorado), matemática aplicada, estatística (mestrado e doutorado), informática e ensino da matemática. • Seguindo as recomendações curriculares, em 6 anos pode-se concluir a Graduação e o Mestrado em Estatística.
A Profissão A profissão “Estastístico” é regulamentada pelo decreto n. 62.497, DE 1.o DE ABRIL DE 1968. O exercício profissional é fiscalizado pelos Conselhos Regionais de Estatística (CONRE), sob a supervisão do Conselho Federal de Estatística (CONFE-www.confe.com.br), o qual orienta e disciplina o exercício da profissão de Estatística.
Sociedades Científicas • A comunidade estatística reúne-se em sociedades científicas e profissionais. A Associação Brasileira de Estatística (ABE - www.ime.usp.br/~abe) promove vários encontros, entre eles, o SINAPE, a cada dois anos. • Em www.im.ufrj.br/estatistica/linkestat.html vocês encontrarão vários links interessantes, relacionados à Estatística.
Estatísticos formados pela UFRJ - onde estão? Diversos estatísticos formados pela UFRJ são hoje docentes em Instituições Federais e Estaduais de Ensino Superior, tendo concluído pelo menos o mestrado em Estatística (UFRJ, UFF, UERJ, UFPR,...). Dois em particular atuam em universidades americanas. Também há vários estatísticos formados pelo IM-UFRJ que se encontram no serviço público: IBGE, FIOCRUZ (Fundação Oswaldo Cruz), ANAC (Agência Nacional de Aviação Civil), Petrobras, ANS (Agência Nacional de Saúde), IRB (Instituto de Resseguros do Brasil), na CBTU (Companhia Brasileira de trens urbanos).
Estatísticos formados pela UFRJ - onde estão? • Na iniciativa privada também temos alunos egressos do curso, por exemplo, na Telemar, na Golden Cross, na FIRJAN (Federação das Indústrias do Rio de Janeiro), na Sul América, na Eletros, em companhias de pesquisa de opinião como a LIPE, Interação-Pesquisa, entre outras.
Bacharelado em Estatística no IM-UFRJ Visite periodicamente página do curso para obter outras informações importantes. http://www.im.ufrj.br/estatistica Coordenadora: Marina Silva Paez marina@im.ufrj.br
Referências • Berquó, Souza e Gotlieb. (1981). Bioestatística. EPU. • Rao, C.R. (1996).Uncertainty, Statistics, and Creation of New Knowledge. Chance. pp 5-11. • Cordeiro, G. M. (2006). Cronologia de Alguns Conceitos e Fatos Importantes da Estatística. • http://www.rss.org.uk/main.asp?page=0