260 likes | 390 Views
Introdução à Probabilidade e à Estatística. Aula 01 Prof. Christopher Freire Souza Centro de Tecnologia Universidade Federal de Alagoas www.ctec.ufal.br/professor/cfs. Introdução à Probabilidade e à Estatística. Termos básicos Hidrologia estatística Tipos de dados Pensamento crítico.
E N D
Introdução à Probabilidade e à Estatística Aula 01 Prof. Christopher Freire Souza Centro de Tecnologia Universidade Federal de Alagoas www.ctec.ufal.br/professor/cfs
Introdução à Probabilidade e à Estatística • Termos básicos • Hidrologia estatística • Tipos de dados • Pensamento crítico
Termos básicos • Dados • Observações coletadas • Evento • Qualquer conjunto de resultados ou conseqüências de um experimento/estudo que caracterizem um fenômeno • Amostra • Subconjunto de Informações • População • Todo o grupo de informações • Censo • Conjunto de dados obtidos de todo o grupo
Termos básicos • Estatística - origem no latim ‘status’=estado; • medida numérica que descreve alguma característica de um subconjunto de informações (amostra); • conjunto de métodos para o planejamento de estudos e experimentos, obtenção de dados e conseqüente organização, resumo, apresentação, análise, interpretação e elaboração de conclusões básicas dos dados. • Parâmetro – origem no grego ‘par(a)+metro’=quase-medição • Medida numérica que descreve alguma característica de uma população • Probabilidade • “grau de crença” ou chance de ocorrência de um evento particular
Hidrologia Estatística • Conceitos Fundamentais • Variáveis • Séries • Dados
Conceitos Fundamentais • Hidrologia - geociência que investiga os fenômenos que determinam a distribuição espaço-temporal da água. • Fenômenos – Ocorrências que definem os mecanismos de armazenamento e transporte entre as diversas fases do ciclo da água. Ex.: precipitação • Processos - funções do tempo, ou do espaço, que descrevem a intensidade de fenômenos hidrológicos. Ex.: hidrograma típico. • Existe forte influência da ação do sol nos processos hidrológicos. Informações com discretização menor que um ano apresentam tendência a uma periodicidade de um ano na ocorrência de eventos hidrológicos.
Conceitos Fundamentais • Processos Determinísticos - resultam da aplicação de leis da física, química e/ou biologia. • Processos Estocásticos - governados por leis de probabilidade por conterem variáveis aleatórias. • Modelos Mecanísticos – a forma da função é construída a partir do mecanismo físico básico, que relaciona variáveis. • Modelos Empíricos - conhece-se as variáveis inter-relacionadas, mas não a forma como estas se relacionam. Observações são agrupadas para sua elaboração. • Ex.: Q = f(A)
Variáveis Hidrológicas - Conceitos • Variável - símbolo que representa uma característica de fenômeno, cujo valor pode variar ao longo da análise a depender da dimensão (tempo, espaço) em consideração. • Variável Hidrológica – símbolo cujo valor descreve a variação temporal ou espacial dos fenômenos hidrológicos. • Ex.: P→Precipitação • Variável Univariada - associa-se a ela apenas um atributo de quantidade ou qualidade de águas. • Ex.: vazão em uma seção. • Variável Multivariada - mais de um atributo está associado a ela. • Ex.: índice de risco de inundação
Séries Hidrológicas - Conceitos • Séries de dados medidos ou observados, registrados em intervalos discretos, em função da limitação do processo de monitoramento. • Séries Completas - contém registros sem falhas. • Ex.: séries de dados diários • Séries Reduzidas - contém apenas alguns valores da série completa. • Em função do objetivo do estudo e visando a minimizar distorções nas estimativas, utiliza-se de intervalos menos discretos, sendo eles uniformes (e.g., séries mensais, anuais, decadais) ou não (séries de durações parciais). • Ex.: séries de mínimas anuais, i.e., séries consistidas dos menores dados diários por ano
Séries Hidrológicas - Conceitos • Estacionariedade - estatística não se altera de forma significativa. • Homogeneidade - padrão de variabilidade é mantido. • Representatividade - valores da série representam a variabilidade de valores do fenômeno.
Séries Hidrológicas • Para séries anuais, recomenda-se identificar a janela de doze meses que melhor enquadre os eventos hidrológicos sob análise (também denominada ano hidrológico). • Esta consideração objetiva diminuir o risco de ter um mesmo evento hidrológico de interesse influenciando duas informações na série de dados, em favor da independência da série de dados.
Séries Hidrológicas (Ano hidrológico) • Estudos em engenharia e ecologia têm interesse em períodos com magnitudes extremas de vazão, para os quais se define: • Ano hidrológico de cheia – Inicia no mês com maior freqüência de ocorrência de vazões mínimas anuais. • Ex.: Em Xingó, o ano hidrológico de cheia vai de setembro a setembro. Rio Xingú em Altamira, próximo à UHE Belo Monte
Séries Hidrológicas (Ano hidrológico) • Ano hidrológico de seca – período de doze meses que compreende a estiagem. Emprega-se (Gordon et al. 2004) seis meses de defasagem em relação ao ano hidrológico de cheia. • Ex.: Para Xingó, o ano hidrológico de seca seria definido de março a março. Rio Jaguaribe na UHE Boa Esperança
Séries Hidrológicas (parciais) • Para séries de valores extremos anuais, considera-se um intervalo regular de um ano entre informações consecutivas. Esta consideração pode acarretar em tendenciosidade no estudo de eventos mais freqüentes que um ano. • Para minimizar essa tendenciosidade, trabalha-se séries com intervalos menos discretos e não-uniformemente espaçados, ao aliar aos dados de magnitude de eventos de interesse a informação de espaçamento entre dados escolhidos (séries de durações parciais). Para tanto, considera-se todos os eventos que atendem um critério pré-estabelecido. • Ex.:Superação de uma magnitude específica quando do estudo de cheias, onde apenas o dado mais extremo de cada evento de superação do valor pré-definido passa a fazer parte da nova série de dados.
Dados Hidrológicos • Tipos: climatológicos, pluviométricos, fluviométricos, evaporimétricos, sedimentométricos e de indicadores de qualidade de água. • Validade – Grau com que os dados representam o que foi medido. • Ex.: Comparar o resultado de aplicação de procedimentos diferentes a mesma amostra e obter resultados similares • Confiabilidade do modelo – Consistência. • Ex.: Comparar o valor do teste de QI executado numa data com outro executado em outra data • Atualização dos dados – Mudanças nos processos demandam alteração dos dados. Necessidade de revisar parâmetros de modelos.
Dados Hidrológicos (erros) • Ausência de dados – Razão aleatória ou sistemática. Falha sistemática demanda por modificação do sistema de coleta de dados. • Erros de dados: aleatórios, sistemáticos e grosseiros • Aleatórios - inerentes à medição/observação. • Sistemáticos - Exigem mudança de técnica de medição, calibração ou na coleta, transmissão ou processamento • Grosseiros - falhas anormais e falta de cuidado na medição/observação/transcrição • Erros de Amostragem- diferenças entre estatística e parâmetro
Tipos de dados • Quanto à forma: • Quantitativos: discretos (número anterior de dias sem chuva) e contínuos (total precipitado num período) • Qualitativos (presença de metais pesados) • Quanto à mensuração • Nominais (cor da água) • Ordinais (classificação da qualidade) • Intervalares (temperatura) • Razão (vazões)
Pensamento Crítico • Mais importante que • saber usar as técnicas de análise estatística • É • saber analisar quando se pode usar a técnica ou mesmo • saber analisar a aplicação da técnica
Pensamento Crítico • Para isto, sugere-se observar: • A técnica e o tamanho da amostragem • Amostras a partir de resposta voluntária, como envio de questionários pela internet, normalmente apresentam resposta de quem tem opinião mais forte • Não-resposta tem o mesmo aspecto do anterior e deve ser considerada • Pequenas amostras podem não representar a variabilidade do fenômeno em análise • Dados ausentes: Falhas sempre nas cheias por dificuldade de leitura
Pensamento Crítico • Sugere-se observar ainda: • A representação dos resultados • Gráficos: eixo-y
Pensamento Crítico • Sugere-se observar ainda: • A representação dos resultados • Gráficos: eixo-y • Pictogramas
Pensamento Crítico • Sugere-se observar ainda: • A representação dos resultados • Gráficos: eixo-y • Pictogramas • Porcentagens • 75% = 150000/200000 • 75%=3/4
Pensamento Crítico • Sugere-se observar ainda: • A representação dos resultados • Gráficos: eixo-y • Pictogramas • Porcentagens • Precisão na apresentação de números • Estima-se que há agora 103.215.027 famílias nos Estados Unidos
Pensamento Crítico • Sugere-se observartambém: • A formulação de questões • Direcionamento de questões • Ex.: Taxasreais de respostasim: • 97%: O presidentedeveterpoder de veto paraeliminardesperdícios? • 57%: O presidentedeveterpoder de veto, ounão? • Ordem de opçõesemquestões • Vocêdiriaque o tráfego (45%) contribuimaisoumenos do que a indústria (27%) para a poluição do ar? • Vocêdiriaquea indústria(24%) contribuimaisoumenos do queo tráfego (57%) para a poluição do ar?
Pensamento Crítico • Quemestárealizando/bancandoosestudos • Estudo de interessepróprio • Empresa de graxa de sapato, Kiwi Brands, encomendapesquisapara saber se sapatosgastoseram a razãomaiscomumparacandidatoaoempregonãocausar boa impressão • CenáriosParciais • “90% de todososnossoscarrosvendidosnestepaísnosúltimos 10 anosaindaestãorodando”. A maioria dos carrosfoiproduzidanosúltimos 3 anos. • Distorçõesdeliberadas • RevistaCorporate Travelpublicouresultadosmostrandoque a Avis era a vencedoraempesquisa com pessoasquealugavamcarros. Hertz pediuinformaçãodetalhada. Respostasdesapareceram e najustiçarevista e Avis (propaganda enganosa) entraramemacordo com a Hertz.
Pensamento Crítico • Correlação e causalidade • Haver correlação não significa que exista uma relação de causa e efeito • Ex: Homicidas podem se alimentar sempre de pão, mas não necessariamente o pão leva alguém a ser homicida (a não ser que o padeiro mereça)