600 likes | 709 Views
Elementos de Estatística. Por LUCIANO MENESES CARDOSO DA SILVA Engenheiro Civil Especialista em Recursos Hídricos da ANA Doutor em Desenvolvimento Sustentável (UnB - CDS) M.Sc. Recursos Hídricos (UFRGS - IPH) Especialista em Saneamento Ambiental (Universidade de Linköping - Suécia).
E N D
Elementos de Estatística Por LUCIANO MENESES CARDOSO DA SILVA Engenheiro Civil Especialista em Recursos Hídricos da ANA Doutor em Desenvolvimento Sustentável (UnB - CDS) M.Sc. Recursos Hídricos (UFRGS - IPH) Especialista em Saneamento Ambiental (Universidade de Linköping - Suécia) Slides próprios e obtidos de Tucci, Porto e Ahy.
Conceitos básicos • Variável aleatória: não possui um explicação determinista da sua ocorrência: P. Ex. a precipitação de um local; qual o número que sairá numa roleta • Populaçãoé o universo de possibilidades de ocorrência de uma variável aleatória. P. ex. num dado são seis possibilidades, sendo que cada número tem igual chance de ocorrer. • Amostraé a quantidade de indivíduos (valores) que permite estimar as estatísticas da população. Por ex. após jogar o dado 1000 vezes é possível determinar qual a probabilidade de ocorrer cada um dos número e certamente será 1/6, mas se tivesse jogado o dado apenas 10 vezes, provavelmente minha estimativa da probabilidade seria errada porque minha amostra é pequena.
Conceitos • Estatísticas: uma variável aleatória tem várias estatísticas que a caracterizam como: média, desvio padrão, assimetria, etc. • A média pode ser aritmética, geométrica, etc. A média aritmética é simplesmente a média dos valores da amostra; • o desvio padrão retrata a distribuição dos valores da variável com relação a média. Quanto maior o valor, maior a dispersão em relação a média; • A assimetria retrata como os dados se distribuem com relação a média. Uma assimetria positiva mostra que a maioria da freqüência do valores fica são maiores que a média.
Número de intervalos (k): 2k≥ n; k: menor inteiro; n: número de elementos da amostra
Positiva Negativa Tipos de curva de freqüência
Raiz quadrada da Variância Medida da dispersão dos dados Desvio quadrático médio da média
Conceitos básicos • Risco: é a possibilidade de ocorrência de valores da variável aleatória fora do planejado. Por ex. qual o risco de ocorrência de um número do dado maior que 4? • Incerteza é o erro da diferença entre as estatísticas da amostra e da população na estimativa do risco. • Em hidrologia a incerteza pode estar na medida das vazões, no processamento dos dados, no tamanho da amostra e na metodologia.
Conceitos • Variável estacionária: uma variável é estacionária quando as suas estatísticas não variam com o tempo e não-estacionária no caso contrário. • Ex. a mudança da média do escoamento de uma bacia urbana devido a impermeabilização; aumento ou diminuição da vazão de estiagem depois da construção de uma barragem, são exemplos de variáveis não-estacionárias. • Hidrologia estocástica: trata da estatística temporal. Conceitos de probabilidade para avaliar a variabilidade temporal de uma variável aleatória.
Conceitos • Probabilidade e tempo de retorno: A probabilidade é a chance de ocorrência de uma variável. Esta probabilidade pode ser cumulativa ou individual. Ex. A probabilidade de sair o número 3 é de 1/6 a chance de que ocorra uma número maior que 3 é de 3/6 ou ½. • O tempo de retorno (utilizado em hidrologia) retrata a freqüência seqüencial de ocorrência de valores. Ex. o número 3, em média, ocorre a cada seis jogadas. • Portanto TR = 1/P • Em hidrologia é utilizado para caracterizar a freqüência de repetição de um evento. Ex. Uma inundação que tem a chance de ser maior ou igual num ano qualquer de 0,05 ou 5%, tem um tempo de retorno de 1/0,05 = 20 anos. Significa que, em média, a inundação ocorrerá a cada 20 anos. Não significa repetição cíclica.
QUESTÃO P ( x >=X)= ? Qual é a probabilidade P de uma variável hidrológica X ser igualada ou excedida em um ano qualquer ? Conceito: Período de Retorno ( ou Recorrência) T T = 1/P (anos) Intervalo de tempo médio, em anos, em que uma variável hidrológica é igualada ou excedida. Para não-excedência: T = 1/(1-P)
Se uma vazão Q tem um período de recorrência de 50 anos isto significa que,em média(!), esta vazão é igualada ou excedida a cada 50 anos. • Em outros termos: A vazão Q tem uma probabilidade P= 1/T = 0.02 (ou 2%) de ser igualada ou excedida, em um ano qualquer • OBSERVAÇÃO IMPORTANTE: É um conceito probabilístico (não significa periodicidade!)
Risco é a probabilidade de uma obra falhar pelo menos uma vez durante sua vida útil, N. Pode ser deduzido: R = 1 - (1 - 1/T)N • Exemplo: Qual o risco que a canalização do rio Tamanduateí tem de falhar pelo menos uma vez durante sua vida útil, estimada em 50 anos? A obra foi projetada para T = 500 anos.
Qual a vazão de projeto? É um dos problemas mais comuns (e importantes) em hidrologia, uma vez que envolve diretamente as dimensões da obra - e, portanto, o seu custo - e o risco que esta obra tem de falhar durante sua vida útil. Valores usuais de T (ANOS) Obras de microdrenagem 2 a 10 Obras de macro drenagem 25 a 500 Barragens 1000 a 10000
Hidrologia Solução: Risco de não ocorrer em qualquer ano = 90% = 0,90 Risco de não ocorrer 5 anos seguidos = (0,9)5 = 0,5905 ≈ 59%
Condições • Valores independentes: os valores da amostra não devem apresentar correlação entre si. P. ex. Numa amostra de vazões máximas anuais, o valor de cada ano não devem ter correlação com o do ano seguinte. Por isto que os valores são escolhidos dentro do ano hidrológico. • Variável estacionária: as estatísticas da série não podem se alterar ao longo do tempo. • Amostra representativa: as estatísticas da amostras devem ser representativas da população. O número de anos de uma amostra de valores é importante, mas não significa tudo.
Exemplo de Blumenau Cheias máximas em Blumenau/SC: 1852 – 16,52 m 1880 – 17,10 m 1911 – 16,90 m 1983 - 15,34 m 1984 – 15,50 m Entre 1911 e 1984 não houve nenhuma inundação com cota maior que 16,90 m, período pouco representativo
N(μ;σ) Observe como os valores de média (μ) de desvio padrão (σ) alteram a forma e aposição da curva {N(μ;σ)}.
A área sob a curva significa a probabilidade cumulativa de 0 a 1. Z = (X – μ)/σ 1 x σ 2 x σ 3 x σ
Área = 0,4 Z ≈ 1,28 Z = (X – μ)/σ A = 0,4 A = 0,5 = ?
Z = (X – μ)/σ X = Z* σ + μ Exemplo: Qméd(μ) = 311 m³/s e desvio padrão (σ) = 169,7 m³/s. Calcule a vazão (X) com 200 anos de retorno (Tr = 200 anos). X = Z.σ + μ ; Para Tr = 200, Z = 2,5758 Então, X = 2,5758.169,7 + 311 = 748,1 m³/s
Determinação da Relação Q = f (T) Metodologia 1. Processamento dos dados 2. Escolha da distribuição de probabilidades: determinação da relação entre a vazão (Q) e o tempo de retorno (T) Q = f(T)
1. Processamento dos dados a) coletar uma série de observações hidrológicas de vazões, a mais longa possível (N > 30 anos), de um posto próximo do local de interesse. b) escolher a maior vazão diária de cada ano hidrológico:
1. Processamento dos dados c) ordenar as vazões em ordem decrescente (m) e atribuir a cada uma delas uma probabilidade empírica dada pela expressão: P(q > Q) = m/(N+1) Empírico como na Tabela:
Distribuições de probabilidade • Eventos máximos: • Gumbel, Log-Normal (2 e 3 parâmetros), Pearson III e Log-Pearson III • Eventos mínimos: • Log-Normal (2 e 3 parâmetros), Pearson III, Log-Pearson III e Weibull
e e
DISTRIBUIÇÃO DE GUMBEL (TIPO 1) Posição de Plotagem 200 180 Q100= 136 m3/s 160 140 120 100 80 Reta empírica 60 40 20