1 / 74

Revisão de Probabilidade e Estatística

Revisão de Probabilidade e Estatística. Parte 2. Variáveis Aleatórias. Definição: Regra que atribui um valor numérico a cada possível resultado de um experimento. Exemplo: Jogue duas moedas (o experimento aleatório) e registre o número de caras: 0, 1 ou 2.

lowri
Download Presentation

Revisão de Probabilidade e Estatística

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Revisão de Probabilidade e Estatística Parte 2

  2. Variáveis Aleatórias • Definição: • Regra que atribui um valor numérico a cada possível resultado de um experimento. • Exemplo: • Jogue duas moedas (o experimento aleatório) e registre o número de caras: 0, 1 ou 2. • Usa-se letras maiúsculas para a variável e letras minúsculas para um valor particular.

  3. Variáveis Aleatórias • Probabilidades dos resultados: • Pr(X=x)=p(x) • Para o exemplo das moedas:

  4. Histograma Para cada valor de X, traçamos uma barra com altura igual a p(x). A área total é a soma das probabilidades para todos os resultados, i.e., 1.

  5. Resultado do lançamento de moedas Modelo Probabilístico Dados Observados

  6. Comparação: modelo x real Histograma Probabilístico Histograma da Freqüência Relativa

  7. Função distribuição de probabilidade (PDF ou CDF)

  8. Função densidade de probabilidade (pdf) Dada uma pdf f(x), a probabilidade de X se encontrar no intervalo (x1,x2) pode também ser calculada através de integração:

  9. Função probabilidade de massa (pmf) A probabilidade de x se encontrar no intervalo (x1,x2) pode também ser calculado através de somas:

  10. Para variáveis discretas Para variáveis contínuas Média e Valor Esperado • Média m = E(x) Soma de todos os valores possíveis, ponderada pela probabilidade de ocorrência de cada um dos valores.

  11. Variância • A quantidade (x-m)2 representa a distância quadrática entre x e a sua média. • A variância de x é o valor esperado desta quantidade:

  12. Desvio Padrão • A variância é normalmente denotada por s2. • A raiz quadrada da variância é chamada de desvio padrão e é denotado por s.

  13. Coeficiente de Variação

  14. Covariância • Dadas duas v.a.s X e Y com médias mx e my, a covariância delas é dada por: • Para variáveis independentes a covariância é zero, dado que Apesar da independência sempre implicar em covariância zero, o contrário nem sempre é verdade.

  15. Coeficiente de Correlação • Ou simplesmente correlação é o valor normalizado da covariância A correlação varia sempre entre -1 e +1.

  16. Média e Variância de Somas • Sejam x1, x2,..., xk k variáveis aleatórias e a1, a2,..., ak k constantes arbitrárias (denominadas de pesos), então • E(a1 x1+ a2x2+...+ akxk)= a1 E(x1)+ a2E(x2)+...+ ak E(xk) • Para variáveis independentes:

  17. Quantis • O valor x no qual a CDF corresponde ao valor a é chamado de a-quantil ou 100a-percentil. • Ele é denotado por xa

  18. Mediana e Moda • Mediana: é o posto percentil 50 (ou quantil 0,5) de uma variável aleatória. • Moda: é o valor mais provável de uma v.a. Ou seja, é o valor xique corresponde à maior probabilidade pi, ou o valor de x para o qual a pdf atinge o seu valor máximo.

  19. Tentativas de Bernoulli • Suponha que tenhamos um processo aleatório com apenas dois resultados possíveis: sucesso ou falha. • As tentativas de Bernoulli são a repetição de um experimento como este, desde que: • Haja apenas dois resultados em cada tentativa. • A probabilidade de sucesso (p) seja a mesma em cada tentativa. • As tentativas sejam independentes.

  20. onde Variável Aleatória Binomial • X é o número de sucessos em n tentativas de Bernoulli com probabilidade p de sucesso.

  21. Histograma da Distribuição Binomial • 6 jogadas de moedas, p = 0,5

  22. Histograma da Distribuição Binomial • 20 jogadas de moedas, p = 0,5

  23. Mas, calcular estes termos para grandes valores de n pode dar muito trabalho... ou pelo menos dava no século 18 quando James Bernouilli e Abraham de Moivre estavam calculando sem um computador.

  24. Utilizando uma ferramenta recém-inventada, o Cálculo, De Moivre mostrou que para p=0,5, a distribuição normal era bem aproximada por uma função densidade contínua que podia ser descrita de forma bem simples.

  25. Para ver como isto funciona, imagine a distribuição binomial com p=0,5 e n muito grande - por exemplo, um milhão...

  26. Agora desloque o gráfico de modo que a média seja zero. Esprema a curva ao longo do eixo x até que o desvio padrão seja 1 e estique no eixo y para que a área continue sendo 1.

  27. Distribuição Normal Unitária • O resultado ficou próximo a uma curva suave, simétrica e com forma de sino que é descrita pela seguinte fórmula:

  28. Distribuição Normal • É a distribuição mais comumente utilizada na análise de dados. • A soma de um grande número de observações independentes de qualquer distribuição tem uma distribuição normal.

  29. Distribuição Normal

  30. Transformação z A transformação z Muda uma variável aleatória normal com média m e desvio padrão s, numa distribuição normal unitária.

  31. Razões da Popularidade da Distribuição Normal • A soma de n variáveis normais independentes é uma variável normal. • A soma de um grande número de observações independentes de qualquer distribuição tende a uma distribuição normal: • Teorema do limite central.

  32. Medidas de Tendência Central • Média aritmética:obtida através da soma de todas as observações e dividindo esta soma pelo número de observações da amostra. • Mediana: é obtida ordenando-se as observações em ordem crescente e tomando a observação que se encontra no meio da série. • Moda: é o escore ou categoria que, numa distribuição, ocorre com mais freqüência.

  33. Escolha da Medida de Tendência Central • Média: • muito afetada por valores extremos (outliers) • dá o mesmo peso a cada observação • propriedade linear: média da soma é a soma das médias. • Mediana: • exige uma ordenação

  34. Escolha da Medida de Tendência Central • Moda: • pode ser obtida para qualquer conjunto de dados.

  35. Relacionamentos entre as Medidas de Tendência Central

  36. Sim Sim Não Não Os dados são categorias? A distribuição é espalhada? Use mediana Use moda Use média Use média Seleção da Medida de Tendência Central Temos interesse no total? Sim Não

  37. Exemplos • Recurso mais utilizado do sistema: • recursos são categorias, portanto deve-se utilizar a moda. • Intervalo entre chegadas: • o tempo total é de interesse, portanto deve-se utilizar a média. • Carga de um computador: • É preferível usar a mediana devido ao espalhamento da distribuição.

  38. Mau Uso das Médias • Usar a média de valores significativamente diferentes: • não é muito útil dizer que o tempo médio de CPU por transação é 505 mseg quando as duas medidas observadas foram 10 e 1000 mseg!

  39. Mau Uso das Médias • Usar a média sem levar em conta o espalhamento da distribuição:

  40. Mau Uso das Médias • Multiplicar as médias para obter a Média de um produto: • Se xeyforem correlacionadas, • Efetuar a média de frações com bases diferentes.

  41. Média Geométrica • A média geométrica é utilizada se o produto das observações for uma quantidade de interesse. • Calculada através de:

  42. Exemplo 12.2: • Os melhoramentos de desempenho na última versão das sete camadas de um novo protocolo de rede foram medidos separadamente para cada uma das camadas: • Calcule o melhoramento médio por camada.

  43. Exemplo 12.2: • Melhoramento médio por camada = {(1,18)(1,13)(1,11)(1,08)(1,10)(1,28)(1,05)}1/7 -1 = 0,13 • Portanto, o melhoramento médio por camada é de 13%.

  44. Média Geométrica • Outras medidas que trabalham de forma multiplicativa: • taxa de acertos de cache em diversos níveis de cache • taxas de insucesso de cache • Percentual de melhora de desempenho entre versões sucessivas • Taxa média de erro por etapa em um caminho de múltiplas etapas numa rede

  45. Função Média Geométrica • Função gm(), que mapeia um conjunto de respostas {x1, x2,..., xn} em um único número. • Propriedade multiplicativa:

  46. Média Harmônica • A média harmônica deve ser utilizada sempre que possa ser justificada uma média aritmética para 1/xi. • Calculada através de:

  47. Exemplo • Suponha que foram efetuadas medidas repetidas do tempo gasto com a execução de uma benchmark em um dado processador. • Na i-ésima repetição, o tempo gasto é ti • Suponha ainda que a benchmark possua m milhões de instruções. • Então, a taxa de execução de instruções em MIPS é dada por:

  48. Exemplo • Os xi’s podem ser resumidos através da média harmônica dado que a soma dos 1/xi’s tem um significado físico. • A taxa média de MIPS do processador seria:

  49. Média de uma Fração (1) • Se tomarmos a soma dos numeradores e a soma dos denominadores e ambas tiverem um significado físico, então, a média das frações é a fração das médias. • Por exemplo:

  50. Exemplo 12.3: • A utilização da CPU de um sistema medida em cinco intervalos diferentes resultou em: A utilização média não é 40% pois as bases (denomina- dores) das frações (tempos totais) não são comparáveis.

More Related