1 / 37

Estatística Descritiva Prof. Helcio Rocha

Estatística. Estatística Descritiva Prof. Helcio Rocha. Definições sumárias. Ao resumir e descrever variáveis numéricas , precisamos considerar :. Tendência central : extensão na qual os valores de dados se agrupam em torno de um valor central

kipling
Download Presentation

Estatística Descritiva Prof. Helcio Rocha

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Estatística EstatísticaDescritiva Prof. Helcio Rocha Adaptado de Levine

  2. Definiçõessumárias Aoresumir e descrevervariáveisnuméricas, precisamosconsiderar: • Tendência central: extensãonaqualosvalores de dados se agrupamemtorno de um valor central • Variação: dispersãoemrelação a um valor central • Formato: padrão da distribuição de valores, do maisbaixopara o mais alto

  3. Medidas de tendência central: A média • Obs: é afetadaporvaloresextremos (outliers) 11 12 13 14 15 16 17 18 19 20 11 12 13 14 15 16 17 18 19 20 Média= 13 Média= 14

  4. Medidas de tendência central: A mediana • Obs: NÃO É afetadaporvaloresextremos (outliers) 11 12 13 14 15 16 17 18 19 20 11 12 13 14 15 16 17 18 19 20 Mediana= 13 Mediana= 13

  5. Medidas de tendência central: A moda • Observações: • NÃO É afetadaporvaloresextremos • Aplicáveltambém a dados categóricos • Podenãohavermoda • Podemhaverváriasmodas 0 1 2 3 4 5 6 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 SemModa Moda= 9

  6. Medidas de tendência central: Qualutilizar? • A média é geralmenteutilizada, a não ser quandoexistemoutliers. • A mediana tem usofrequente, pornão ser afetadaporoutliers. • Emalgumassituações, recomenda-se relatarambasmedidas.

  7. Variação Amplitude Variância Desviopadrão Coeficiente de variação Medidas de variação Mesmocentro, diferentesdispersões

  8. Medidas de variação: A amplitude • A medidamais simples de variação • É afetadapor outliers • Ignora o modocomoos dados estãodistribuídos Exemplo: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Amplitude = 13 - 1 = 12

  9. Medidas de variação:A variância Variância populacional (é um parâmetro) Variância amostral (é uma estatística)

  10. Medidas de variação:O desviopadrão • É a medida de variaçãomaisempregada • É a raizquadradadavariância • Possui a mesmaunidade dos dados de origem Desvio padrão populacional (é um parâmetro) Desvio padrão amostral (é uma estatística)

  11. Medidas de variação:O desviopadrãodaamostra (exemplo) Dados daamostra(Xi) 10 12 14 15 17 18 18 24 n = 8 Média= X = 16

  12. Medidas de variação:Comparandodesviospadrão Data A Média= 15.5 S = 3.338 11 12 13 14 15 16 17 18 19 20 21 Data B Média= 15.5 S = 0.926 11 12 13 14 15 16 17 18 19 20 21 Data C Média= 15.5 S = 4.570 11 12 13 14 15 16 17 18 19 20 21

  13. Medidas de variação:Comparandodesviospadrão Menordesviopadrão Maiordesviopadrão

  14. Medidas de variação:O coeficiente de variação • É umamedidarelativa de variação • Sempreem % • Apresenta a variaçãorelativa à média • Permitecomparardoisoumaisconjuntos de dados quesãomensuradosemunidadesdiferentes

  15. Medidas de variação:Comparandocoeficientes de variação • Ação A: • Preçomédio do últimoano = $50 • Desviopadrão = $5 • Ação B: • Preçomédio do últimoano = $100 • Desviopadrão = $5 Ambasaçõespossuem o mesmo DP, mas a B é menosvariávelemrelação a seupreço

  16. Medidas de variação:Comparandocoeficientes de variação • Stock A: • Preçomédio do últimoano = $50 • Desviopadrão = $5 • Stock C: • Preçomédio do últimoano = $8 • Desviopadrão = $2 A ação C possui um DP bemmenor, mas um CV bemmaior

  17. Localizandovaloresextremos:Uso do escore Z • Um valor é consideradooutlierquandoseuescore Z é inferior a – 3,0 ou superior a + 3,0 (Número de desvios padrão)

  18. Formato de umadistribuição:Assimetria Assimétrico à esquerda Assimetria < 0 Simétrico Assimetria = 0 Assimétrico à direita Assimetria > 0 Média<Mediana Média=Mediana Média > Mediana

  19. Formato de umadistribuição:Curtose • É umamedidadireta do afunilamentodacurva (ouinversa do seuachatamento) Formatomaisachatado Curtose < 0 Distribuição normal Curtose = 0 Formatomaisafunilado Curtose > 0

  20. Estatísticadescritivausando o Excel

  21. Estatísticadescritivausando o Excel • Selecione Dados. • SelecioneAnálise de dados. • SelecioneEstatísticaDescritiva. Clique OK.

  22. Estatísticadescritivausando o Excel 4. Registre o intervalo de entrada. 5. Selecione a opçãoResumoestatístico. 6. Click OK

  23. 25% 25% 25% 25% Quartis • Dividemos dados ordenadosem 4 segmentos, com igual No. de dados emcadasegmento Q1 Q2 Q3 • Localizandoosquartis: • Q1 = (n+1)*(1/4) • Q2 = (n+1)*(1/2) (é a mediana) • Q3 = (n+1)*(3/4) Os quartis não são afetados por outliers

  24. Localizandoquartis – 1o. exemplo Dados ordenados: 11 12 13 16 16 17 18 21 22 (n = 9) Q1naposição(9+1)*(1/4) = 2.5 entãoQ1 = (12+13)/2 = 12.5 Q2naposição(9+1)*(1/2) = 5 entãoQ2 = mediana= 16 Q3naposição(9+1)*(3/4) = 7.5 entãoQ3 = (18+21)/2 = 19.5

  25. Localizandoquartis – 2o. exemplo Dados ordenados: 29 31 35 39 39 40 43 44 44 52 (n = 10) Q1naposição(10+1)*(1/4) = 2.75 → arredondepara 3 entãoQ1 = 35 Q2naposição(10+1)*(1/2) = 5.5 entãoQ2 = (39+40)/2 = 39.5 Q3naposição(10+1)*(3/4) = 8.25 → arredondepara 8 entãoQ3 = 44

  26. Os cinconúmeros e o Boxplot • Os cinconúmerosqueproporcionam um métodopara se determinar o formato de umadistribuição: Xmenor-- Q1--Mediana-- Q3-- Xmaior Boxplot: Xmenor Q1MedianaQ3Xmaior

  27. Construindo o Boxplot no Excel

  28. A curva de distribuição e o Boxplot Assimétrica à direita Assimétrica à esquerda Simétrica Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3

  29. Amplitude interquartil (Q3 – Q1) • Tambémconhecidacomodispersãomédia Mediana (Q2) X X Q1 Q3 máx mín 25% 25% 25% 25% 12 30 45 57 70 Amplitude interquartil = 57 – 30 = 27 • Obs: Assimcomoosquartis, tambémnão é afetadaporoutliers

  30. Medindo a relação entre duasvariáveisnuméricas:A covariância • Mede a força de umarelação linear entre duasvariáveisnuméricas(X & Y) • Covariânciadaamostra • Nãoimplicanumarelaçãocausa-efeito

  31. Interpretando a Covariância • Covariância entre duasvariáveis cov(X,Y) > 0 X e Y tendem a se mover namesmadireção cov(X,Y) < 0 X e Y tendem a se mover emdireçõesopostas cov(X,Y) = 0 X e Y sãoindependentes • Observar: covpodeassumirqualquer valor • Consequência: não é possível se determinar a forçarelativadarelação a partir do valor dacovariância

  32. Coeficiente de Correlação • Mede a forçarelativa de umarelação linear entre duasvariáveisnuméricas • É adimensional Coeficiente de correlaçãodaamostra Coeficiente de correlaçãodapopulação

  33. Coeficientes de Correlação e gráficos de dispersão Y Y X X r = -1 r = -.6 Y Y Y X X X r = +1 r = 0 r = +.3

  34. Coeficiente de Correlação: função no Excel

  35. Coeficiente de Correlação: Análise de Dados no Excel • Selecione Dados • EscolhaAnálise de Dados • SelecioneCorrelação e clique OK

  36. Coeficiente de Correlação: Análise de Dados no Excel (cont.) • Entre com os dados e selecione as opçõesadequadas • Clique em OK

  37. Interpretanto o Coeficiente de Correlação • r = 0.733 • Háumarelação linear positivarelativamente forte entre as notas do teste 1 e as do teste 2.

More Related