490 likes | 878 Views
Estatística. Estatística Descritiva Prof. Helcio Rocha. Definições sumárias. Ao resumir e descrever variáveis numéricas , precisamos considerar :. Tendência central : extensão na qual os valores de dados se agrupam em torno de um valor central
E N D
Estatística EstatísticaDescritiva Prof. Helcio Rocha Adaptado de Levine
Definiçõessumárias Aoresumir e descrevervariáveisnuméricas, precisamosconsiderar: • Tendência central: extensãonaqualosvalores de dados se agrupamemtorno de um valor central • Variação: dispersãoemrelação a um valor central • Formato: padrão da distribuição de valores, do maisbaixopara o mais alto
Medidas de tendência central: A média • Obs: é afetadaporvaloresextremos (outliers) 11 12 13 14 15 16 17 18 19 20 11 12 13 14 15 16 17 18 19 20 Média= 13 Média= 14
Medidas de tendência central: A mediana • Obs: NÃO É afetadaporvaloresextremos (outliers) 11 12 13 14 15 16 17 18 19 20 11 12 13 14 15 16 17 18 19 20 Mediana= 13 Mediana= 13
Medidas de tendência central: A moda • Observações: • NÃO É afetadaporvaloresextremos • Aplicáveltambém a dados categóricos • Podenãohavermoda • Podemhaverváriasmodas 0 1 2 3 4 5 6 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 SemModa Moda= 9
Medidas de tendência central: Qualutilizar? • A média é geralmenteutilizada, a não ser quandoexistemoutliers. • A mediana tem usofrequente, pornão ser afetadaporoutliers. • Emalgumassituações, recomenda-se relatarambasmedidas.
Variação Amplitude Variância Desviopadrão Coeficiente de variação Medidas de variação Mesmocentro, diferentesdispersões
Medidas de variação: A amplitude • A medidamais simples de variação • É afetadapor outliers • Ignora o modocomoos dados estãodistribuídos Exemplo: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Amplitude = 13 - 1 = 12
Medidas de variação:A variância Variância populacional (é um parâmetro) Variância amostral (é uma estatística)
Medidas de variação:O desviopadrão • É a medida de variaçãomaisempregada • É a raizquadradadavariância • Possui a mesmaunidade dos dados de origem Desvio padrão populacional (é um parâmetro) Desvio padrão amostral (é uma estatística)
Medidas de variação:O desviopadrãodaamostra (exemplo) Dados daamostra(Xi) 10 12 14 15 17 18 18 24 n = 8 Média= X = 16
Medidas de variação:Comparandodesviospadrão Data A Média= 15.5 S = 3.338 11 12 13 14 15 16 17 18 19 20 21 Data B Média= 15.5 S = 0.926 11 12 13 14 15 16 17 18 19 20 21 Data C Média= 15.5 S = 4.570 11 12 13 14 15 16 17 18 19 20 21
Medidas de variação:Comparandodesviospadrão Menordesviopadrão Maiordesviopadrão
Medidas de variação:O coeficiente de variação • É umamedidarelativa de variação • Sempreem % • Apresenta a variaçãorelativa à média • Permitecomparardoisoumaisconjuntos de dados quesãomensuradosemunidadesdiferentes
Medidas de variação:Comparandocoeficientes de variação • Ação A: • Preçomédio do últimoano = $50 • Desviopadrão = $5 • Ação B: • Preçomédio do últimoano = $100 • Desviopadrão = $5 Ambasaçõespossuem o mesmo DP, mas a B é menosvariávelemrelação a seupreço
Medidas de variação:Comparandocoeficientes de variação • Stock A: • Preçomédio do últimoano = $50 • Desviopadrão = $5 • Stock C: • Preçomédio do últimoano = $8 • Desviopadrão = $2 A ação C possui um DP bemmenor, mas um CV bemmaior
Localizandovaloresextremos:Uso do escore Z • Um valor é consideradooutlierquandoseuescore Z é inferior a – 3,0 ou superior a + 3,0 (Número de desvios padrão)
Formato de umadistribuição:Assimetria Assimétrico à esquerda Assimetria < 0 Simétrico Assimetria = 0 Assimétrico à direita Assimetria > 0 Média<Mediana Média=Mediana Média > Mediana
Formato de umadistribuição:Curtose • É umamedidadireta do afunilamentodacurva (ouinversa do seuachatamento) Formatomaisachatado Curtose < 0 Distribuição normal Curtose = 0 Formatomaisafunilado Curtose > 0
Estatísticadescritivausando o Excel • Selecione Dados. • SelecioneAnálise de dados. • SelecioneEstatísticaDescritiva. Clique OK.
Estatísticadescritivausando o Excel 4. Registre o intervalo de entrada. 5. Selecione a opçãoResumoestatístico. 6. Click OK
25% 25% 25% 25% Quartis • Dividemos dados ordenadosem 4 segmentos, com igual No. de dados emcadasegmento Q1 Q2 Q3 • Localizandoosquartis: • Q1 = (n+1)*(1/4) • Q2 = (n+1)*(1/2) (é a mediana) • Q3 = (n+1)*(3/4) Os quartis não são afetados por outliers
Localizandoquartis – 1o. exemplo Dados ordenados: 11 12 13 16 16 17 18 21 22 (n = 9) Q1naposição(9+1)*(1/4) = 2.5 entãoQ1 = (12+13)/2 = 12.5 Q2naposição(9+1)*(1/2) = 5 entãoQ2 = mediana= 16 Q3naposição(9+1)*(3/4) = 7.5 entãoQ3 = (18+21)/2 = 19.5
Localizandoquartis – 2o. exemplo Dados ordenados: 29 31 35 39 39 40 43 44 44 52 (n = 10) Q1naposição(10+1)*(1/4) = 2.75 → arredondepara 3 entãoQ1 = 35 Q2naposição(10+1)*(1/2) = 5.5 entãoQ2 = (39+40)/2 = 39.5 Q3naposição(10+1)*(3/4) = 8.25 → arredondepara 8 entãoQ3 = 44
Os cinconúmeros e o Boxplot • Os cinconúmerosqueproporcionam um métodopara se determinar o formato de umadistribuição: Xmenor-- Q1--Mediana-- Q3-- Xmaior Boxplot: Xmenor Q1MedianaQ3Xmaior
A curva de distribuição e o Boxplot Assimétrica à direita Assimétrica à esquerda Simétrica Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
Amplitude interquartil (Q3 – Q1) • Tambémconhecidacomodispersãomédia Mediana (Q2) X X Q1 Q3 máx mín 25% 25% 25% 25% 12 30 45 57 70 Amplitude interquartil = 57 – 30 = 27 • Obs: Assimcomoosquartis, tambémnão é afetadaporoutliers
Medindo a relação entre duasvariáveisnuméricas:A covariância • Mede a força de umarelação linear entre duasvariáveisnuméricas(X & Y) • Covariânciadaamostra • Nãoimplicanumarelaçãocausa-efeito
Interpretando a Covariância • Covariância entre duasvariáveis cov(X,Y) > 0 X e Y tendem a se mover namesmadireção cov(X,Y) < 0 X e Y tendem a se mover emdireçõesopostas cov(X,Y) = 0 X e Y sãoindependentes • Observar: covpodeassumirqualquer valor • Consequência: não é possível se determinar a forçarelativadarelação a partir do valor dacovariância
Coeficiente de Correlação • Mede a forçarelativa de umarelação linear entre duasvariáveisnuméricas • É adimensional Coeficiente de correlaçãodaamostra Coeficiente de correlaçãodapopulação
Coeficientes de Correlação e gráficos de dispersão Y Y X X r = -1 r = -.6 Y Y Y X X X r = +1 r = 0 r = +.3
Coeficiente de Correlação: Análise de Dados no Excel • Selecione Dados • EscolhaAnálise de Dados • SelecioneCorrelação e clique OK
Coeficiente de Correlação: Análise de Dados no Excel (cont.) • Entre com os dados e selecione as opçõesadequadas • Clique em OK
Interpretanto o Coeficiente de Correlação • r = 0.733 • Háumarelação linear positivarelativamente forte entre as notas do teste 1 e as do teste 2.