2.35k likes | 2.5k Views
Universidade Federal do Pará Instituto de Tecnologia. Estatística Aplicada I. Prof. Dr. Jorge Teófilo de Barros Lopes. Campus de Tucuruí – CTUC Curso de Engenharia Mecânica. Universidade Federal do Pará Instituto de Tecnologia. Capítulo I. Estatística Descritiva. Campus de Tucuruí – CTUC
E N D
Universidade Federal do ParáInstituto de Tecnologia Estatística AplicadaI Prof. Dr. Jorge Teófilo de Barros Lopes Campus de Tucuruí – CTUC Curso de Engenharia Mecânica ESTATÍSTICA APLICADA I - Estatística Descritiva
Universidade Federal do ParáInstituto de Tecnologia Capítulo I Estatística Descritiva Campus de Tucuruí – CTUC Curso de Engenharia Mecânica ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva • Introdução • Conceitos e definições • Classificação dos dados • Caracterização e apresentação dos dados • Estatísticas amostrais • Outras apresentações gráficas de dados • Regressão linear ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva • Introdução • Conceitos e definições • Classificação dos dados • Caracterização e apresentação dos dados • Estatísticas amostrais • Outras apresentações gráficas de dados • Regressão linear ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução • ESTATÍSTICA: É a disciplina que objetiva estudar os métodos científicos para a coleta, organização, resumo, apresentação e análise de dados, bem como obter conclusões válidas e tomar decisões razoáveis baseadas em tais análises. • Técnicas Estatísticas: São as várias técnicas por meio das quais é possível estudar conjuntos de dados e, a partir de uma amostra (se necessária), tirar conclusões válidas para conjuntos maiores (população). ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução • De uma maneira geral, as técnicas estatísticas são utilizadas em três etapas principais do trabalho de pesquisa: A coleta de dados, incluindo o planejamento do trabalho e da pesquisa; A apresentação dos dados coletados; e A análise dos dados coletados, com a formulação de conclusões e generalizações. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução Coleta de dados • Essa primeira etapa corresponde ao estabelecimento do método de coleta de dados (questionário ou teste ou ensaio de material) e elaboração dos questionamentos; determinação das variáveis que serão estudadas, de acordo com o interesse do pesquisador; e o cálculo do tamanho da amostra, de acordo com a natureza da pesquisa, do tempo e do orçamento disponíveis. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução Apresentação dos dados coletados • A segunda etapa requer técnicas específicas para a transformação dos dados numéricos em tabelas ou gráficos (é a partir da organização dos dados coletados que se poderá elaborar a interpretação). Análise dos dados coletados • Essa etapa é simultânea à anterior, pois durante a própria organização dos dados já é possível ir percebendo a tendência geral da pesquisa. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução • No sentido de melhor esclarecer o significado da análise e interpretação dos dados, deve-se estabelecer uma distinção entre • Estatística Descritiva • e • Inferência Estatística. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução • Estatística Descritiva: Objetiva sintetizar e representar de uma forma compreensível a informação contida num conjunto de dados. • Como o próprio nome sugere, constitui-se num conjunto de técnicas que objetivam descrever, analisar e interpretar os dados numéricos de uma população ou amostra. • Adquire importância quando o volume de dados for significativo. • Materializa-se na construção de tabelas e/ou gráficos ou no cálculo de medidas que representem convenientemente a informação contida nos dados. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução • Inferência Estatística: Baseada na análise de um conjunto limitado de dados (uma amostra), objetiva caracterizar o todo a partir do qual tais dados foram obtidos (a população). • Objetivo mais ambicioso que o da estatística descritiva. • Os métodos e técnicas utilizados são mais sofisticados. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução Figura 1.1- Diferença entre Estatística Descritiva e Inferência Estatística (Silva e Carvalho, 2006). ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução Figura 1.2- Diferença entre Estatística Descritiva e Inferência Estatística (Silva e Carvalho, 2006). ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva • Introdução • Conceitos e definições • Classificação dos dados • Caracterização e apresentação dos dados • Estatísticas amostrais • Outras apresentações gráficas de dados • Regressão linear ESTATÍSTICA APLICADA I - Estatística Descritiva
1.2 Conceitos e Definições • População: É o conjunto de todos os elementos que contêm uma certa característica que se deseja estudar. • Como é comum a todos os elementos, esta característica • varia em quantidade ou qualidade. • Uma população pode ter dimensão finita ou infinita. • Amostra: É um subconjunto de dados que pertencem à população. As amostras aleatórias são escolhidas por meio de processos (técnicas de amostragem) que garantem que o subconjunto obtido é representativo da população. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.2 Conceitos e Definições • Principais motivos para o estudo da amostra: • População infinita; • 2. Custo em termos de tempo ou de dinheiro que um estudo em toda a população implicaria; • 3. Obtenção de informação por meio de testes destrutivos, no âmbito industrial; • 4. Impossibilidade de acesso a todos os elementos da população. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.2 Conceitos e Definições • Fases do método de análise estatística: • No âmbito da Estatística, o método de abordagem dos problemas pode ser dividido em cinco fases: • Estabelecimento do objetivo da análise a efetuar (questões a serem resolvidas) e definição das populações correspondentes; • Concepção de um procedimento adequado para a seleção de uma ou mais amostras (escolha das técnicas de amostragem a utilizar). • Coleta de dados. • Análise dos dados (Estatística Descritiva). • Estabelecimento de inferências a respeito da população (Inferência Estatística) ESTATÍSTICA APLICADA I - Estatística Descritiva
1.2 Conceitos e Definições • Fases do método de análise estatística: Identificação do problema → Objetivo da análise Planejamento da experiência → Técnicas de Amostragem Coleta de dados Análise exploratória dos dados → Estatística Descritiva Análise e interpretação dos resultados → Inferência Estatística ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva • Introdução • Conceitos e definições • Classificação dos dados • Caracterização e apresentação dos dados • Estatísticas amostrais • Outras apresentações gráficas de dados • Regressão linear ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Iniciando o estudo: • Não existe uma estratégia única para iniciar o estudo descritivo, embora uma primeira recomendação seja começar por uma exploração visual dos dados levantados. • Isso é necessário, pois podem ocorrer registros que não se encaixam no padrão geral observado e, dessa forma, a sua veracidade deve ser averiguada, pois podem tratar-se de erros de observação, bem como do próprio registro ou provenientes de alterações do fenômeno em estudo. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Iniciando o estudo: • Para se ter uma idéia mais concreta sobre os dados levantados, deve-se recorrer às tabelas e/ou gráficos que podem representar, de maneira sintética, as informações sobre o comportamento de variáveis numéricas levantadas. • Embora estas análises já se encontrem disponíveis em vários softwares e calculadoras programáveis, para uma melhor interpretação das mesmas é conveniente conhecer as técnicas utilizadas. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Iniciando o estudo: • Portanto, para se proceder um estudo descritivo, é importante: • Ordenação dos dados – fase onde se começa a ter uma idéia a respeito de algumas medidas de posição (média, mediana, quartis etc.); • Estatísticas amostrais – a partir de algumas medidas promove-se um resumo dos dados levantados, relativamente à posição, dispersão e forma; • Agrupamento dos dados e representação gráfica – revela a forma possível para a população em estudo e permite escolher a classe de modelos que deve ser explorada nas análises mais sofisticadas. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Dados brutos: Como primeiro resultado de uma pesquisa, obtêm-se dados brutos, ou seja, um conjunto de números ainda sem organização alguma. • Rol: Os dados brutos são então ordenados de forma crescente ou decrescente, com a indicação da freqüência de cada um, dando origem ao chamado rol. • Tabulação dos dados: Depois de elaborar o rol é preciso determinar quantas faixas terá a tabela de freqüência. A fórmula de Sturges é utilizada para estabelecer o número aproximado de classes onde: n = número de elementos da amostra (tamanho da amostra) k = número de classes que a tabela de classes deverá contar. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Observações: - k deverá ser no mínimo 3 e no máximo 20; - Como a variável k é um número inteiro, ela deverá ser aproximada para o maior inteiro (por exemplo, se k ≈ 6,4, usa-se k = 7). • Freqüência de classes: O passo seguinte é subdividir os dados pelas classes ou categorias e determinar o número de indivíduos pertencentes a cada uma, resultando nas freqüências de classes. • Apresentação final dos dados (tabela completa): Com base em todos os cálculos feitos anteriormente, pode-se fazer uma nova tabela com todas as freqüências, as quais serão estudadas a posteriori. • Gráficos: A partir da tabela de freqüências, faz-se o desenho gráfico, um recurso de visualização dos dados constantes na tabela. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Os dados que constituem uma amostra podem ser de quatro tipos, assim distribuídos: • Qualitativos • - Nominal • - Ordinal • Quantitativos • - Intervalar • - Absoluto ESTATÍSTICA APLICADA I - Estatística Descritiva
Neste caso, as classes devem ser: a) Exaustivas - qualquer dado pertence a uma das classes; b) Mutuamente exclusivas - cada dado pertence somente a uma classe; c) Não ordenáveis - não existe nenhum critério relevante que permita estabelecer preferência por qualquer classe em relação às restantes. 1.3 Classificação dos Dados Dados nominais: Quando cada um deles for identificado pela atribuição de um nome que designa uma classe. - Exemplo: Classificação das pessoas pela cor do cabelo (preto, castanho, louro etc.). ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Dados ordinais: São semelhantes aos dados nominais; contudo, nessa escala existe a possibilidade de se estabelecer uma ordenação dos dados nas classes, segundo algum critério relevante. - Exemplo: Classificação de conceitos de avaliação na disciplina em insuficiente, regular, bom e excelente. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Dados intervalares: No caso da escala intervalar, os dados são diferenciados e ordenados por números expressos em uma ordem cuja origem é arbitrária. • Observação: Neste caso, pode-se atribuir um significado à diferença entre esses números, mas não à razão entre eles. Por exemplo, o registro de temperaturas em ºC, em determinadas horas de dias sucessivos. Se em três dias consecutivos a temperatura atingir 5ºC, 10°C e 20ºC, não faz sentido dizer que o terceiro dia esteve duas vezes mais quente que o segundo, pois se a temperatura fosse expressa em outra escala, a razão entre os valores registrados naqueles dias seria diferente. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados d) Dados absolutos: Contrariamente ao que sucede com a escala intervalar, a escala absoluta tem origem fixa (nesta escala, o valor zero tem significado). - Exemplo: Pesos de pessoas expressos em kg. • Observações: • Escala intervalar: temperatura de 0ºC não significa que não haja temperatura. • Escala absoluta: peso de 0 kg significa que não existe peso. • Em conseqüência ao fato da origem ser fixa, a razão entre os dados expressos numa escala absoluta passa a ter significado; uma pessoa com 60 kg tem o dobro do peso de uma com 30 kg. ESTATÍSTICA APLICADA I - Estatística Descritiva
Os dados denominam-se discretos quando são valores de uma variável aleatória discreta, que é a aquela que assume valores em pontos da reta real (por exemplo, número de páginas em um livro: 1, 2, 3, 4, 5...). Os dados são contínuos quando são valores de uma variável aleatória contínua, que é aquela que pode assumir qualquer valor em certo intervalo da reta real (por exemplo, o peso de funcionários de uma fábrica: 60,5 kg; 60,52 kg; ...) 1.3 Classificação dos Dados • Observação: Quando se trabalha com dados quantitativos, é necessário que se faça a distinção entre os dados discretos e os contínuos. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Arredondamento de dados: O arredondamento de um dado estatístico deve obedecer as seguintes regras. 1. Arredondamento por falta: Quando o primeiro dígito, aquele situado mais à esquerda entre os que irão ser eliminados, for igual ou menor que quatro, não deverá ser alterado o dígito remanescente (ou seja, frações de 0,000... a 0,4999... são simplesmente eliminadas, arredondadas para baixo). Exemplos: 3, 49 ≈ 3; 2,43 ≈ 2,4; 1,734999 ≈ 1,73 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados 2. Arredondamento por excesso: Quando o primeiro dígito após aquele que será arredondado for maior ou igual a cinco seguido por dígitos maiores que zero, o digito remanescente será acrescido de uma unidade (ou seja, frações maiores de 0,500... até 0,999... são eliminadas, mas o algarismo a ser arredondado aumenta 1 unidade, arredondadas para cima). Exemplos: 3,688 ≈ 3,69; 5,6501 ≈ 5,7 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados 3. Arredondamento de dígitos seguidos do cinco: Quando o dígito situado mais à esquerda dos que serão eliminados for um cinco ou um cinco seguido somente de zeros, o último dígito remanescente, se for par, não se alterará, e se for impar será aumentado de uma unidade (ou seja, se a fração a ser eliminada é exatamente 0,50000..., então o algarismo a ser arredondado, só aumentará de 1 unidade caso torne-se um algarismo par). Exemplos: 3,5 ≈ 4; 6,5 ≈ 6; 5,6500 ≈ 5,6; 5,700 ≈ 5,8; 9,475 ≈ 9,48; 3,325 ≈ 3,32 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Observações: • Nunca se deve fazer arredondamentos sucessivos. • Exemplo: 17,3452→ 17,3 (correto) • 17,3452→ 17,35 → 17,4 (incorreto) • Se for necessário um novo arredondamento, recomenda-se o retorno • aos dados originais. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Algarismos significativos Os algarismos significativos de um número são os dígitos diferentes de zero, contados a partir da esquerda até o último dígito diferente de zero à direita, caso não haja vírgula decimal, ou até o último dígito (zero ou não) caso haja uma vírgula decimal. Exemplos: ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Algarismos significativos: • Todos os dígitos diferentes de zero são significativos. • Exemplos: 7,3; 32 e 210 possuem 2 algarismos significativos. • Os zeros entre dígitos diferentes de zero são significativos • Exemplos: 303 e 1,03 possuem 3 algarismos significativos. • Se existir uma vírgula decimal, todos os zeros à direita da vírgula decimal são significativos • Exemplos: 1,000 e 33,30 possuem 4 algarismos significativos. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Algarismos significativos: • Valores medidos ou calculados: o número de algarismos significativos de uma grandeza medida ou um valor calculado é uma indicação da incerteza, ou seja, quanto mais algarismos significativos, menor a incerteza no valor. • Exemplo: • O valor de uma grandeza medida com 3 algarismos significativos, indica que o valor do 3º algarismo tem uma incerteza menor ± 0,5ºC. Caso seja apresentada uma temperatura como 32ºC (2 significativos), está indicado que a temperatura está entre 31,5 e 32,5ºC. Caso ela seja apresentada como 32,5ºC (3 significativos), está indicado que a temperatura está entre 32,45 e 32,55ºC. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Algarismos significativos: • Números inteiros que são resultados experimentais, seguem as regras anteriores. • Exemplo: a pressão em uma caldeira é 6 atm, possui 1 algarismo • significativo. • Números inteiros que descrevem o número de objetos discretos • possuem precisão mínima. • Exemplo: 5 dias = 5,0000000... dias. • Números inteiros que são parte de uma expressão física possuem precisão infinita. • Exemplo: o 2 na equação do perímetro do círculo 2πR, possui uma precisão infinita uma vez que por definição o diâmetro é 2 vezes o raio. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Observações: • Na adição e na subtração faz-se a operação normalmente e no final • reduz-se o resultado, usando os critérios de arredondamento, para o • número de casas decimais da grandeza menos precisa. • Exemplos: • 12441 + 57,91 + 1,987 + 0,0031 + 119,20 = 12620,1001 = 12620 • 12441,2 7856,32 = 4584,88 = 4584,9 • Na multiplicação e na divisão o resultado deverá ter igual número de • algarismos (ou um algarismo a mais) que a grandeza com menor • quantidade de algarismos significativos que participa da operação. • Exemplos: • 12,46 x 39,83 = 496,2818 = 496,28 • 803,407 / 13,1 = 61,328 = 61,33 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados • Observações: • Nas operações de potenciação e radiciação o resultado deverá ter o • mesmo número de algarismos significativos da base (potenciação) ou • do radicando (radiciação). • Exemplos: (1,52 x 103)2 = 2,31 x 106 • (0,75 x 104)1/2 = 0,87 x 102 ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva • Introdução • Conceitos e definições • Classificação dos dados • Caracterização e apresentação dos dados • Estatísticas amostrais • Outras apresentações gráficas de dados • Regressão linear ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados • Tabela de freqüências: • Devido à necessidade das categorias estarem ordenadas, somente se pode falar de freqüências acumuladas quando os dados estão em escalas ordinais, intervalar ou absoluta. • A representação tabular com todos os tipos de freqüências é mostrada a seguir: ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados • Tabela de freqüências: • Freqüência absoluta (ni): O número de dados contidos numa classe ou categoria qualquer i (i = 1,..., k) de um conjunto de dados designa-se por freqüência absoluta da classe ou categoria i. • Denotando-se por nital freqüência e admitindo que as categorias especificadas contêm todos os dados, o número total de dados (n) é calculado por : ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados • Tabela de freqüências: • Freqüência relativa (fi): O número total de dados que pertencem a uma classe ou categoria qualquer i, quando expressos como uma proporção do número total de dados, designa-se por freqüência relativa da classe ou categoria i e é dada por • As freqüências relativas são muitas vezes definidas em termos percentuais. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados • Tabela de freqüências: • Freqüência absoluta acumulada (Ni): Representa para cada classe ou categoria i, a freqüência absoluta de dados que pertencem à classe ou às classes anteriores. • Freqüência relativa acumulada (Fi): Representa para cada classe categoria i, a freqüência relativa de dados que pertencem à classe ou às classes anteriores. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados • Tabela de freqüências: ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados • Gráficos estatísticos • Uma vez elaborada a tabela de freqüências, segue-se o desenho do gráfico, um recurso de visualização dos dados constantes na tabela. • Os tipos de gráficos mais comuns são: histograma; polígono de freqüência, setograma e ogiva de Galton. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados • Gráficos estatísticos • Histograma: Este tipo de gráfico é utilizado para representar as freqüências absolutas (ni) em relação à sua classe, e é assim construído: • No eixo das abscissas marcam-se, em escala, as classes dos dados; • No eixo das ordenadas, marcam-se as freqüências das classes; • Faz-se a correspondência entre cada intervalo no eixo das classes com um valor no eixo das freqüências, formando um desenho de colunas paralelas. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados • Gráficos estatísticos • Polígono de freqüência: Utilizado para indicar o ponto médio ou representante de classe em suas respectivas freqüências absolutas; normalmente, é construído sobre o histograma, da seguinte forma: • No eixo das abscissas, coloca-se o ponto médio de cada intervalo de classe; • No eixo das ordenadas, permanecem as freqüências absolutas das classes (ni) ; • Ligam-se os pontos médios por segmentos de reta; • Para completar o polígono, acrescenta-se um ponto médio com freqüência zero em cada uma das extremidades da escala horizontal. ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados • Gráficos estatísticos • Histograma e Polígono de freqüência: ESTATÍSTICA APLICADA I - Estatística Descritiva