880 likes | 1.04k Views
Capítulo 1. Vistazo y Estadística Descriptiva I Parte 1.0 .Introducción 1.1 Poblaciones, Muestras y Procesos 1.2 Métodos Gráficos y Tabulares. ¿Estadística?.
E N D
Capítulo 1. Vistazo y Estadística Descriptiva I Parte 1.0 .Introducción 1.1 Poblaciones, Muestras y Procesos 1.2 Métodos Gráficos y Tabulares Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 1
¿Estadística? • Ejemplo 1. Para la población de USA de más de 18 años. La propiedad de interés podría ser el peso aquellos que estudian ingeniería y que además son estudiantes universitarios. • Ejemplo 2. La tragediadelChallenger de enero 28, 1986. Los datos incluyen las temperaturas de los anillos O para cada encendido de prueba o lanzamiento real del transbordador. Estamos interesados en si la temperatura ambiente al lanzamiento, tiene algún efecto sobre la posibilidad de un lanzamiento exitoso o fallido. Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 2
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 3
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 4
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 5
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 6
Mmm … ¿Qué respondo? ¿Si? o ¿No? Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 7
1.1 Poblaciones,Muestras, y Procesos Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 8
Poblaciones y muestras Una población (population) es una colección bien definida de objetos, sobre la cual hay interés de obtener información. Normalmente es demasiado grande como para poder abarcarla Cuando al información está disponible para la población entera se tiene un censo (census). Un subconjunto de la población es una muestra (sample). Generalmente es el subconjunto al cual se tiene acceso y sobre el cual se hacen realmente las observaciones o mediciones Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 9
Variable Una variable es cualquier característica cuyo valor puede cambiar de objeto en objeto. Es decir, es una característica observable que varía entre los diferentes objetos de una población. La información de la cual se dispone de cada objeto se resume en variables Género, altura, ingreso, y PGB Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 10
Unidades de Observación • Los elementos de una población se llaman en general unidades de observación. Las características de interés (edad, consumo, resultado) se denominan variables pues su valor varía en función de la unidad observada Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 11
Propiedades deseables de las Muestras • Deberían ser “representativas” • Están formadas por objetos “seleccionados” de la población (individuos, unidades experimen-tales) Estos dos puntos son básicos para hacer lo esencial de esta disciplina: hacer inferencia (inducción) hacia lo general. El proceso de extraer muestras de la población se llama Muestreo Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 12
Variables según variación • Las variables pueden ser de acuerdo a su variación: • Determinísticas cuando varían de objeto en objeto de la población de un modo completamente predecible. • Aleatoriascuando varían de objeto en objeto de la población de un modo impredecible o de un modo que parece o se supone depende del azar. Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 13
Datos y Observaciones Los datos univariados constan de observaciones de una sola variable (multivariable – más de dos variables). Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 14
Notación • Las variables se denotarán por su inicial mayúscula (A, B, R ...) o de un modo más general por X, Y, Z, etc. Los valores numéricos o no numéricos (ver ejemplos más adelante) o modalidadesde una variable serán indicados por la misma letra pero minúscula tal vez subindiciada: x1, x2, . . ., y1, y2, ... Las modalidades de una variable X son todas diferentes • Si no hay lugar a confusión, se utilizan las mismas notaciones x1, x2, . . ., xnpara indicar los nvalores observados de Xpara una muestra particular. En este caso, ciertos valores podrán ser idénticos. Se dirá que x1, x2, . . ., xnson nobservacionesde X. Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 15
Tipos de variables • Por características • variable cuantitativa: cuando puede asumir cualquier valor numérico las modalidades son números que expresan cantidades, con las cuales tiene sentido realizar operaciones algebraícas con ellos (ingresos de 300 pesos, altura 185 cm, etc..); • variable cualitativa o categórica(nominal): cuando las modalidades representan cualidades o atributos (sexo : masculino, femenino, genotipo, fenotipo, etc) ; Es decir, cuando no se les puede asociar naturalmente números a los valores (y en consecuencia, no es posible realizar operaciones algebraícas con ellos). Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 16
Variables Cuantitativas • variable cuantitativa continua(o de intervalo): si el conjunto de valores o modalidades es un intervalo (posiblemente no acotado) de los números reales (pesos entre 0 y 300 Kg, talla entre 20 y 50 cm, etc.), surgen de mediciones; • variable cuantitativa discreta: si el conjunto de los valores posibles es finito o infinito numerable (número de hermanos, número de accidentes de un seguro), es decir puede sumir valores numéricos aislados, surgen de conteos; Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 17
Variables Cualitativas • variable cualitativa o categórica(nominal): cuando las modalidades representan cualidades o atributos (sexo : masculino, femenino, genotipo, fenotipo, etc); • variable categóricaordinal: cuando las modalidades no son cantidades numéricas pero pueden ser ordenadas de un modo natural (el estado de un paciente: si va mal, delicado, está estable, si le va mejor). Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 18
Una variable es una característica observable que varía entre los diferentes individuos de una población. La información que disponemos de cada individuo es resumida en variables. En los individuos de la población chilena, de uno a otro es variable: El grupo sanguíneo {A, B, AB, O} Var. Cualitativa Su nivel de felicidad “declarado” {Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal El número de hijos {0,1,2,3,...} Var. Numérica discreta La altura {1’62 ; 1’74; ...} Var. Numérica continua Variables Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 19
Es buena idea codificar las variables como números para poder procesarlas con facilidad en un ordenador. • Es conveniente asignar “etiquetas” a los valores de las variables para recordar qué significan los códigos numéricos. • Sexo(Cualit: Códigos arbitrarios) • 1 = Hombre • 2 = Mujer • Raza(Cualit: Códigos arbitrarios) • 1 = Blanca • 2 = Negra,... • FelicidadOrdinal: Respetar un orden al codificar. • 1 = Muy feliz • 2 = Bastante feliz • 3 = No demasiado feliz • Se pueden asignar códigos a respuestas especiales como • 0 = No sabe • 99 = No contesta... • Estas situaciones deberán ser tenidas en cuentas en el análisis. Datos perdidos (‘missing data’) Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 20
Aunque se codifiquen como números, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de cálculo estadístico. • No todo está permitido con cualquier tipo de variable. Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 21
¿Para qué sirve la estadística? • La Ciencia se ocupa en general de fenómenos observables • La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes • Los modelos que crea la ciencia son de tipo determinista o de tipo aleatorio (estocástico) • La Estadística se utiliza como tecnología al servicio de las ciencias puras e ingenieriles donde la variabilidad y la incertidumbre forman parte de su naturaleza; es decir, donde estas no son la excepción sino la regla Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 22
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 23
Definición La Estadística es la Ciencia de la • Sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de • deducir las leyes que rigen esos fenómenos, • y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones (inducción). Descriptiva Probabilidad Inferencia Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 24
Pasos en un estudio estadístico • Plantear hipótesis sobre una población • Los fumadores tienen “más licencias” laboralesque los no fumadores • ¿En qué sentido? ¿Mayor número? ¿Tiempo medio? • Decidir qué datos recoger (diseño de experimentos) • Qué individuos pertenecerán al estudio (muestras) • Fumadores y no fumadores en edad laboral. • Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas? • Qué datos recoger de los mismos (variables) • Número de licencias • Tiempo de duración de cada licencia • ¿Sexo? ¿Sector laboral? ¿Otros factores? • Recoger los datos (muestreo) • ¿Estratificado? ¿Sistemáticamente? • Describir (resumir) los datos obtenidos • tiempo medio de licencia en fumadores y no (estadísticos) • % de licencias por fumadores y sexo (frecuencias), gráficos,... • Realizar una inferencia sobre la población • Los fumadores están de licencia al menos 10 días/año más de media que los no fumadores. • Cuantificar la confianza en la inferencia • Nivel de confianza del 95% • Significación del contraste: p=2% Todavía no es necesario entender esto Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 25
Método científico y estadística(Primera aproximación) Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 26
Ramas de la Estadística Estadística descriptiva – resumen y descripción de los datos recolectados. Probabilidad Estadística inferencial – generalización de una muestra a una población. Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 27
Probabilidad (deducción) Población Muestra Estadística inferencial (inducción) Relaciones entre Probabilidad y Estadística Inferencial Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 28
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 29
Ejemplo 1: Datos del Challenger >STEM C1 Stem and Leaf Plot of variable: C1, N = 36 Minimum: 31.000 Lower hinge: 59.000 Median: 67.500 Upper hinge: 75.000 Maximum: 84.000 3 1 * * * Outside Values * * * 4 0 4 59 5 23 5 H 788 6 0113 6 M 6777789 7 000023 7 H 556689 8 0134 Min. 1st Qu. Median Mean 3rd Qu. Max. 31.00 59.50 67.50 65.86 75.00 84.00 The decimal point is 1 digit(s) to the right of the | 3 | 1 4 | 059 5 | 23788 6 | 01136777789 7 | 000023556689 8 | 0134 Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 30
Histograma >DENSITY C1/ HIST Programa Comercial R Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 31
Ejemplo 2: Resistencia del concreto + superplatificantes >STEM C1 Stem and Leaf Plot of variable: C1, N = 27 Minimum: 5.900 Lower hinge: 7.000 Median: 7.700 Upper hinge: 8.850 Maximum: 11.800 5 9 6 33 6 588 7 H 00234 7 M 677889 8 12 8 H 7 9 0 9 77 10 10 7 11 3 11 6 * * * Outside Values * * * 11 8 C1 = Presión en mega pascales Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 32
1.2 Métodos gráficos y Tabulares de la Estadística Descriptiva Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 33
... recopilación de datos... Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 34
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 35
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 36
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 37
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 38
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 39
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 40
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 41
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 42
Datos reales Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 43
Diagrama de puntos Los datos se representan con puntos. Para pocos datos con relativamente pocos valores distintos de los datos. . Temperatura de los anillos O (para los pernos de junturas) Temperatura de los anillos O Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 44
Pesos de estudiantes Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 45
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 46
Diagramas de Tallo y Hojas • Selecciones uno o más dígitos iniciales para valores del tallo. El dígito, o dígitos, final(es) se convierte(n) en hojas. • Haga una lista de los valores de tallos en la columna vertical. • Registre una hoja por cada observación junto al valor correspondiente del tallo. • Indique las unidades para tallos y hojas en algún lugar del diagrama Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 47
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 48
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 49
Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 50