340 likes | 464 Views
VARIABLES Descriptores parte I. Mario Briones L. MV, MSc 2005. Variables. Son la materia prima de la estadística. Es un atributo que varía entre un individuo y otro. Ejemplo: peso, estatura, color de pelaje, etc. Variables. Algunas variables en un sistema productivo ovino -Raza
E N D
VARIABLESDescriptores parte I Mario Briones L. MV, MSc 2005
Variables • Son la materia prima de la estadística. • Es un atributo que varía entre un individuo y otro. • Ejemplo: peso, estatura, color de pelaje, etc.
Variables Algunas variables en un sistema productivo ovino -Raza -Peso de las ovejas -Peso del vellón a la esquila -Peso de los corderos al nacimiento -Peso de los corderos a venta -Valor del kilo de peso vivo -Color de la lana -Producción de forraje -Precipitación anual -Forrajeras más comunes -Calidad del suelo
Variables Algunas variables relacionadas con la dificultad de parición en vacas: -Peso del ternero al nacer -Peso de la vaca -Edad de la vaca -Perímetro toráxico -Perímetro de la cabeza -Perímetro de la articulación del carpo -Area de la cavidad pélvica -Grado de dificultad del parto -Condición corporal de la vaca
Variables • Tipos de variables • Cuantitativas: expresadas en números. Pueden ser de dos tipos: • Continuas (peso, estatura) • Discretas (tamaño de camada) • Cualitativas • No son “mediciones” sino más bien una “característica” del individuo. Por ejemplo, sexo, color de pelaje. Puede ser codificada con números (ej: sexo 1= hembra; sexo 2= macho) pero sigue siendo una característica no una medición.
Escalas de medición • Nominal: el atributo es sólo un nombre, no hay relación de precedencia entre las diferentes categorías. Ej: sexo, color. • Ordinal: existe relación de precedencia pero no hay garantía de un intervalo constante entre las categorías. Ej: dificultad de parición. • De intervalo: Existe relación de precedencia y un intervalo constante entre categorías pero no hay cero absoluto. Ej: temperatura en grados Celsius • De razón: Existe un cero absoluto que indica ausencia de valor. Ej. mediciones de peso, tamaño, etc.
Escala nominal: • Sexo de animales • Macho, Hembra • Color de capa en ganado Angus • Negro, Rojo • Presencia de un alelo • Positivo, Negativo
Escala ordinal: • Dificultad de parición • (0) Sin dificultad • (1) Con dificultad leve • Asistencia de una persona • (2) Con dificultad severa • Asistencia de más de una persona • (3) Cesárea • Imposibilidad de parto normal
Escala de intervalo No es el doble de temperatura que 10 grados +40 +30 +20 +10 0 - 10 - 20 - 30 - 40 No indica ausencia de temperatura
Escala de razón: Por ejemplo el peso: Existe un cero absoluto para indicar ausencia de valor. Diez miligramos es el doble de peso comparado con 5 miligramos 0.00000 mg
Manejo y presentación de datos a programas computacionales. Estructura básicas de base de datos: registros (individuos) y campos (variables)
Resumen y descripción de datos. • Cada vez que se obtienen datos a partir de una muestra, uno de los primeros procesos es la obtención de DESCRIPTORES, los cuales son una especie de valores representativos de los datos. • Los descriptores obtenidos en una muestra se denominan ESTIMADORES. Estos son un reflejo de los mismos descriptores en la población, donde se denominan PARAMETROS.
Resumen y descripción de datos. • También los gráficos y tablas son formas resumidas de entregar el “significado” de los datos • Estas representaciones numéricas y/o gráficas constituyen lo que se denomina ESTADISTICA DESCRIPTIVA
Uso de la descripción • La ESTADISTICA DESCRIPTIVA es la base de la ESTADISTICA INFERENCIAL • Inferencias en estadística son las extensiones o conclusiones que, a partir de los datos de la muestra, se hacen sobre la población.
Uso de la descripción • Estadística descriptiva: • resume o describe una muestra. • Ej: promedio de lluvia caída en cada uno de los doce meses del año en Chillán. • Estadística infererencial: • hace generalizaciones a partir de la muestra, sobre una población mayor • Ej: la probabilidad de lluvia en un periodo determinado del año.
Descripción básica: A continuación se presentan los datos de producción de leche corregida a 305 días, de un grupo de vaquillas de primer parto. Se observa que los datos están ordenados de acuerdo con el número de identificación de los animales, que es como normalmente se obtiene esta información. Se puede ver que no es muy fácil tener una buena percepción de la variable, cuando los datos están presentados de esta forma.
ARREGLO ORDENADO
Distribución de frecuencia: El primer paso de análisis de la variable es la construcción de la distribución de frecuencia de la variable en la muestra. Consiste, simplemente, en agrupar los datos a lo largo del recorrido o rango de la variable para de esta manera ubicar el número de observaciones que se encuentra en cada categoría. Existen fórmulas para determinar el mejor número de categorías que conviene para describir mejor una variable pero en general, las reglas básicas son: dividir el rango (valor más grande menos el más pequeño) en una cantidad de intervalos iguales. En la práctica, se puede también lograr esto por prueba y error. El número de categorías no debe ser muy grande ni muy pequeño, aunque también depende del número de datos.
RECORRIDO DE LA VARIABLE 3890 7015 Rango: 7015 - 3890 = 3125 INTERVALOS DE CLASE 3125/5= 625 UNIDADES: ANCHO DEL INTERVALO
LÍMITES SUPERIOR E INFERIOR DE LA CLASE NUMERO DE OBSERVACIONES EN LA CLASE: 2 6 9 10 3 3890 4415 4416 5141 5142 5767 5768 6393 6394 7019 3890 3890+625= 4415 4416 +625= 5141 5142 +625= 5767 5768 +625= 6393 6394 +625= 7019
CLASE OBSERVACIONES FRECUENCIA RELATIVA 2 2/30= 0,066 6 6/30= 0,2 9 9/30= 0,3 10 10/30= 0,33 3 3/30= 0,1 3890 4414 4415 5149 5140 5764 5764 6389 6390 7015 1 2 3 4 5
HISTOGRAMA DE FRECUENCIA FRECUENCIA RELATIVA 0,30 0,20 0,10 0 1 2 3 4 5 CLASE
Notación matemática X= simboliza la variable x (minúscula), simboliza los valores individuales x1, x2, valores particulares de la variable xi, valor típico de la variable xN, último valor de una población finita S= sumatoria
Tipos de descriptores • Descriptores de tendencia central: • Descriptores de dispersión:
Medidas de tendencia central • Media aritmética o promedio En la población En la muestra
Ejemplo: arreglo ordenado de 134 valores de alzada en caballos de raza chilena (en cm)
Media aritmética: 139.27
Mediana • EN UN CONJUNTO DE VALORES ES AQUEL VALORQUE DIVIDE AL CONJUNTO EN DOS PARTESIGUALES. IGUAL NÚMERO DE VALORES MAYORESY MENORES QUE LA MEDIANA EN EL EJEMPLO 134/2 = 67 posición 67= 139.5 Posición 68= 140 (139.5+140)/2= 139.75 CANTIDAD IMPAR x1 x2x3 x4 x5 CANTIDAD PAR x1 x2 x3 x4 x5 x6
Mediana (139.5+140)/2=139.75
Moda • LA MODA EN UN CONJUNTO DE VALORESES AQUEL VALOR QUE OCURRE CON MASFRECUENCIA. • SI NINGUN VALOR SE REPITE, NO EXISTE MODA • SI DOS VALORES SE REPITEN LA MISMACANTIDAD DE VECES, HAY DOS MODAS • EN EL EJEMPLO LA MODA ES 140 CM.
Resumen de descriptores de tendencia central • MEDIA= 139.27 cm. • MEDIANA= 139.75 cm. • MODA= 140 cm.