430 likes | 834 Views
Parámetros estadísticos bidimensionales. La media aritmética y la desviación típica Variable estadística bidimensionales Tablas de frecuencias bidimensionales. La covarianza Correlación lineal Regresión lineal. Media aritmética.
E N D
Parámetros estadísticos bidimensionales. La media aritmética y la desviación típica Variable estadística bidimensionales Tablas de frecuencias bidimensionales. La covarianza Correlación lineal Regresión lineal
Media aritmética • Dado un conjunto de n datos aislados x1, x2, x3, … , xn, donde x1 se repite f1 veces, x2 se repite f2 veces, ... , xn se repite fn veces (fi se denomina frecuencia absoluta de la variable estadística xi). La media aritmética es • Cuando f1 = f2 = … = fn = 1. La media aritmética es Cuando queremos efectuar un estudia estadísticos de datos agrupados en n intervalos I1 = [a1,b1), I2 =[a2,b2), … , In = [an,bn). Las variables estadísticas que utilizaremos, son las denominadas marcas de clases: x1 =(½).(a1+b1); x2 =(½).(a2+b2); …. ; xn =(½).(an+bn);
Media aritmética • Ejemplo: Si en una familia trabajan sus cinco miembros y obtiene unos salarios netos mensuales de 1200, 950, 875, 800 y 758 €. ¿Cuál es el salario medio mensual? El salario medio mensual será
Media aritmética • Ejemplo: Las notas obtenidas en un examen de Matemáticas por 30 alumnos son las siguientes: ¿Cuál es la nota media? La nota media será
Media aritmética • Ejemplo: Hallar la altura media de 30 alumnos, los cuales se han clasificado en siguientes intervalos de longitud 5 centímetros, de acuerdo con la siguiente tabla: Teniendo en cuenta que las marcas de clase xi y los productos xi . fi son: La altura media será
Varianza • Dado un conjunto de n datos aislados x1, x2, x3, … , xn, donde x1 se repite f1 veces, x2 se repite f2 veces, ... , xn se repite fn veces (fi se denomina frecuencia absoluta de la variable estadística xi). La Varianza será
Varianza • Si f1 = f2 = … = fn = 1. La Varianza será
Varianza • Ejemplo: Si en una familia trabajan sus cinco miembros y obtiene unos salarios netos mensuales de 1200, 950, 875, 800 y 758 €. ¿Cuál es la varianza? La varianza será
Varianza • Ejemplo: Las notas obtenidas en un examen de Matemáticas por 30 alumnos son las siguientes: ¿Cuál es la Varianza? La Varianza será
Desviación típica • Debido a que la varianza se mide en unidades cuadradas con respecto a los datos, se define la DESVIACIÓN TÍPICA como
Desviación típica • Ejemplo: Si en una familia trabajan sus cinco miembros y obtiene unos salarios netos mensuales de 1200, 950, 875, 800 y 758 €. ¿Cuál es la desviación típica? La Desviación típica será
Variable estadística bidimensional • Una variable estadística bidimensional (x,y) está formada por n pares de observaciones (x1,y1), (x2,y2), (x3,y3), …, (xn,yn). • Entre dos variables estadísticas, en general no existe una dependencia funcional (que una variable se pueda poner en función de la otra), pero si existe un mayor o menor grado de dependencia estadística (si no existe ninguna dependencia decimos que son variables independientes). • Mediante una nube de puntos de una variable estadística (x,y) (representación en el plano cartesiano de los puntos ( xi ,yi )), se puede obtener en una primera aproximación el grado de asociación estadística (normalmente tienen interés la relaciones lineales)
Variable estadística bidimensional • Ejemplo.- Si tenemos los valores estadístico bidimensionales (1,1), (3,2), (5,4), (6,5), (8,5), (8,5), (9,8), (11,9) Y los representamos en el plano.
Variable estadística bidimensional Podemos apreciar que se aproximan a la recta y = 0,69 x + 0,45
Tabla de frecuencias bidimensionales. • Para tabular los datos de una variable estadística bidimensional (x;y); solemos elaborar una tabla de tres columnas o filas; en las que se recogen los valores de las variables unidimensionales; x e y; y las frecuencias correspondientes de cada par. • Cuando hay muchos datos o están agrupados por clases; resultan más útiles las tablas de doble entrada; en cuya última columna y última fila se indican las frecuencias absolutas de las variables unidimensionales x e y.
Tabla de frecuencias bidimensionales. • Ejemplo.- En una investigación que estudia dos factores A y B; en veinte mujeres embarazas seropositivas; relacionados con la posibilidad de que hayan transmitido esta enfermedad a sus hijos; se han obtenido los siguientes datos: (1.0;2.0); (3.5;4.0); (2.5;2.5); (2.5;2.5); (3.5;4.0); (3.0;3.0); (1.0;2.0); (3.0;3.0); (1.5;3.0); (1.5;3.0); (2.0;4.0); (2.0;3.5); (4.0;4.0); (1.5;2.5); (0.5;1.5); (2.0;3.0); (3.0;3.5); (0.5;1.5); (3.5;3.5); (4.0;3.5) Podemos construir la siguiente tabla o utilizando una tabla de doble entrada
Distribuciones condicionadas. • Fijado un x0 de una variable unidimensional x, que forma una variable bidimensionalidad (x,y), las frecuencias condicionadas a x0 de los valores yi de y, son los cocientes entre las frecuencias absolutas de los pares (x0,y) y la frecuencia absoluta marginal de x0. • Ejemplo.- Se ha realizado una encuesta a 120 estudiantes universitarios sobre aficiones de lectura, viajes, deportes y maquetas, obteniéndose los resultados tabulados en función de la Facultad o escuela en la que estudian, con tres modalidades: Filosofías, I. S. de telecomunicaciones y Medicina. • Si (x,y) = (Afición,Carrera): f(Lectura/filosofía) = 20/43 f(Lectura/I.S.T.) = 5/43 f(Lectura/Medicina) = 18/43
Gráficos bidimensionales. • Además de la representación gráfica mediante una nube de puntos de las variables estadísticas bidimensionales, podemos utilizar un diagrama de barras o prismogramas.
La covarianza • La covarianza de una distribución bidimensional de datos (x1,y1), (x2,y2), … , (xn,yn) y de frecuencias f1, f2, … ,fn respectivamente es: En ocasiones cuanto menor sea el valor de este parámetro nos indicará que existirá mayor asociación lineal entre las dos variables Para facilitar los cálculos de la covarianza solemos emplear esta otra fórmula equivalente
La covarianza • Cuando f1= f2 = … = fn = 1, será O también
La covarianza • Ejemplo.- Para establecer la relación entre la superficie en metros cuadrados de los pisos (x) y el precio de los alquileres (y), en una población se obtuvieron los siguientes datos Superficie (x) 50 70 56 80 110 80 90 90 80 67 60 110 Alquiler (y) 530 790 420 730 1220 740 960 860 790 540 470 1200 La covarianza será Se observa que si se modifican las unidades de superficie o de moneda, la covarianza se verá afectada, luego en este ejemplo no tiene sentido decir que si la covarianza es pequeña el grado de relación es débil. La covarianza presenta el inconveniente de que su valor depende de las unidades de medida de las variables y por tanto, no permite comparar la relación entre variables medidas en diferentes unidades.
Correlación lineal • El coeficiente de correlación lineal de una distribución bidimensional es: Es el cociente de dividir la covarianza de (x,y) entre el producto de desviaciones típicas marginales de x e y El coeficiente de correlación mide la relación entre las dos variables o correlación y a diferencia de la covarianza no depende de las unidades de las variables. El valor r del coeficiente de correlación, puede variar entre -1 y +1. Los valores extremos se corresponden con una dependencia lineal de las variables (no aleatoria) y el valor cero indica que no existe ningún tipo de relación entre las variables. Si r > 0, decimos que existe una correlación directa, y si r < 0 diremos que existe una correlación inversa
Correlación lineal • Ejemplo.- Calcular la correlación lineal de la siguiente tabla de datos Calculamos Sxy ,Sx y Sy. Y Calculamos el coeficiente de correlación r
Regresión lineal • Cuando tenemos n pares de datos estadísticos bidimensionales (x1, y1), (x2,y2), …., (xn,yn) en ocasiones necesitamos conocer una curva y = f(x) que se ajuste lo más posible a esa nube de puntos. En la mayoría de los problemas estadísticos, la función que necesitamos buscar f(x) es de la forma m x + n (es decir una recta), denominada recta de regresión de y sobre x. Si y = y(x) es la recta de regresión de los datos estadísticos, para cada variable x i, denominamos desviación d i = y i – y(xi), para que y(x) sea la recta que mas se ajuste a los datos debe de cumplir Sea mínima. Obteniendo las ecuaciones de la RECTA DE REGRESIÓN de y sobre x
Regresión lineal • Cuando tenemos n pares de datos estadísticos bidimensionales (x1, y1), (x2,y2), …., (xn,yn) en ocasiones necesitamos conocer una curva x = f(y) que se ajuste lo más posible a esa nube de puntos. En la mayoría de los problemas estadísticos, la función que necesitamos buscar f(y) es de la forma m y + n (es decir una recta), denominada recta de regresión de x sobre y. Si x = x(y) es la recta de regresión de los datos estadísticos, para cada variable y i, denominamos desviación d i = x i – f(yi), para que f(y) sea la recta que mas se ajuste a los datos debe de cumplir Sea mínima. Obteniendo las ecuaciones de la RECTA DE REGRESIÓN de x sobre y
Regresión lineal • Las rectas de regresión de y sobre x, y de x sobre y Se cortan en el punto Denominado centro de gravedad de la distribución estadística
Regresión lineal • Hallar las ecuaciones de las rectas de regresión de la distribución estadística (x,y), cuyos parámetros son: Solución • Lo valores y(xi) decimos que son valores de interpolación cuando xi pertenece al intervalo [x1,xn], en otro caso decimos que son valores de extrapolación. Además, en los valores de interpolación, cuanto mayor sea el valor absoluto del coeficiente de correlación, mejor será el ajuste lineal ,
Mas ayuda del tema de la página Matemática de DESCARTES del Ministerio de Educación y ciencia(http://recursostic.educacion.es/descartes/web/)En la siguiente diapósitiva
Mas ayuda del tema de la página Matemática de GAUSS del Ministerio de Educación y ciencia(http://recursostic.educacion.es/gauss/web)En la siguiente diapósitiva
Mas ayuda del tema de la página lasmatemáticas.es Videos del profesorDr. Juan Medina Molina(http://www.dmae.upct.es/~juan/matematicas.htm)En la siguiente diapósitiva
Mas ayuda del tema de la página Manuel Sada(figuras de GeoGebra)(http://docentes.educacion.navarra.es/msadaall/geogebra/)En la siguiente diapósitiva