1 / 37

Análisis de Datos en Psicología

http://www.psico.uniovi.es/Fac_Psicologia/w3doc/ad/. Análisis de Datos en Psicología. * Estadística bivariada. Área de Metodología Dpto. de Psicología Universidad de Oviedo. Introducción. Formas de describir la relación entre dos variables cuando éstas son numéricas.

glora
Download Presentation

Análisis de Datos en Psicología

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. http://www.psico.uniovi.es/Fac_Psicologia/w3doc/ad/ Análisis de Datos en Psicología * Estadística bivariada • Área de Metodología • Dpto. de Psicología • Universidad de Oviedo

  2. Introducción • Formas de describir la relación entre dos variables cuando éstas son numéricas. ¿Existe asociación entre ‘CI’ y el nivel de ‘rendimiento escolar’?

  3. Estudio conjunto de dos variables • A la derecha tenemos una posible manera de recoger los datos obtenidos observando dos variables en varios individuos de una muestra. • En cada fila tenemos los datos de un individuo • Cada columna representa los valores que toma una variable sobre los mismos.

  4. Diagramas de dispersión o nube de puntos Las observaciones pueden ser representadas en un diagrama de dispersión. En ellos, cada individuo es un punto cuyas coordenadas son los valores de las variables. Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables, y de qué tipo.

  5. Ejemplo CI y las notas de 30 individuos representados en un diagrama de dispersión. Nota 7,6 Nota5,0 CI 187 CI 161

  6. Ejemplo CI y las notas de 30 individuos representados en un diagrama de dispersión. Parece que las notas aumentan con el CI

  7. 330 Incorrelación 280 230 180 130 80 30 140 150 160 170 180 190 200 Relación lineal directa e inversa. Para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares. Relación no lineal. • Para los valores de X mayores que la media le corresponden valores de Y mayores también. • Para los valores de X menores que la media le corresponden valores de Y menores también. • Esto se llama relación directa o creciente entre X e Y. Para los valores de X mayores que la media le corresponden valores de Y menores. Esto es relación inversa o decreciente.

  8. o o o o o Cómo reconocer buena o mala relación Dado un valor de X no podemos decir gran cosa sobre Y. Mala relación. Independencia. • Conocido X sabemos que Y se mueve por una horquilla estrecha. Buena relación. • Lo de “horquilla estrecha” hay que entenderlo con respecto a la dispersión que tiene la variable Y por si sola, cuando no se considera X.

  9. Otros modelos • Se pueden considerar otros tipos de modelos, en función del aspecto que presente el diagrama de dispersión (regresión no lineal) • Incluso se puede considerar el que una variable dependa de varias (regresión múltiple).

  10. Otras nubes de puntos

  11. Covarianza de dos variables X e Y • La covarianza entre dos variables, Sxy, nos indica si la posible relación entre dos variables es directa o inversa. • Directa: Sxy >0 • Incorrelacionadas: Sxy =0 • Inversa: Sxy <0 • El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre la intensidad de la relación entre las variables. n-1

  12. Preguntas frecuentes • ¿Si Sxy=0 eso quiere decir que las variables son independientes? • En la práctica, casi siempre sí, pero no tiene por qué ser cierto en todos los casos. • Lo contrario si es cierto: Independencia implica incorrelación.

  13. Coef. de correlación lineal de Pearson • Nos indica si los puntos tienen una tendencia a disponerse alineadamente.

  14. Propiedades de r • Es adimensional • Sólo toma valores en [-1,1] • Las variables están incorrelacionadas  r=0 • Relación lineal perfecta entre dos variables  r=+1 o r=-1 • Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación lineal. • Siempre que no existan observaciones anómalas. Relación inversa perfecta Relación directa casi perfecta Variables incorreladas -1 +1 0

  15. Coef. de correlación lineal de Pearson • tiene el mismo signo que Sxy por tanto de su signo obtenemos el que la posible relación sea directa o inversa. • r es útil para determinar si hay relación lineal entre dos variables, pero no servirá para otro tipo de relaciones (cuadrática, logarítmica,etc...)

  16. /(2,16*3,74)=0,95 /(2,16*4,16)=0,82 /(3,74*4,16)=0,60

  17. Ejemplos: correlaciones positivas

  18. Ejemplos: casi perfectas y positivas

  19. Ejemplos: correlaciones negativas

  20. Evolución de r y diagrama de dispersión

  21. Seed voxel PLS

  22. Preguntas frecuentes • Me ha salido r=1’2 ¿la relación es “superlineal”[sic]? • ¿Superqué? Eso es un error de cálculo. Siempre debe tomar un valor entre -1 y +1. • ¿A partir de qué valores se considera que hay “buena relación lineal”? • ... observaciones anómalas,campo de aplicación,etc...pueden modificar el criterio anterior. |r|  0,8: Relación fuerte 0,6  |r| < 0,8: Relación mediana 0,4  |r| < 0,6: Relación débil |r| < 0,4: Relación muy débil

  23. Coeficiente de determinación • Grado de ajuste de un modelo de regresión (Rxy2) • R2 es una cantidad que sólo puede tomar valores en [0, 1] • A R2 también se le denomina porcentaje de variabilidad explicado por el modelo de regresión. • 1-R2 es el coeficiente de alienación que también puede tomar valores en [0, 1] • 1= CD+CA; CD=1-CA; CA=1-CD

  24. Outliers

  25. Outliers

  26. Moduladoras

  27. Moduladoras

  28. Restricción de Rango

  29. Restricción de Rango

  30. Restricción de Rango

  31. Normalidad y Homoscedasticidad

  32. Tamaño muestral • No existe consenso – rango entre 5 a 50 casos por VP • 15 casos por VP es un criterio aceptable E.j., para 4 VP, min. N ~ 60 • Otra forma de aproximarse al problema es usar un mínimo de 20 casos, y cuando se tienen muchas variables de 5 a 20 observaciones por variable (preferiblemente 20)

  33. Relaciones aparentes: ejemplos • Existe una elevada correlación positiva y significativa entre las ventas anuales de chicle y la incidencia del crimen en los Estados Unidos de América. • Obviamente, no es lícito concluir que prohibiendo la venta de chicle podría reducirse el crimen, pues ambas variables dependen de una tercera: el tamaño de la población.

  34. Control de las relaciones aparentes • Una correlación es un “proceso matemático” no una relación de causalidad, ya que es posible: • – Y “causa” X • – X “causa” Y • – Z “causa” X and Y • Las correlaciones pueden ser simples coincidencias (ej.:tamaños muestrales reducidos) Control: • Diseño experimental • A.E.D. • Técnicas alternativas X ……. Y Z

  35. Diseños correlacionales

More Related