170 likes | 396 Views
Tema 7. Transformaciones. Transformaciones lineales. Puntuaciones típicas. Transformaciones no lineales. Transformaciones lineales Con la forma y=a+bx Que se emplea por ejemplo, para pasar de grados Celsius a grados Fahrenheit.
E N D
Tema 7. Transformaciones. Transformaciones lineales. Puntuaciones típicas. Transformaciones no lineales.
Transformaciones lineales Con la forma y=a+bx Que se emplea por ejemplo, para pasar de grados Celsius a grados Fahrenheit. Pero fijaros que esta transformación no cambia la forma de la distribución. (Puede cambiar la media y la desv.típica, pero no la forma de la distribución.)
Puntuaciones típicas Indican el número de desviaciones típicas en que una observación se separa de la media del grupo de datos. La media de las puntuaciones típicas es 0 La varianza (y desv.típica) es 1 Observad que las puntuaciones z son abstractas (ello permite la comparación de variables con escalas diferentes).
Puntuaciones típicas (ejemplo) Si tenemos dos estudiantes A y B que han hecho un examen, y sabemos que la puntuación típica de A para el grupo de estudiantes es de 1 y la puntuación típica de B es de 0, ¿quién tendrá mejor nota? Evidentemente es A; su puntuación está 1 desv.típica sobre la media del grupo; la de B corresponde a la de la media del grupo. Puntuaciones típicas y observaciones atípicas Si z>3, tales valores se suelen considerar atípicos
Escalas derivadas (sobre las punt.típicas) Un pequeño inconveniente de las puntuaciones típicas es que conllevan el uso de valores muy pequeños (con decimales, habitualmente), así como valores negativos. Por ello, a veces se efectúan transformaciones lineales sobre las puntuaciones típicas. El ejemplo que vamos a ver son las puntuaciones T (con media 50 y desv.típica 10) y con las escalas de CI (con media 100 y desv.típica 15).
Puntuaciones T De manera genérica Observad que la nueva media viene dada por b, y que la desv.típica viene dada por el valor absoluto de a En el caso de las puntuaciones T, a=10 y b=50 Escala de CI En el caso de la escala de CI:
Transformaciones no lineales ¿Porqué hacemos transformaciones (no lineales) en los datos? -Para hacer la distribución más simétrica -Para hacer lineal la relación entre variables (caso de tener más de una variable; tema siguiente)
Una familia de transformaciones especialmente útiles es la “escalera de potencias” de Tukey Corrigen asimetría negativa Corrigen asimetría positiva
Ejemplo. Datos de TR de un participante Observad no sólo que hay algunas puntuaciones atípicas a ambos lados, sino que hay una clara asimetría positiva.
Ejemplo. Datos (transformados; raiz cuadrad) de TR de un participante (cont.) HEMOS EFECTUADO LA RAIZ PARA HACER MÁS SIMETRICA LA DISTRIBUCIÓN. Observad no sólo que aún queda algo de asimetría positiva. Con el logaritmo, podremos reducir más la asimetría positiva, es lo que haremos ahora
Ejemplo. Datos (transformados; logaritmo) de TR de un participante (cont.) Nota: Si algún valor fuera 0, emplear log(1+x) Observad no sólo que la asimetría positiva ha desaparecido (si acaso hay cierta asimetría negativa causada por unas pocas puntuaciones atípicas).
Ejemplo. Datos (transformados; cuadrado) de TR de un participante (cont.) Nota: Emplear el cuadrado no lo debéis hacer para corregir la asimetría positiva...sólo la negativa! Lo que hemos hecho es aumentar la asimetría positiva y eso no es lo que queríamos...(y si empleamos el cubo, aún peor para nuestros fines).
Esta familia de transformaciones (“escalera de Tukey”) tiene importantes propiedades: • Preservan el orden de los valores; es decir, los valores mayores de la escala original seguirán siendo los valores mayores en la escala transformada. • 2. Modifican la distancia entre los valores. Con potencias p<1 (raíz x o log x) se comprimen los datos en la parte superior de la distribución en relación a los valores menores; Con potencias p>1 (como el cuadrado de x) se tiene el efecto contrario. • 3. El efecto sobre la forma de la distribución cambia sistemáticamente con p. Si raíz x hace menos pronunciada la asimetría positiva de una distribución, el log x provocará que la distribución resultante sea aún menos asimétrica positiva (en relación a raíz x).
En definitiva, las transformaciones de potencia pueden hacer que la variable transformada tenga menos asimetría. ¿Por qué es eso importante? – Las distribuciones que muestran una clara asimetría son difíciles de estudiar. – Los valores originales aparentemente atípicos se encontrarán más cercanos al grueso de los datos. – Los métodos estadísticos suelen emplear la media aritmética; pero la media de una distribución asimétrica no es un buen índice del grueso de los datos.
Para finalizar.... Si bien todas estas transformaciones parece que se hacen para facilitar el análisis de los datos, en algunos contextos, las transformaciones pueden tener un sentido claro: - La inversa de la distancia viajada en un tiempo dado es la velocidad Por tanto, la inversa de la latencia de respuesta (en un experimento psicofísico) es la velocidad de respuesta