1 / 13

Estadística Descriptiva

Estadística Descriptiva. TEMA 4: OUTLIERS. MÉTODOS SIMPLES DE DETECCIÓN Y ACOMODACIÓN. En Estadística , la información debe ser de mayor precisión y fiabilidad posible . Debe existir una depuración de los datos experimentales . Elementos de un experimento estadístico :

ashton
Download Presentation

Estadística Descriptiva

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Estadística Descriptiva TEMA 4: OUTLIERS. MÉTODOS SIMPLES DE DETECCIÓN Y ACOMODACIÓN

  2. En Estadística, la información debe ser de mayor precisión y fiabilidad posible. Debe existir una depuración de los datos experimentales. • Elementos de un experimento estadístico: • Una Población( ), objeto del estudio que se está realizando. • Un Subconjunto(M), de elementos de la población, que serán observados. • Una Variable(X), que actuando sobre los elementos de M, los transforma o valora. • El Experimentador(E), encargado de observar y manipular los datos. 4.1-INTRODUCCIÓN

  3. Errores en las Observaciones Muestrales • Errores o variables que pueden existir en X(M): • a) Variabilidad de la fuente o inherente: comportamiento natural de los datos. • b) Errores del Medio: Cuando no se dispone de la técnica adecuada o cuando no existe un procedimiento para realizar la transformación de una forma exacta. Ej: Redondeo forzoso con variables continuas. • Error del experimentador: • a) Error de la Información: cuando un modelo o estructura matemática no adecuada o precisa a la población, o al considerar información o hipótesis iniciales incorrectas. • b) Error de Planificación: cuando no se delimita correctamente la población , se experimenta con una población distinta • c) Error de realización: por una valoración errónea de los elementos de M( es decir, el paso de la información de un instrumento a otro, Ej: de la libreta al ordenador.). 4.2-ERRORES EN LAS OBSERVACIONES MUESTRALES

  4. 4.2-ERRORES EN LAS OBSERVACIONES MUESTRALES • En las observaciones extrañas o anómalas: • a) Observación Atípica: es aquel valor de X(M) que presenta una gran variabilidad de tipo inherente. • b) Observación Errónea: es el valor que presenta un gran error del medio y/o un gran error del experimentador. • Outliers e Inliers • Outlier: Se llamará Outlier a aquella observación que siendo atípica y/o errónea, tiene un comportamiento muy diferente respecto de los datos, frente al análisis que se desea realizar sobre las observaciones experimentales. • Inlier: Se llamará Inlier a aquella observación atípica y/o errónea que no tiene el comportamiento de Outlier. Es decir, se comporta casi igual o igual que los datos de nuestro análisis.

  5. Método basado en la Desviación Típica Desigualdad de CHEBYSHEV: al menos contiene el al menos contiene el De las observaciones 4.3-METODOS SIMPLES DE IDENTIFICACIÓN DE OUTLIERS

  6. Método basado en el Recorrido Intercuartílico IQR = Q3 - Q1 Las vallas interiores de la variable estadística X: f1 = Q1 - 1´5 IQR [f1,f2] f2 = Q3 + 1´5 IQR 25% 25% Q1 Q2=Me Q3 1´5 IQR IQR 1´5 IQR f1 Q1 Q3 f2 4.3-METODOS SIMPLES DE IDENTIFICACIÓN DE OUTLIERS

  7. Las vallas exteriores de la variable estadística X: F1 = Q1 - 3 IQR [F1,F2] F2 = Q3 + 3 IQR 1´5 IQR IQR 1´5 IQR F1 f1 Q1 Q2 f2 F2 INLIER OUTSIDE Far-OUTSIDE 4.3-METODOS SIMPLES DE IDENTIFICACIÓN DE OUTLIERS

  8. Método de Recorte Datos TRIMMING ELIMINA T n se reduce xT, S2T, MeT 4.3-METODOS SIMPLES DE ACOMODACIÓN DE OUTLIERS

  9. Método de Reemplazamiento Número de observaciones: a) NO AGRUPADAS EN INTERVALOS: de las menores / de las mayores b) AGRUPADAS EN INTERVALOS: y ¿Quién es el último de los que quedan? a) La menor y mayor de las observaciones que quedan. b) es el extremo inferior del primer intervalo. Datos WINSORIZING SUSTITUIR W xw, S2w, Mow La observación menor de los que quedan La observación mayor que queda 4.3-METODOS SIMPLES DE ACOMODACIÓN DE OUTLIERS

  10. Diagrama de Caja y Bigotes 1) Min xi y Max xi 2) Q1, Q2 = Me, Q3 3) Valores Adyacentes: 4) OUTSIDES: FAR-OUTSIDES: * Va Va Min xi Max xi Q1 Q3 Q2 4.4-REPRESENTACIONES GRÁFICAS

  11. Diagrama de Vallas 1´5 IQR f1 f2 F1 F2 4.4-REPRESENTACIONES GRÁFICAS

  12. Diagrama de Esquemas RI(xi) = posición que ocupa, cuando los datos están ordenados de menor a mayor. RS(xi) = posición que ocupa, cuando los datos están ordenados de mayor a menor. n Prof(Me) Me Prof(Qi) Qi Q3 IQR Prof(Min) Min xi Max xi Rg 4.4-REPRESENTACIONES GRÁFICAS

  13. FIN José Antonio Cortegana Camúñez 2001-2002

More Related