150 likes | 287 Views
Wielowymiarowa analiza danych oparta na modelach gradacyjnych. Z implementacją w programie GradeStat 1. E. Pleszczyńska, E. Jarochowska, W. Szczesny Instytut Podstaw Informatyki PAN http://gradestat.ipipan.waw.pl.
E N D
Wielowymiarowa analiza danych oparta na modelach gradacyjnych Z implementacją w programie GradeStat1 E. Pleszczyńska, E. Jarochowska, W. Szczesny Instytut Podstaw Informatyki PAN http://gradestat.ipipan.waw.pl Artykuł częściowo finansowany z projektu badawczego nr 3T11CO5328przyznanego przez Ministerstwo Nauki i Informatyzacji
We point out that models based on probability theory, and the statistical techniques derived from them, have limited applicability, at least in exploratory multivariate situations. Jan de Leeuw
Plan referatu • Czym jest Gradacyjna Analiza Danych? • Przykład analizy – dane ekonomiczno-gospodarcze • Wykrywanie elementów odstających • Odwracanie zwrotu zmiennych • Schematy gradacyjnego przetwarzania danych w teraźniejszości i przyszłości
Gradacyjna Analiza Danych Parom rozkładów przyporządkowuje się zmienną „lilipucią” reprezentującą koncentrację jednego rozkładu względem drugiego Para rozkładów Krzywa koncentracji
Implementacja w GradeStat • GCA (ang. grade correspondence analysis) • Analiza skupień (GCCA) • Wykrywanie elementów odstających • Wizualizacja: mapy nadreprezentacji
Przykład analizy gradacyjnej • Dane Europejskiego Biura Statystycznego • 25 krajów UE • Zmienne ekonomiczne mierzone na różnych skalach absolutnych: dzietność, zużycie energii, inflacja, przewidywana dlugość życia etc.
Mapy odstępstw od regularności Przed odwróceniem zwrotu zmiennych Po odwróceniu zwrotu zmiennych 11, 12, 13 i 14
Mapy wskaźników korelacji Przed odwróceniemzwrotu zmiennych Po odwróceniu zwrotu zmiennych11, 12, 13, 14
Schematy gradacyjnego przetwarzania danych Dla pary zmiennych: Pomiar asymetrii, spłaszczenia i nierówności Krzywa koncentracji Krzywa maks. koncentracji Dla tablicy m×k: HGCA. Pomiar asymetrii, spłaszczenia i nierówności. Powierzchnia koncentracji Powierzchnia maks. koncentracji
Literatura • Kowalczyk T., Pleszczyńska E., Ruland F. (red.), Grade Models and Methods for Data Analysis with Applications for the Analysis of Data Populations. Berlin, Springer-Verlag, 2004. • Książyk J., Matyja O., Pleszczyńska E., Wiech M. (red.), Analiza danych medycznych i demograficznych przy użyciu programu GradeStat, Warszawa, IPI PAN i Instytut „Pomnik – Centrum Zdrowia Dziecka”, 2005.
http://gradestat.ipipan.waw.pl Zapraszamy na stronę programu: • GradeStat do pobrania • Samouczek programu • Przykłady zastosowania