1 / 81

Skalowanie jednowymiarowe Wprowadzenie

Skalowanie jednowymiarowe Wprowadzenie. Intro. Zmienne obserwowalne i ukryte. Poziom pomiaru – typy zmiennych. Pomiar a skalowanie. Skalowanie. Skalowalność Wymiarowość Wskaźniki niezbędne Własności wskaźników Algorytm skalowania Wynik skalowania. Pomiar.

tana
Download Presentation

Skalowanie jednowymiarowe Wprowadzenie

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Skalowanie jednowymiarowe Wprowadzenie

  2. Intro

  3. Zmienne obserwowalne i ukryte Poziom pomiaru – typy zmiennych Pomiar a skalowanie Skalowanie Skalowalność Wymiarowość Wskaźniki niezbędne Własności wskaźników Algorytm skalowania Wynik skalowania

  4. Pomiar Pomiarem w sensie klasycznym jest operacją polegającą na • wykazaniu, że istnieje reguła, według której można przedmiotom przypisać liczby w taki sposób, aby na podstawie liczb przypisanych obiektom można było orzekać o zachodzeniu relacji empirycznych między nimi • (oraz) ustaleniuna ile to przyporządkowanie jest jednoznaczne, w jakim stopniu można modyfikować przypisane obiektom liczby bez utraty informacji o własnościach obiektów, którą zawierają, a więc czy istnieje wiele równoważnych sposobów tego przyporządkowania Mierzenie jest zatem operacją polegającą na dowodzeniu twierdzeń. Aby pokazać, o czym wypowiadają się twierdzenia i na czym polega ich dowodzenie, problem pomiaru trzeba sformułować formalnie

  5. Pomiar to reprezentowanie fizycznych własności obiektów przez liczby E = , E1, E2, …, Ek  = {1 , 2 , …., n } – zbiór obiektów empirycznych Empiryczny system relacyjny E1, E2, …, Ek - relacje między obiektami empirycznymi  = , R1, R2, …, Rk   - zbiór liczb, podzbiór zbioru liczb rzeczywistych Liczzbowy system relacyjny R1, R2, …, Rk - relacje między liczbami Fukcja pomiarowa f ustala odpowiedniośćmiędzy empirycznymi i liczbowym systemem relacyjnym f : E każdemu obiektowi empirycznemu I przyporządkowuje liczbę f(I) f() każdej empirycznej relacji E1, E2, …, Ekprzyporządkowuje relację liczbowąR1, R2, …, Rk: f(Ei) = Ri relacjom empirycznym między obiektami odpowiadająrelacje między przyporządkowanymi im liczbami iEkjf(i)Rk(j), gdzie Rk= f(Ek)

  6. Reprezentacyjna koncepcja pomiaru (Stevens, 1946) E = ,  1 = N1  , < Empiryczny system relacyjny N1 ={3, 5, 7} liczby 3 < 5 < 7 relacja mniejszości   Dwa liczbowe systemy relacyjne 1 2 3 2 = N2  , <  = {1, 2 , 3} obiekty empiryczne N2 ={¼, ⅓, ⅞} liczby ¼ < ⅓< ⅞ relacja mniejszości Jakie przekształcenie przeprowadza 1 w 2 ? empiryczna relacja bycia mniejszym 1  2 2  3 Relacje empiryczne trzeba ustalić praktycznie Relacje między sytemami liczbowymi mają charakter formalny

  7. Funkcja pomiarowa. Na ile sposobów można zmierzyć własności tych samych obiektów? f1 : E1 f1(1) = 3 f1(2) = 5 f1(3) = 7 f1() = N1 ={3, 5, 7} 1  2 3 < 5 2  3 5 < 7 f2 : E2 f2(1) = ¼ f2(2) = ⅓ f2(3) = ⅞ E = ,  f2() = N2 ={¼, ⅓, ⅞} 1  2 ¼ < ⅓ 2  3 ⅓ < ⅞ Jeden empiryczny system relacyjny – dwie funkcje pomiarowe. Co je łączy?

  8. Dwa problemy klasycznej teorii pomiaru Problem istnienia Jakie formalne cechy musi mieć empiryczny system relacyjny, aby istniała dla niego funkcja pomiarowa Problem jednoznaczności Jeśli dla danego empirycznego systemu relacyjnego istnieje funkcja pomiarowa, to co można zrobić z jej wartościami aby nie utracić informacji o własnościach obiektów Roziązanie obu problemów polegaja na udowodzeniu twierdzeń Twierdzenia dotyczą formalnych własności empirycznego systemu relacyjnego E = ,  Jeśli relacja  jest asymetryczna, spójna i przechodnia w  , to istnieje funkcja pomiarowa f : E, gdzie =, <, taka, że: i jf(i) <f(j), Każdą rosnąca funkcja funkcji f jest również funkcją pomiarową: f(i) < f(j) g(f(i)) <g(f(j))

  9. Klasyfikacja poziomów pomiaru – Typologia zmiennych statystycznych

  10. Klasyfikacja poziomów pomiaru – Typologia zmiennych statystycznych

  11. Klasyfikacja poziomów pomiaru – Typologia zmiennych statystycznych c.d.

  12. Funkcja pomiarowa a zmienna statystyczna X : N1 E = ,   = {1, 2 , 3} X(1) = 3 f1 : E1 1 = N1  , < X(2) = 5 N1 ={3, 5, 7} f1(1) = 3 X(3) = 7 f1(2) = 5  f1(3) = 7 N1 Funkcja pomiarowa Zmienna statystyczna

  13. Klasyfikacja poziomów pomiaru – Typologia zmiennych statystycznych c.d.

  14. Poziom pomiaru zmiennej statystycznej określa klasa dopuszczalnych przekształceń jej wartości

  15. Zmienna statystyczna jest zawsze obserwowalna

  16. Specyfika zmiennej binarnej

  17. Czym jest skalowanie Ogólny problem skalowania ={ω1, ω2, ..., ωn} (X1, X2, X3, ..., Xi, ..., Xk) :    W zbiorowości  zdefiniowano zestaw obserwowalnych zmiennych typu Xi, nazywanych wskaźnikami nieobserwowalnej zmiennej b Na podstawie łącznego rozkładu zmiennych –wskaźników wyznacz wartości zmiennej b dla każdego obiektu badanej zbiorowości

  18. Problem skalowania Wskaźniki są wynikiem pomiaru znanego typu, co oznacza, że dla każdego z nich znany jest zakres dopuszczalnych analiz statystycznych, które można na nich wykonywać X1 X2 X3 Xk Zmienną ukrytą b oraz obserwowalne wskaźniki typu Xi wiąże relacja „bycia wskazywanym”: każdy ze wskaźników „wskazuje” zmienną ukrytą b b Teoria b Poziom pomiaru wskaźników ogranicza repertuar środków statystycznych, za pomocą których opisuje się związek zmiennej ukrytej ze wskaźnikami Związek wskaźników ze zmienną ukrytą jest elementem teorii zjawiska (własności) reprezentowanej przez b

  19. Skalowanie wynika z teorii cechy ukrytej Cechy ukryte są elementem teorii zjawiska, która wiąże obserwacje (wskaźniki) z konstruktem teoretycznym (cecha ukrytą) za pomocą relacji korespondencji. Teoria zjawiska • Własności wskaźników (X1, X2, X3, ..., Xi, ..., Xk) • Własności cech ukrytych b1 , b2 , .... bm • Relacje (zależności) między cechami obserwowalnymi i ukrytymi RXb Korespondencja: Skala Skalogram Model skalowania reguły wnioskowania o cechach ukrytych na podstawie cech obserwowalnych

  20. Skalowanie a falsyfikacja teorii Model skalowania jest elementem teorii empirycznej Teoria może być empirycznie sfalsyfikowana Czy empirycznie stwierdzone własności obiektów empirycznych dają się poprawnie reprezentować liczbowo Problem pomiaru: Czy teoria empirycznie własności obiektów empirycznych, z której wynika model skalowania jest prawdziwa Problem skalowania:

  21. Składowe problemu skalowania Test teorii, z której wywodzi się model skalowania • Wykonalność skalowalność Czy spełnione obiekty empiryczne mają własności zakładane przez model skalowania Czy łączny rozkład wskaźników (X1, X2, X3, ..., Xi, ..., Xk) ma własności postulowane przez model skalowania Jeśli tak, to • W jaki sposób wyznaczyć wartości cechy ukrytej dla obiektu, kórego obserwowalne własności są znane • Askrypcja Algorytm skalowania • algorytm wyliczania wartości zmiennej ukrytej na podstawie wartości wskaźników

  22. SKALUJĄC: problemy do rozwiązania

  23. Kryteria oceny modelu skalowania • Niezmienniczość wyników skalowania przy dopuszczalnych poziomem pomiaru przekształceniach wskaźników; • Optymalność algorytmu skalowania, • Jednoznaczność i przekonywujące uzasadnienia dla decyzji, które trzeba podejmować rozwiązując problemy (1) - (8) wymienione wyżej.

  24. NURTY TEORII SKALOWANIA Typ relacji między cechą ukrytą, wymiarem a wskaźnikami Addytywne Kumulatywne nominalne interwałowe binarne porządkowe Mieszane Poziom pomiaru wskaźników

  25. Popularne metody analizy danych - szczególne przypadki modeli skalowania

  26. Skalowanie kumulatywne Bogardus Guttman Mokken Rasch

  27. Nieco historii Bogardus, 1926: skala uprzedzeń (dystansów) etnicznych

  28. Skok wzwyż

  29. Funkcje reakcji na pozycje testu

  30. Model skalowania w zapisie formalnym , , , , P •  = {ω1, ω2, ω3, ..., ωv, ..., ωn} jest n-elementowym zbiorem obiektów, •  jest k-elementowym zbiorem binarnych wskaźników (X1, X2, X3, ..., Xi, ..., Xk), •  jest jednowymiarową zmienną ukrytą określoną w , •  jest ck-elementowym wektorem parametrów wskaźników (X1, ..., Xk), gdzie c=1, 2, 3, ... oznacza liczbę parametrów pojedynczej funkcji reakcji;  można też traktować jako funkcję, która wskaźnikom przyporządkowuje ich parametry, liczby rzeczywiste, • P jest funkcją reakcji wiążącą prawdopodobieństwo P(Xiv=x), x{0,1} reakcji obiektu ωv na wskaźnik Xi z poziomem cechy ukrytej obiektu (ωv) oraz poziomem trudności wskaźnika i.

  31. Skalogram Guttmana w wersji deterministycznej i probabilistycznej • (porządek osób) Osoby różnią się pod względem poziomu „umiejętności” () i można je ze względu na tę cechę uporządkować. • (porządek wskaźników) Wskaźniki różnią się ze względu na stopień „trudności” () i można je ze względu na tę własność uporządkować. • (kumulatywność reakcji) każdy, kto zareagował pozytywnie/poprawnie na wskaźnik o pewnym stopniu trudności reaguje pozytywnie/poprawnie na wszystkiełatwiejsze wskaźniki:

  32. Dopuszczalne i niedopuszczalne profile reakcji w skalogramie Guttmana Zielone profile: dopuszczalne Strukturalne zero

  33. Dane przykładowe

  34. Praktyka skalowania modelem Guttmana Współczynnik skalowalności = funkcja liczby (proporcji) profili niezgodnych w próbie Decyzja o skalowalności

  35. Skalogram Guttmana - podsumowanie

  36. Skalogram Guttmana – podsumowanie c.d.

  37. Czy skalogram Guttmana jest „dobrym modelem skalowania”

  38. Kumulatywność w wersji probabilistycznej

  39. Założenia probabilistycznych modeli skalowania kumulatywnego a sytuacja testowania kompetencji

  40. Lokalna niezależność reakcji • poziom cechy ukrytej osoby reagującej na wskaźniki jest taki sam bez względu na ich kolejność „podawania”, • prawdopodobieństwa „poprawnych” reakcji na kolejne wskaźniki zależą wyłącznie od odległości między poziomem cechy ukrytej odpowiadającego i poziomem „trudności” wskaźników, • prawdopodobieństwo serii reakcji na wskaźniki dla pojedynczej osoby jest równe iloczynowi prawdopodobieństw reakcji na każdy ze wskaźników z osobna.

  41. Lokalna niezależność reakcji reakcje na poszczególne wskaźniki w grupach osób o tym samym poziomie umiejętności są od siebie stochastycznie niezależne Kumulatywnośc reakcji reakcje na wskaźniki są stochastycznie pozytywnie zależne.

  42. Przykład skalogramu Guttmana

  43. Model Mokkena Krzywe reakcji na trzy wskaźniki w modelu Mokkena

  44. Skalogram Mokkena dla trzech wskaźników dychtomicznych

  45. Konsekwencje założeń Mokkena - zależność wskaźników Macierz częstości łącznych – zera strulturalne

  46. Mokken scale – własności Statystyka dostateczna cechy ukrytej b - jak u Guttmana – suma punktów Stopień zgodności danych z modelem Współczynniki Loevingera

  47. Skalogram Mokkena - podsumowanie I. Problem skalowalności Zalążkowe kryteria, często typu ad hoc pozwalają uznać zestaw wskaźników określonych w pewnej zbiorowości za nieskalowalny jeśli zdarzy się jedna z dwóch sytuacji :współczynnik Lovinger dla całego zestawu będzie niższy niż 0,3 (według Mokkena) albo, gdy macierze P11 i P00 będą zawierały wartości zbyt odległe od oczekiwanych, przy czym nie wiadomo co to znaczy "zbyt odległe". Trudno uznać powyższe kryteria rozstrzygania za dobrze uzasadnione, a ponadto oba te warunki są względnie od siebie niezależne. II. Problem liczby wymiarów cechy ukrytej i relacji między nimi Podobnie jak w modelu Guttmana, w skalogramie Mokkena nie ma procedury pozwalającej rozstrzygać tę kwestię. III. Czy wszystkie wskaźniki są potrzebne? Standardowy test dla identyczności populacyjnych proporcji dla zmiennych binarnych (test McNemara) pozwala z w zestawie wskaźników wyeliminować te, które są w nim zbędne, a decyzję przekonywująco, bo statystycznie, uzasadnić. Słabsze podstawy statystyczne ma decyzja o eliminacji z zestawu wskaźnika, dla którego współczynnik Loevinger Hi przyjmuje wartość niższą niż 0,3. Niektórzy autorzy jako uzasadnienie decyzji o niekumulatywności rozkładów łącznych, w których występuje wskaźnik Xi proponują używać statystyki testującej hipotezę, że współczynnik Loevingera Hi dla tego wskaźnika ma w populacji wartość 0, przeciwko hipotezie, że tak nie jest. Zauważmy jednak, że w ten sposób testowana jest hipoteza o niezależności stochastycznej wskaźników a nie o zgodności ich rozkładu z konsekwencjami założenia podwójnej monotoniczności. IV. Jakie są własności diagnostyczne poszczególnych wskaźników? Test McNemara pozwala wykryć wskaźniki o identycznych własnościach diagnostycznych, o tym samym poziomie trudności. Innych parametrów własności diagnostycznych pytań wskaźnikowych skalogram Mokkena nie przewiduje V. Jak skalować - funkcja agregująca profile Mokken wykazał, że liczba poprawnych odpowiedzi jest statystyką dostateczną dla skalowanej cechy ukrytej. Jest to minimalny wymóg stawiany wszelkim procedurom estymacyjnym i dzięki jego spełnianiu można powiedzieć, że w modelu Mokkena oszacowuje się częstości rozkładu cechy ukrytej .

  48. Zmienna losowa o rozkładzie logistycznym

  49. Funkcja logistyczna z parametrem a

More Related