E N D
1. ANALIZA NOMINALNIH VARIJABLI
3. Stanislav Fajgelj April 2006. 3 LITERATURA Petz, B. (2004), Osnovne statisticke metode za nematematicare, Jastrebarsko: Naklada Slap.
StatSoft, Inc. (2005). Electronic Statistics Textbook. Tulsa, OK: StatSoft
Fajgelj, S. (2005). Psihometrija Metod i teorija psiholokog merenja, II dopunjeno izdanje, Centar za primenjenu psihologiju, Beograd.
Momirovic, K. (1988). Uvod u analizu nominalnih varijabli, Metodoloke sveske, Jugoslovensko udruenje za sociologiju, Ljubljana.
Tenjovic, L. (2002). Statistika u psihologiji, Beograd: Centar za primenjenu psihologiju.
4. Stanislav Fajgelj April 2006. 4 Literatura Anderberg, M.R. (1973). Cluster Analysis for Applications, Academic Press, London.
Garson, G. D. (2000). Quantitative Research in Public Administration PA 765 Statnotes: An Online Textbook, North Carolina State University, Raleigh, http:// www2.chass.ncsu. edu/ garson/pa765/statnote.htm.
De Leeuw, J. (1993). Some Generalizations of Correspondence Analysis, Tehnicki izvetaj, Preprint 117, UCLA Statistics Series, www.stat.ucla.edu/papers/preprints.
Grimm, L.G., Yarnold, P.R. (1995). Reading and understanding multivariate statistics, Washington, DC: American Psychological Association.
5. Stanislav Fajgelj April 2006. 5 Izvod iz teorije merenja Po teoriji merenja:
Merenje je dodeljivanje numerala objektima shodno naucnim zakonima
Pravo merenje je onda kada dodeljeni numerali predstavljaju brojeve i kada su aritmeticke operacije na njima jednake operacijama na objektima
Na primer: sabiranje duine dva tapa 0,5m + 0,5m = 1m, daje isti rezultat kao spajanje dva tapa
6. Stanislav Fajgelj April 2006. 6 Izvod iz teorije merenja Ovakva i sve slicne definicije merenja se nazivaju reprezentacijskim, jer dodeljivanje numerala ima za cilj to bolje reprezentovanje stvarnosti
Nasuprot tome stoji teorija merenja Stanley Smith Stevensa, cija se definicija merenja naziva operacionalistickom
7. Stanislav Fajgelj April 2006. 7 NIVOI MERENJA Stevens je definisao cetiri nivoa merenja
Nivoe merenja je definisao operacijama merenja, operacijama dodeljivanja numerala objektima i dopustivim transformacijama na dodeljenim numeralima
Nakon toga je za svaki nivo merenja odredio osnovne statisticke tehnike koje su mu primerene
8. Stanislav Fajgelj April 2006. 8 NIVOI MERENJA Nominalni identifikacija i klasifikacija objekata
Ordinalni razvrstavanje objekata u poredak
Intervalni objektima se dodeljuju brojevi tako da razmaci izmedu brojeva budu srazmerni razlikama u svojstvu
Racio dodeljeni brojevi imaju ne samo jedinicu merenja, nego i nulu
9. Stanislav Fajgelj April 2006. 9 Nominalni nivo merenja Po formalnoj teoriji merenja ovaj Stevensov nivo ne predstavlja merenje
Sa istraivackog stanovita, medutim, identifikacija i klasifikacija jesu polazne operacije svakog merenja
Dakle, ako ga prihvatimo kao merenje, on je najnii nivo merenja
10. Stanislav Fajgelj April 2006. 10 NOMINALNE VARIJABLE Poto je varijabla rezultat merenja... varijable na nominalnom nivou sadre samo identifikaciju i klasifikaciju objekata, a ne sadre nikakvu kvantifikaciju nekog svojstva.
Zato se nominalne varijable cesto nazivaju kvalitativnim varijablama: npr. bracno stanje, nacionalnost, vrsta sporta
Nominalne varijable su, takode, diskontinuirane, kategorijalne varijable
11. Stanislav Fajgelj April 2006. 11 Nominalne varijable Na nominalnim varijablama doputene su prakticno sve transformacije
Osim transformacije sve-u-jedan kada se objekti vie ne mogu razlikovati
Ako je transformacija mnogo-u-jedan, onda se informacije o nekim objektima gube
Nominalni nivo merenja doputa najvecu slobodu transformisanja, ali to je zato to sadri najmanje znacenja
12. Stanislav Fajgelj April 2006. 12 BINARNE VARIJABLE Binarne varijable imaju specijalna svojstva
One su bez skale, mogu biti nominalne, ordinalne ili intervalne
Veliki broj naprednih statistickih tehnika za analizu nominalnih varijabli se zasniva na eksplicitnoj ili implicitnoj transformaciji nominalnih varijabli u binarne
13. Stanislav Fajgelj April 2006. 13 Binarne varijable Poto su binarne varijable bezskalne, to istraivaci tumace kao mogucnost da ih tretiraju kao intervalne
Medutim, binarne varijable sadre najmanje informacija o merenom svojstvu
Njihova varijansa je znatno nia od politomnih varijabli (max 0,25)
Zato su one znatno manje sposobne da koreliraju sa drugim varijablama
14. Stanislav Fajgelj April 2006. 14 TRANSFORMACIJE U ORDINALNE, INTERVALNE ILI BINARNE VARIJABLE Vecina nominalnih varijabli su parcijalno nominalne i parcijalno ordinalne (npr. ne znam)
Transformacija u ordinalnu i intervalnu varijablu je moguca na osnovu dodatnih informacija
Obicno se vri na osnovu korelacije ili regresije sa jednom ili vie ordinalnih ili intervalnih varijabli
Razbijanje u dve ili vie dihotomnih binarnih varijabli i gradnja indikatorskih ili selektorskih matrica
15. Stanislav Fajgelj April 2006. 15 BINOMNA RASPODELA p=f/n
M=np
d2=npq
16. Stanislav Fajgelj April 2006. 16 MULTINOMNA RASPODELA pj=fj/n j=1,...,g (broj kategorija)
Mj=npj
dj2=npjqj
djk= npjqk
17. Stanislav Fajgelj April 2006. 17 Analiza nominalnih varijabli Izbor statisticke tehnike zavisi od nacrta istraivanja
Neka istraivanja raspolau jedino nominalnim varijablama (recimo ankete)
Mnoga istraivanja raspolau varijablama svih nivoa
Mnoge snane statisticke tehnike su bazirane na barem jednoj nominalnoj varijabli (npr. ANOVA)
18. Stanislav Fajgelj April 2006. 18 Analiza nominalnih varijabli Dva osnovna pristupa:
Transformacija nominalnih u intervalne
Binarizacija razbijanje u indikatorske matrice
Generalno analiza nominalnih varijabli trpi od cinjenice da nominalne varijable sadre minimalno znacenje o merenoj pojavi
19. Stanislav Fajgelj April 2006. 19 Analiza nominalnih varijabli Deskriptivna statistika
Statistika zakljucivanja
Multivarijatna statistika
20. Stanislav Fajgelj April 2006. 20 Deskriptivna statistika nominalnih varijabli Doputeni statistici za nominalne varijable
Frekvencije, proporcije i procenti
Mod
Entropija (analogna varijansi)
21. Stanislav Fajgelj April 2006. 21 STATISTIKA ZAKLJUCIVANJA Standardna greka proporcija
Intervali poverenja za proporcije
Testiranje znacajnosti razlika proporcija
?2 test za testiranje distribucije frekvencija nominalne varijable
22. Stanislav Fajgelj April 2006. 22 STATISTIKA ZAKLJUCIVANJA
test znacajnosti nulte hipoteze
=
velicina efekta x velicina uzorka
23. Stanislav Fajgelj April 2006. 23 Izbor tehnike testa Da li ispitujemo razlike izmedu grupa ili povezanost izmedu varijabli
Koliko imamo nezavisnih i zavisnih varijabli
ili
Koliko grupa imamo
Kakva je priroda nivo merenja NV i ZV
24. Stanislav Fajgelj April 2006. 24 Testiranje razlika izmedu grupa Ono se koristi kada je nezavisna varijabla (NV) kategorijalna
NV moe biti prirodno kategorijalna (pol), ordinalna, ili dobijena klasifikacijom kontinualne varijable
Vano je pitanje koliko nivoa-kategorija ima NV
Ispituju se razlike izmedu grupa s obzirom na vrednosti zavisne varijable (ZV).
25. Stanislav Fajgelj April 2006. 25 Testiranje razlika izmedu grupa dihotomna NV Sledece vano pitanje je priroda ZV
ZV je kontinualna i normalna
t-test, jednosmerna ANOVA
ZV je ordinalna ili nije normalna
Mann-Whitneyev test, Wilcoxonov test
ZV je nominalna ili dihotomna
podaci su obicno frekvencije
?2 test ili McNemarov test
26. Stanislav Fajgelj April 2006. 26 Testiranje razlika izmedu grupa dihotomna NV Sledece vano pitanje je da li su uzorci zavisni ili nezavisni
Ako su uzorci nezavisni:
t-test za nezavisne uzorke ili jednosmerna ANOVA
Mann-Whitneyev test
?2 test
Ako su uzorci zavisni:
t-test za zavisne uzorke
Wilcoxonov test
McNemarov test
27. Stanislav Fajgelj April 2006. 27 ZAVISNI I NEZAVISNI UZORCI Nezavisni uzorci nastaju slucajnim biranjem
Zavisni uzorci nastaju kada su svojstva objekta u jednom uzorku povezana sa svojstvima odgovarajuceg objekta u drugom uzorku
Ponovljena merenja
Jednacenje grupa po parovima
Uvek kada se moe utvrditi znacajna korelacija (izmedu AS, svojstava...) npr. biranje lancem preporuka
28. Stanislav Fajgelj April 2006. 28 Testiranje razlika izmedu grupa politomna NV Kad su uzorci nezavisni
ZV je kontinualna i normalna
Jednosmerna ANOVA
ZV je ordinalna ili nije normalna
Kruskal-Wallisov test
ZV je nominalna ili dihotomna
?2 test
29. Stanislav Fajgelj April 2006. 29 Testiranje razlika izmedu grupa politomna NV Kada su uzorci zavisni
ZV je kontinualna i normalna
Nacrt ponovljenih merenja, generalni linearni modeli (GLM)
ZV je ordinalna ili nije normalna
Friedmanov test
ZV je nominalna ili dihotomna
Cochranov Q test
30. Stanislav Fajgelj April 2006. 30 Testiranje razlika izmedu grupa vie NV Vrlo vano pitanje je pitanje broja NV. Kada ima vie NV:
ZV je kontinualna i normalna
Faktorska ANOVA, ANCOVA ili GLM, bez ili sa ponovljenih merenja u zavisnosti od tipa uzorka
ZV je nominalna ili dihotomna
Log-linearni modeli
31. Stanislav Fajgelj April 2006. 31 TOK ODLUCIVANJA ZA RAZLIKE podaci su frekvencije Koliko nivoa 2 >2
NV
Zavisni ili
nezavisni
uzorci
Vrsta
testa
32. Stanislav Fajgelj April 2006. 32 TOK ODLUCIVANJA ZA RAZLIKEpodaci su kvantitativni i normalno distrubirani Koliko nivoa 2 >2
NV
Zavisni ili
nezavisni
uzorci
Vrsta
testa
33. Stanislav Fajgelj April 2006. 33 Testiranje povezanosti varijabli jedna NV i jedna ZV Osnovno pitanje je o prirodi ZV i NV
Ako su obe varijable kontinualne i normalne
Pearsonov r ili bivarijatna regresija
Obe varijable su ordinalne ili nisu normalne
Kendallov tau ili Spearmanov rho
Jedna varijabla je kontinualna a druga nominalna
Korelacioni odnos eta
Obe varijable su nominalne ili dihotomne
fi-koeficijent ili Cramerov V
34. Stanislav Fajgelj April 2006. 34 Testiranje povezanosti varijabli vie NV Sledece vano pitanje je pitanje broja NV
Vie kontinualnih i normalnih NV
ZV je kontinualna: viestruka regresija
ZV je nominalna: diskriminaciona analiza
Neke NV su normalne, neke dihotomne
ZV je kontinualna: viestruka regresija
ZV je dihotomna: logisticka regresija
Sve NV su dihotomne
ZV je kontinualna: viestruka regresija
ZV je dihotomna: logisticka regresija
35. Stanislav Fajgelj April 2006. 35 TOK ODLUCIVANJA ZA POVEZANOSTIpodaci su frekvencije Koliko 2 >2*
varijabli
Vrsta
koeficijenta
* U parovima, ili log-linearni modeli
36. Stanislav Fajgelj April 2006. 36 Indikatorske matrice
37. Stanislav Fajgelj April 2006. 37 INDIKATORSKE MATRICE
38. Stanislav Fajgelj April 2006. 38 ANALIZA KONTINGENCIONIH TABELA Dve kategorijalne varijable, V1 i V2
V1 ima r kategorija, a V2 c
B1 i B2 su njihove indikatorske matrice
fij su frekvencije
39. Stanislav Fajgelj April 2006. 39 ANALIZA KONTINGENCIONIH TABELA
40. Stanislav Fajgelj April 2006. 40 ANALIZA KONTINGENCIONIH TABELA
41. Stanislav Fajgelj April 2006. 41 ANALIZA KONTINGENCIONIH TABELA
42. Stanislav Fajgelj April 2006. 42 ANALIZA KONTINGENCIONIH TABELA
?2 = 4,12
Za bss=(r1) (c1)=2, p>0,05
43. Stanislav Fajgelj April 2006. 43
Cramerov
Pearsonov koeficijent kontingencije
POKAZATELJI ASOCIJACIJE DVE KATEGORIJALNE VARIJABLE IZ ?2
44. Stanislav Fajgelj April 2006. 44 POKAZATELJI ASOCIJACIJE DVE KATEGORIJALNE VARIJABLE IZ ?2 f; 0 = f = (k 1), k=min(r,c). f2 je zbir kvadrata svih netrivijalnih kanonickih korelacija.
V2 = f2 / (k 1)
Oni nisu pokazatelji maksimalne povezanosti varijabli V1 i V2, nego prosecne. Zato tee da je podcenjuju.
Cramerov 0 = V = 1 i po njemu se mogu porediti tabele razlicite velicine.
45. Stanislav Fajgelj April 2006. 45 POKAZATELJI ASOCIJACIJE DVE KATEGORIJALNE VARIJABLE IZ ?2 C koeficijent nije cvrsto teorijski utemeljen.
Krece se u rasponu 0 = C < 1, dakle, nikada ne dostie 1.
Maksimalna vrednost zavisi od velicine tabele, pa, dakle, nije pogodan za poredenje na tabelama razlicite velicine.
46. Stanislav Fajgelj April 2006. 46 OSTALI POKAZATELJI ASOCIJACIJE DVE KATEGORIJALNE VARIJABLE Pored mera asocijacije zasnovanih na ?2 metrici, razvijeni su pokazatelji koji se zasnivaju na:
redukciji greke prognoze jedne varijable ako je poznata druga, ili na
Entropiji ili uslovnoj entropiji nominalnih varijabli
Ove mere imaju obicno asimetricnu i simetricnu verziju
47. Stanislav Fajgelj April 2006. 47 OSTALI POKAZATELJI ASOCIJACIJE DVE KATEGORIJALNE VARIJABLE Razvijeni su pokazatelji asocijacije dve nominalne varijable pod nekim posebnim pretpostavkama
Za saglasnost dva procenjivaca: Cohenova kappa
Za razliku pre posle: Mc Nemmar
Za nezavisnost ocena u vie ponovljenih merenja: MantelHaenszel
48. Multivarijatna analiza nominalnih varijabli
49. Stanislav Fajgelj April 2006. 49 LOGLINEARNI MODELI Analogni faktorskim nacrtima analize varijanse.
Dve ili vie nominalnih varijabli su prediktori (nezavisne varijable), a frekvencije u tabeli su kriterijum (zavisna varijabla).
Svaka nominalna varijabla je glavni efekt, a njihove kombinacije su efekti interakcije.
50. Stanislav Fajgelj April 2006. 50 LOGLINEARNI MODELI Posebno su pogodni za tabele kontingencije sa vie ulaza
Ocenjuje se doprinos svakog glavnog efekta zasebno
Ocenjuje se i doprinos interakcije glavnih efekata
Interakcije vieg reda se obicno iskljucuju iz modela (nezasiceni modeli).
51. Stanislav Fajgelj April 2006. 51 LOGLINEARNI MODELI Loglinearni model za kontingencionu matricu sa dve varijable (puni zasiceni):
ln(eij) = ? + ?i + ?j + ?ij
? i ? su parametri modela.
Obicna analiza kontaba podrazumeva model: ln(eij) = ? + ?i + ?j, dakle bez interakcije varijable su nezavisne.
52. Stanislav Fajgelj April 2006. 52 GLAVNE KOMPONENTE Analiza glavnih komponenti nominalnih varijabli bazira se na: indikatorskim matricama B
Trai se svojstvena struktura matrice:
P = BtBn-1
Tacnije vri se dekompozicija singularnih vrednosti matrice B:
B = U?1/2Vt
Matrica P je singularna: ima m 1 nultih svojstvenih vrednosti. Takode, prva svojstvena vrednost je trivijalna jer je uvek 1.
53. Stanislav Fajgelj April 2006. 53 OSTALE TEHNIKE MVA Na indikatorskim matricama baziraju se i sve druge tehnike MVA koje u osnovi imaju glavne komponente ili dekompoziciju singularnih vrednosti (SVD):
Kanonicka korelaciona analiza
Faktorska analiza
Kanonicka diskriminativna analiza
Viestruka regresiona analiza
Naravno, ako su varijable izvorno dihotomne, tehnike MVA se primenjuju direktno
54. Stanislav Fajgelj April 2006. 54 KORESPONDENTNA ANALIZA Postoji bivarijatna i multivarijanta korespondentna analiza
U oba slucaja se slikovito moe opisati kao faktorska analiza kontingencione tabele
Vani termini su: profili, mase, inercije i kosinusi uglova.
Oni se odnose na poloaj tacaka u prostoru
Tacke su kategorije nominalnih varijabli
Najkorisniji je graficki prikaz rasprenja tacaka
55. Stanislav Fajgelj April 2006. 55 OPTIMALNO SKALIRANJE Ono je veoma blisko korespondentnoj analizi. Radi se o vrlo slicnoj grupi metoda koje u raznim zemljama imaju razlicite nazive
Optimalno skaliranje prihvata varijable svih nivoa merenja
Cilj analize je da se sve ukljucene varijable kvantifikuju tako da zadovoljavaju kriterijum homogenosti
56. Stanislav Fajgelj April 2006. 56 OPTIMALNO SKALIRANJE Kategorije nominalnih varijabli se takode kvantifikuju, pa je optimalno skaliranje jedan od najboljih nacina da se nominalne varijable transformiu u intervalne kvantifikuju
Drugi osnovni cilj optimalnog skaliranja je slican korespondentnoj analizi: faktorska analiza skupa varijabli
Graficki prikaz kategorija i objekata
57. Stanislav Fajgelj April 2006. 57 KLASTER ANALIZA Najceci nacin je da se izracunaju distance na nominalnim varijablama
Racunanje ovih distanci je olakano ako su varijable dihotomne
Na matrici distanci objekata se onda moe primeniti bilo koja hijerarhijska ili nehijerahijska metoda
58. Stanislav Fajgelj April 2006. 58 KLASTER ANALIZA Alternativno, nominalne varijable se mogu transformisati u intervalne i zatim podvrci klasterisanju
Takav pristup je usvojen u optimalnom skaliranju nominalne varijable se prvo kvantifikuju
59. Stanislav Fajgelj April 2006. 59 KLASTER ANALIZA Takode, moguce je primeniti konverziju nominalnih varijabli u indikatorske matrice, na osnovu toga izvriti kvantifikaciju putem GK i nastaviti sa uobicajenim postupkom klaster analize
Na indikatorskim matricama moguce je primeniti i neuronske mree