140 likes | 386 Views
OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA. Gaj Vidmar 17. 12. 2008. Chu Shi Chieh (1303). KAKŠNI SO LAHKO PODATKI?. Nominalni kvalitativni brez vrstnega reda vrednosti barva oči/las, diagnoza, ... dihotomni = binarni (spol) Ordinalni semikvantitativni
E N D
OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA Gaj Vidmar 17. 12. 2008 Chu Shi Chieh (1303)
KAKŠNI SO LAHKO PODATKI? • Nominalni • kvalitativni • brez vrstnega reda vrednosti • barva oči/las, diagnoza, ... • dihotomni = binarni (spol) • Ordinalni • semikvantitativni • vrstni red brez stalnosti enote • šolske ocene, stopnja izobrazbe, ... • Intervalni • enota; ničelna vrednost poljubna • smiselne le razlike • oC, IQ, ... • Razmernostni • absolutna ničla • smiselna tudi razmerja • fizikalne količine, starost, ... opisni = kategorialni številski = numerični Osnove prikaza podatkov(G. Vidmar)
KAKO JIH LAHKO PRIKAŽEMO? • Kaj je graf? (Kosslyn, kogn.-psih./rač.-inf.) • prikaz enega ali več odnosov med entitetami • priročen način posredovanja podatkov • Vrste prikazov podatkov (v praksi prehodi, kombinacije, ...) • grafi (ožje, matematično) • diagrami • zemljevidi • skice, sheme } grafike, diagrami (širše) Osnove prikaza podatkov(G. Vidmar)
STATISTIČNI PRIKAZI PODATKOV • Sestavni deli • okvir diagrama, okvir osi, podatkovni okvir, meje • naslovi osi, razdelki na oseh, oznake na oseh • črte, ploskve, simboli, oznake vrednosti • Vrste prikazov • ena spremenljivka • za izbor prikaza bistven merski nivo (NOM, ORD, NUM) • dve spremenljivki • odnos = skupna porazdelitev • pogosto prikaz kot niz pogojnih porazdelitev • kombinacije merskih nivojev (NUM-NUM idr.) • več spremenljivk • kodiranje z grafičnimi elementi • dinamičnost doda čas • predstavitve ≥3D in za druge čute redko smiselne Osnove prikaza podatkov(G. Vidmar)
IZ PSIHOLOGIJE ZAZNAVANJA • pomen predzavestnega procesiranja • poteka hkrati z očesnimi gibi (~250 ms) • točnost in hitrost zaznavanja • vidnih lastnosti grafa • primeri Osnove prikaza podatkov(G. Vidmar)
IZ PSIHOLOGIJE ZAZNAVANJA • zakonitosti Gestalta • celota presega sestavne dele • z. podobnosti; z. bližine; z. skupne usode (inter.) • lik in ozadje; subjektivne konture • vidne iluzije • pri prikazu podatkov jih lahko • koristno uporabimo ali namenoma zlorabimo • prezremo in tako nenamenoma zavajamo Osnove prikaza podatkov(G. Vidmar)
IZ ZGODOVINE • najstarejši graf zbranih podatkov ~2000 pnš. • v renesansi skice, modeli – idiografski pristop • družbeni vzgibi za množične podatke • kapitalizem (industrijska revolucija) • imperializem (vojne) • “zlata doba” 19. stoletje: pionirji • W. Playfair (1759-1823) • C.J. Minard (1780-1870) • F. Nightingale (1820-1910) • Snow, Galton, Venn idr. • sodobna teorija • že predračunalniška (J.Bertin, 1918-) • velikani statistike (J.W.Tukey, 1915-2000) Osnove prikaza podatkov(G. Vidmar)
int. zazn. log Z int. dražljaja log I TEMELJNE ŠTUDIJE • točnost pri količinskih zaznavnih nalogah (Cleveland & McGill) • psihofizika grafov (FechnerjevStevensov model zastarel, a uporaben) položaj na isti osi položaj na razl.oseh dolžina kot, naklon ploščina prostornina barva Osnove prikaza podatkov(G. Vidmar)
TEMELJNE ŠTUDIJE • interpretacija vidnih lastnosti (Kosslyn idr.) • kar bolje razločujemo, lahko brez “intrinzičnega pomena” • dolžina, ploščina, prostornina: večje več • položaj: levo prvo/manj; zgoraj prvo/več • nasičenost (~sivin): temneje več • kot, naklon, barvni ton ? • uporabnost barv • usmerjenje pozornosti na izjemo • razločevanje med razredi kodiranje dodatne razsežnosti • nekatere lestvice splošno sprejete (semafor, višine na zem.) • v splošnem prepogosta raba (veliko kiča) • pozabljanje na znaten delež “barvno slepih” Osnove prikaza podatkov(G. Vidmar)
J.W. TUKEY (1915-2000) • Eksploratorna analiza podatkov (1971-1975) • zaboj z ročaji • Andrews, Chernoff, Everitt idr. • Anscombe (enaki povprečji, var, VKO, regresija, korelacija) Osnove prikaza podatkov(G. Vidmar)
FL = 2,8 E. TUFTE (1942-) • grafična odličnost vs. risbosmetje(chartjunk) kompleksne zamisli sporočiti jasno, natančno in učinkovito • faktor lažnjivosti (naj bo čim bližje 1) = velikost učinka na grafu / v podatkih • razmerje podatki-črnilo(naj bo čim večje) = črnila za podatke / vsega črnila na grafu Osnove prikaza podatkov(G. Vidmar)
N.B. ROBBINS (IZD. UČINKOVITEJŠE GRAFE) • Naj podatki izstopajo – opustimo nepotrebno (~mrežne črte) • Če prekrivanje, primerni simboli; nadomestimo ga s paneli • Jasnost osi in oznak na oseh • Jasnost naj se ohrani pri pomanjševanju • Skladnost z besedilom (tudi slike preglejmo) • Vedno rišimo v merilu • Spremembe ene razsežnosti ne prikazujmo s plošč. ali prostorn. • Če se le da, skupno izhodišče • Če se le da, oznake pri vrednostih • Med več načeli izberi tisto, ki bo najmanj verjetno zavajalo • Potrebna iterativnost, eksperimentiranje, trud in čas • Posebej pomembna so vprašanja osi • ničla? • prekinitve? • logaritmi? (ne pozabimo na osnovo 2) • dve različni? • če je pomembna razlika, narišemo razliko! • vse osi naj imajo razdelke, pazimo na razmike med njimi Osnove prikaza podatkov(G. Vidmar)
1990 INTERAKTIVNOST • od prvih mikroračunalnikov do najsodobnejših spletnih aplikacij • izrezovanje in povečevanje • premazovanje in povezovanje • OLAP, DM=PR, KDD=OZPZ • vrtanje in združevanje • vodeni ogledi Osnove prikaza podatkov(G. Vidmar)
TOREJ: KAJ IN KAKO PRIKAZATI? Vso resnico in nič drugega kot resnico! Osnove prikaza podatkov(G. Vidmar)