130 likes | 314 Views
Štatistické spracovanie údajov „Najbežnejšie chyby a ako sa im vyhnúť“. Mari án Rimarčík, PhD. http://rimarcik.com. Výskum. Špecifikácia problému a stanovenie cieľov Plán výskumu Zber údajov Analýza údajov Prezentácia výsledkov. Chyby. Nejasne definované ciele, hypotézy
E N D
Štatistické spracovanie údajov „Najbežnejšie chyby a ako sa im vyhnúť“ Marián Rimarčík, PhD. http://rimarcik.com
Výskum • Špecifikácia problému a stanovenie cieľov • Plán výskumu • Zber údajov • Analýza údajov • Prezentácia výsledkov
Chyby • Nejasne definované ciele, hypotézy • Chýba podrobný postup výberu vzorky • Zlá konštrukcia dotazníka (zbytočne veľa otázok, nejasné, nevyužitie overených nástrojov, chýbajúca pilotná štúdia, nepreviazanosť na ciele a hypotézy) alebo zlý plán experimentu • Zber dát pomocou papiera • Neadekvátna štatistická analýza • Nedostatočná, príp. zlá interpretácia výsledkov
Deskriptívna štatistika Úlohou opisnej štatistiky je vytvorenie prehľadu o získaných údajoch, ktoré samé o sebe predstavujú iba zmes čísel, príp. písmen. Na tento účel slúžia: - opisné charakteristiky - tabuľky - grafy
Chyby • Chýbajúca tabulácia a čistenie dát • Výpočet priemerov z kvalitatívnych premenných, ktorých hodnoty (kategórie) boli očíslované • Nahrádzanie chýbajúcich hodnôt 0/99 • Použitie n-tice koláčových grafov na opísanie rozdelenia kvalitatívnej premennej v rôznych skupinách • Nevyužitie mier sily vzťahu (r, tau, eta, V) • Bivariačný prístup (falošná korelácia)
Induktívna štatistika • Úlohou induktívnej štatistiky je na základe informácii získaných z náhodných vzoriek robiť závery o celých základných súboroch z ktorých vzorky pochádzajú: - testy štatistických hypotéz (významnosti) - intervalové odhady
1. Chyba • Formulovanie záverov v podobe kauzality u korelačných výskumov (pozorovacích štúdií vrátane dotazníkových v ktorých nezasahujeme do premenných, len ich meriame a hľadáme vzťahy). • Údaje z korelačného výskumu môžu byť interpretované v kauzálnej podobe iba na základe a priórnych teórií. Nemôžu však nezvratne a jednoznačne dokazovať kauzalitu.
2. Chyba • absencia vopred formulovaných hypotéz => realizácia mnohých porovnaní • z dotazníka s 20 otázkami možno urobiť 190 párových porovnaní • pri použití 5% hladiny významnosti bude z 20 porovnaní 1 významné čistou náhodou • Typicky viac ANOVA namiesto MANOVA
3. Chyba • Použitie induktívnej štatistiky na vzorkách, ktoré neboli získané náhodným výberom (napr. kvótne výbery) a cenzusoch (vyšetrovanie celej populácie). => Vypočítaná P-hodnota je ničnehovoriace číslo. Zovšeobecňovanie záverov z nenáhodných výberov je nemožné. Dôvody: - neznalosť spojená s falošným dojmom vedeckosti - predstava, že každá hypotéza sa musí overovať pomocouštatistického testu
4. Chyba • Tradičné metódy pri výpočte pravdepodobnosti predpokladajú jednoduchý náhodný výber z nekonečne veľkej populácie (prakticky stačí N > 1500) => bez korekcie sú výsledky nesprávne (Pre zložitejšie metódy neexistujú vzorce pre zložitejšie formy náhodných výberov)
5. Chyba • Parametrické metódy vyžadujú normálne rozdelenie • Testy normality treba brať s rezervou • Najdôležitejší je histogram + box plot a kontrola odľahlých a extrémnych pozorovaní • CLV vyžaduje veľké vzorky (n> 50, > 100) • Ordinálna premenná: min. 5 kategórií bez výrazných rozdieloch vo vzdialenostiach
Štatistický navigátor Výber štatistickej metódy v závislosti od • Cieľa • Počtu skúmaných premenných • Typu škál • Typu vzorky http://rimarcik.com