1 / 12

Štatistické spracovanie údajov „Najbežnejšie chyby a ako sa im vyhnúť“

Štatistické spracovanie údajov „Najbežnejšie chyby a ako sa im vyhnúť“. Mari án Rimarčík, PhD. http://rimarcik.com. Výskum. Špecifikácia problému a stanovenie cieľov Plán výskumu Zber údajov Analýza údajov Prezentácia výsledkov. Chyby. Nejasne definované ciele, hypotézy

vadin
Download Presentation

Štatistické spracovanie údajov „Najbežnejšie chyby a ako sa im vyhnúť“

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Štatistické spracovanie údajov „Najbežnejšie chyby a ako sa im vyhnúť“ Marián Rimarčík, PhD. http://rimarcik.com

  2. Výskum • Špecifikácia problému a stanovenie cieľov • Plán výskumu • Zber údajov • Analýza údajov • Prezentácia výsledkov

  3. Chyby • Nejasne definované ciele, hypotézy • Chýba podrobný postup výberu vzorky • Zlá konštrukcia dotazníka (zbytočne veľa otázok, nejasné, nevyužitie overených nástrojov, chýbajúca pilotná štúdia, nepreviazanosť na ciele a hypotézy) alebo zlý plán experimentu • Zber dát pomocou papiera • Neadekvátna štatistická analýza • Nedostatočná, príp. zlá interpretácia výsledkov

  4. Deskriptívna štatistika Úlohou opisnej štatistiky je vytvorenie prehľadu o získaných údajoch, ktoré samé o sebe predstavujú iba zmes čísel, príp. písmen. Na tento účel slúžia: - opisné charakteristiky - tabuľky - grafy

  5. Chyby • Chýbajúca tabulácia a čistenie dát • Výpočet priemerov z kvalitatívnych premenných, ktorých hodnoty (kategórie) boli očíslované • Nahrádzanie chýbajúcich hodnôt 0/99 • Použitie n-tice koláčových grafov na opísanie rozdelenia kvalitatívnej premennej v rôznych skupinách • Nevyužitie mier sily vzťahu (r, tau, eta, V) • Bivariačný prístup (falošná korelácia)

  6. Induktívna štatistika • Úlohou induktívnej štatistiky je na základe informácii získaných z náhodných vzoriek robiť závery o celých základných súboroch z ktorých vzorky pochádzajú: - testy štatistických hypotéz (významnosti) - intervalové odhady

  7. 1. Chyba • Formulovanie záverov v podobe kauzality u korelačných výskumov (pozorovacích štúdií vrátane dotazníkových v ktorých nezasahujeme do premenných, len ich meriame a hľadáme vzťahy). • Údaje z korelačného výskumu môžu byť interpretované v kauzálnej podobe iba na základe a priórnych teórií. Nemôžu však nezvratne a jednoznačne dokazovať kauzalitu.

  8. 2. Chyba • absencia vopred formulovaných hypotéz => realizácia mnohých porovnaní • z dotazníka s 20 otázkami možno urobiť 190 párových porovnaní • pri použití 5% hladiny významnosti bude z 20 porovnaní 1 významné čistou náhodou • Typicky viac ANOVA namiesto MANOVA

  9. 3. Chyba • Použitie induktívnej štatistiky na vzorkách, ktoré neboli získané náhodným výberom (napr. kvótne výbery) a cenzusoch (vyšetrovanie celej populácie). => Vypočítaná P-hodnota je ničnehovoriace číslo. Zovšeobecňovanie záverov z nenáhodných výberov je nemožné. Dôvody: - neznalosť spojená s falošným dojmom vedeckosti - predstava, že každá hypotéza sa musí overovať pomocouštatistického testu

  10. 4. Chyba • Tradičné metódy pri výpočte pravdepodobnosti predpokladajú jednoduchý náhodný výber z nekonečne veľkej populácie (prakticky stačí N > 1500) => bez korekcie sú výsledky nesprávne (Pre zložitejšie metódy neexistujú vzorce pre zložitejšie formy náhodných výberov)

  11. 5. Chyba • Parametrické metódy vyžadujú normálne rozdelenie • Testy normality treba brať s rezervou • Najdôležitejší je histogram + box plot a kontrola odľahlých a extrémnych pozorovaní • CLV vyžaduje veľké vzorky (n> 50, > 100) • Ordinálna premenná: min. 5 kategórií bez výrazných rozdieloch vo vzdialenostiach

  12. Štatistický navigátor Výber štatistickej metódy v závislosti od • Cieľa • Počtu skúmaných premenných • Typu škál • Typu vzorky http://rimarcik.com

More Related