100 likes | 220 Views
Statistika s chématicky. Tomáš Mrkvička. Základy znáte. Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad. Rozšíření základů. General linear models – spojení ANOVy a regrese – mohu mít jak kategoriální prediktory tak kontinuální
E N D
Statistika schématicky Tomáš Mrkvička
Základy znáte • Konfidenční intervaly • Porovnání 2 či více výběrů • Regresní modely • Základy časových řad
Rozšíření základů • Generallinearmodels– spojení ANOVy a regrese – mohu mít jak kategoriální prediktory tak kontinuální • Generalizedlinearmodels– pozorovaná proměnná může mít jiné než normální rozdělení
Rozšíření časových řad • ARIMA metodologie – obecné principy modelování autokorelace v časových řadách • Regrese pro časové řady – pozorovaná proměnná vykazuje autokorelaci • GARCH – modely časových řad s proměnnou volatilitou – finanční modely • Další finanční modely
Kategoriální data • Kontingenční tabulky – Porovnání 2 či více výběrů v kategoriálních datech • Logistické modely – výsledek pozorování 0 - 1 • Multinomické modely – výsledek p. 0 – 1 – 2
Mnoharozměrná statistika • Analýza hlavních komponent – jak najít v mnoha dimenzích ty nejdůležitější kolmé směry a určit které proměnné s nimi korelují • Shluková analýza – vytvoření skupin podobných případů např. zákazníků • Faktorová analýza – jak zredukovat mnohorozměrná kontinuální data do méně ukazatelů a zpřehlednit interpretaci • Korespondenční analýza - jak zredukovat mnohorozměrná kategoriální data do méně ukazatelů a zpřehlednit interpretaci
Mnoharozměrná statistika • Diskriminační analýza – najde proměnné, které nejlépe dokáží rozlišit různé stavy jiné proměnné. Např. čím můžeme rozlišit zda zákazník koupí či nekoupí. • Canonicalcorrelationanalysis– měří korelaci mezi dvěma skupinami proměnných. Vhodné pro dotazníky. Např. 3 otázky se vztahují ke spokojenosti v práci a 3 otázky se vztahují ke spokojenosti v rodině.
Mnoharozměrná statistika • Reliability – U dotazníků jsou často odpovědi zatíženy určitým předsudkem. Tato metoda umožní transformovat scale odpovědí tak aby tento předsudek byl odstraněn. • Classificationtree– Data miningprocedures. – Nerozlišuje kategoriální a spojité proměnné. Vytvoří rozhodovací strom, vytvoří řadu rozhodnutí na základě proměnných, tak abychom na konci měli všechny případy rozlišeny dle nějaké kategoriální proměnné. Algoritmus klasifikace.
Rozšíření generallinearmodels • Heterogenita – nehomogenní rozptyl • Mixedeffects– Vnořená struktura • GeneralAdditiveModels– Když závislost není lineární – vyhlazovací techniky