1 / 9

Statistika s chématicky

Statistika s chématicky. Tomáš Mrkvička. Základy znáte. Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad. Rozšíření základů. General linear models – spojení ANOVy a regrese – mohu mít jak kategoriální prediktory tak kontinuální

lok
Download Presentation

Statistika s chématicky

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Statistika schématicky Tomáš Mrkvička

  2. Základy znáte • Konfidenční intervaly • Porovnání 2 či více výběrů • Regresní modely • Základy časových řad

  3. Rozšíření základů • Generallinearmodels– spojení ANOVy a regrese – mohu mít jak kategoriální prediktory tak kontinuální • Generalizedlinearmodels– pozorovaná proměnná může mít jiné než normální rozdělení

  4. Rozšíření časových řad • ARIMA metodologie – obecné principy modelování autokorelace v časových řadách • Regrese pro časové řady – pozorovaná proměnná vykazuje autokorelaci • GARCH – modely časových řad s proměnnou volatilitou – finanční modely • Další finanční modely

  5. Kategoriální data • Kontingenční tabulky – Porovnání 2 či více výběrů v kategoriálních datech • Logistické modely – výsledek pozorování 0 - 1 • Multinomické modely – výsledek p. 0 – 1 – 2

  6. Mnoharozměrná statistika • Analýza hlavních komponent – jak najít v mnoha dimenzích ty nejdůležitější kolmé směry a určit které proměnné s nimi korelují • Shluková analýza – vytvoření skupin podobných případů např. zákazníků • Faktorová analýza – jak zredukovat mnohorozměrná kontinuální data do méně ukazatelů a zpřehlednit interpretaci • Korespondenční analýza - jak zredukovat mnohorozměrná kategoriální data do méně ukazatelů a zpřehlednit interpretaci

  7. Mnoharozměrná statistika • Diskriminační analýza – najde proměnné, které nejlépe dokáží rozlišit různé stavy jiné proměnné. Např. čím můžeme rozlišit zda zákazník koupí či nekoupí. • Canonicalcorrelationanalysis– měří korelaci mezi dvěma skupinami proměnných. Vhodné pro dotazníky. Např. 3 otázky se vztahují ke spokojenosti v práci a 3 otázky se vztahují ke spokojenosti v rodině.

  8. Mnoharozměrná statistika • Reliability – U dotazníků jsou často odpovědi zatíženy určitým předsudkem. Tato metoda umožní transformovat scale odpovědí tak aby tento předsudek byl odstraněn. • Classificationtree– Data miningprocedures. – Nerozlišuje kategoriální a spojité proměnné. Vytvoří rozhodovací strom, vytvoří řadu rozhodnutí na základě proměnných, tak abychom na konci měli všechny případy rozlišeny dle nějaké kategoriální proměnné. Algoritmus klasifikace.

  9. Rozšíření generallinearmodels • Heterogenita – nehomogenní rozptyl • Mixedeffects– Vnořená struktura • GeneralAdditiveModels– Když závislost není lineární – vyhlazovací techniky

More Related