660 likes | 894 Views
Rodzaje plików. Plik z danymi. Opcje pliku z danymi. Nazwa kolumny. Dane tekstowe. Typ danych. Formuła. Aby otworzyć okno modyfikujące dane w kolumnie należy kliknąć 2 razy lewy przycisk myszy na nazwie kolumny. Statystyka opisowa. Dane liczbowe. Prawdopodobieństwo.
E N D
Rodzaje plików Plik z danymi
Opcje pliku z danymi Nazwa kolumny Dane tekstowe Typ danych Formuła Aby otworzyć okno modyfikujące dane w kolumnie należy kliknąć 2 razy lewy przycisk myszy na nazwie kolumny
Statystyka opisowa Dane liczbowe Prawdopodobieństwo Analiza jednej zmiennej
Analiza jednej zmiennej Okna analizy Okna wykresów Aby powiększyć/pomniejszyć okno należy kliknąć na nim 2 razy lewym przyciskiem myszy
Analiza jednej zmiennej Zmiana danych wejściowych Zapis do tabel Rodzaje analizy Rodzaje wykresów
Rodzaje analizy Dziennik analizy Obliczenia statystyczne Procenty Szereg rozdzielczy
Rodzaje wykresów Wykres danych Wykres pudełkowy z wąsami Histogram
Dziennik analizy Analizowane dane Ilość wartości danych Najmniejsza wartość Największa wartość
Obliczenia statystyczne Średnia arytmetyczna Mediana Najczęściej występująca wartość Wariancja Średnia geometryczna Błąd standardowy Odchylenie standardowe Rozstęp = max – min Kwartyl dolny (1/4) Rozstęp między kwartylami Kwartyl górny (3/4) Skośność Skośność standardowa Kurtoza Współczynnik zmienności Kurtoza standardowa Suma
Opcje obliczeń Aby uzyskać dostęp do opcji należy na danym oknie kliknąć prawym przyciskiem myszy
Szereg rozdzielczy Udział procentowy Limit dolny Limit górny Punkt środkowy Liczność skumulowana Częstość skumulowana Klasa Liczność Średnia Odchylenie standardowe
Opcje szeregu rozdzielczego Ilość klas Limit dolny Limit górny
Histogram Liczba danych
Opcje Histogramu Ilość klas Limit dolny Limit górny Typ wykresu Wykres liniowy Skumulowany
Wykres pudełkowy z wąsami średnia mediana minimum maksimum kwartyl dolny kwartyl górny
Opcje danych Rozkład dwumianowy Wartość zmiennej Opcje danych Opcje analizy Rozkład Próby
Obliczanie prawdopodobieństwa Nazwa rozkładu P(X < a) P(X = a) lub wartość dystrybuanty Prawdopod. P(X > a) Wartość zmiennej
Opcje danych Rozkład Poissona Wartość zmiennej Opcje danych Opcje analizy Średnia
Opcje danych Rozkład Normalny Wartość zmiennej Opcje danych Opcje analizy Średnia Odchylenie standardowe
Analiza danych w podzbiorach Dane, które chcemy analizować Kod, według którego chcemy analizować dane
Definicja formuł do tabeli danych Obliczenie stopy zwrotu Definicja formuły w tabeli danych – klikamy 2 razy lewym przyciskiem myszy na nazwę kolumny LAG – funkcja pozwalająca na popranie do wyliczeń wartości poprzednich O ile wartości do tyłu ma pobierać Definicja formuły
Korelacja Współczynnik korelacji Rozmiar próbki Wartość krytyczna prawdopodobieństwa
Wybieramy rozkład z jakiego ma wylosować liczby Losowanie liczb Opcja losowania liczb znajduje się w dostępnych analizach Zapis do tabeli z danymi Zmiana rozkładu Dostępne opcje analizy/wykresów
Losowanie liczb Ilość wylosowanych liczb Zapisywanie wylosowanych liczb Po każdym zapisie losuje nowe liczby Zaznaczamy co zapisujemy Nazwa kolumny
Testowanie zgodności rozkładów danych Czyli sprawdzanie, czy dane mają jakiś rozkład Hipotezy: H0: dane mają rozkład normalny H1: dane nie mają rozkładu normalnego • Do oceny hipotez stosuje się następujące testy: • Test Chi-kwadrat (podstawą tego testu są różnice między liczebnością empiryczną a teoretyczną • Test Kołmodorov-Smirnov (podstawą tego testu są odległości między dystrybuantami) Uwaga: Jeżeli któryś z testów odrzuca hipotezę H0 dane nie mają rozkładu normalnego Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0, czyli dane nie mają rozkładu normalnego
Testowanie zgodności rozkładów danych Wybór danych do analizy
Testowanie zgodności rozkładów danych Test Chi-kwadrat Częstość empiryczna Częstość teoretyczna Kwadrat różnicy Wartość testu z ilością stopni swobody Wartość prawdopodobieństwa Różnice między wartościami dystrybuanty Wartość statystyki
Regresja jednej zmiennej Dostępne dane Wartość funkcji (skutek) Argumenty funkcji (przyczyna)
Regresja liniowa • Etapy postępowania przy badaniu modelu funkcji: • Wyznaczamy współczynniki regresji • Przeprowadzamy testy statystyczne współczynników • Oceniamy jakość dopasowania modelu do danych – współczynnik determinacji (mówi nam jaki procent zmienności danych został wyjaśniony zmiennością modelu) • Sprawdzamy reszty w modelu • jeżeli model jest wyznaczony dobrze to między resztami nie występuje korelacja (autokorelacja) – przeprowadzamy test Durbina-Watsona i sprawdzamy czy reszty mają rozkład normalny. • Przeprowadzamy test Fischera
Postać modelu Regresja liniowa Zmienna zależna Zmienna niezależna Błąd standardowy Wartość statystyki t-Studenta Wartość wyestymowana Wartość krytyczna Odpowiadająca wartość prawdopodobieństwa Wyraz wolny Współczynnik kierunkowy Wartość statystyki Fishera Współczynnik korelacji Współczynnik determinacji Statystyka Durbina-Watsona Współczynnik autokorelacji reszt Postać funkcji
Regresja liniowa – testy statystyczne Test istotności współczynników Hipotezy: H0: a=0,b=0 H1: Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0, czyli współczynniki są istotne Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0, czyli współczynniki nie są istotne Test Durbina-Watsona Statystyka Durbina-Watsona przyjmuje wartości od 0 do 4. Jeżeli wartość tej statystyki jest równa 2 to oznacza to, że nie ma korelacji między resztami Test Fischera Hipotezy: H0: Wszystkie współczynniki w modelu są równe 0 H1: Któryś z współczynników w modelu jest różny od 0 Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0 Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0
Regresja liniowa – badanie reszt Zapis wyników analizy Reszty Po zapisie reszt do pliku z danymi badamy czy reszty maja rozkład normalny. Jeżeli reszty mają rozkład normalny oznacza to, że model jest dobrze wyznaczony
Regresja wielu zmiennych Dostępne dane Zmienna zależna Zmienna niezależna Badanie modelu funkcji jest takie same jak w przypadku regresji jednej zmiennej
Regresja wielu zmiennych Jeżeli jakiś współczynnik jest nieistotny to usuwamy go z modelu Usuwanie stałej z modelu – Analysis Options Stała w modelu
Regresja nieliniowa Dostępne dane Zmienna zależna Wzór funkcji Parametry początkowe
Jeżeli dane są w postaci tabeli Test jednej średniej
Test jednej średniej Test średniej Hipoteza główna Hipoteza alternatywna Wartość statystyki t-Studenta Wartość krytyczna Przedział ufności
Test jednej średniej Zmiana hipotezy alternatywnej Wartość średniej Poziom istotności Średnia nie jest równa Średnia jest mniejsza Hipoteza alternatywna Średnia jest większa Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0 Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0
Jeżeli dane są w postaci wartości Test jednej średniej Wartość hipotezy głównej Średnia Odchylenie standardowe Rozmiar próbki
Test jednej średniej Poziom ufności Przedział ufności Błąd przybliżenia Hipoteza główna Hipoteza alternatywna Wartość statystyki t-Studenta Poziom istotności Wartość krytyczna Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0 Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0
Jeżeli dane są w postaci kolumn Test równości dwóch średnich Średnia pierwsza Średnia druga
Jeżeli dane są w postaci tabeli Test równości dwóch średnich Dane Grupowanie