Rodzaje plików

Rodzaje plików Plik z danymi

Opcje pliku z danymi Nazwa kolumny Dane tekstowe Typ danych Formuła Aby otworzyć okno modyfikujące dane w kolumnie należy kliknąć 2 razy lewy przycisk myszy na nazwie kolumny

Statystyka opisowa Dane liczbowe Prawdopodobieństwo Analiza jednej zmiennej

Wybór danych do analizy

Analiza jednej zmiennej Okna analizy Okna wykresów Aby powiększyć/pomniejszyć okno należy kliknąć na nim 2 razy lewym przyciskiem myszy

Analiza jednej zmiennej Zmiana danych wejściowych Zapis do tabel Rodzaje analizy Rodzaje wykresów

Rodzaje analizy Dziennik analizy Obliczenia statystyczne Procenty Szereg rozdzielczy

Rodzaje wykresów Wykres danych Wykres pudełkowy z wąsami Histogram

Dziennik analizy Analizowane dane Ilość wartości danych Najmniejsza wartość Największa wartość

Obliczenia statystyczne Średnia arytmetyczna Mediana Najczęściej występująca wartość Wariancja Średnia geometryczna Błąd standardowy Odchylenie standardowe Rozstęp = max – min Kwartyl dolny (1/4) Rozstęp między kwartylami Kwartyl górny (3/4) Skośność Skośność standardowa Kurtoza Współczynnik zmienności Kurtoza standardowa Suma

Opcje obliczeń Aby uzyskać dostęp do opcji należy na danym oknie kliknąć prawym przyciskiem myszy

Szereg rozdzielczy Udział procentowy Limit dolny Limit górny Punkt środkowy Liczność skumulowana Częstość skumulowana Klasa Liczność Średnia Odchylenie standardowe

Opcje szeregu rozdzielczego Ilość klas Limit dolny Limit górny

Histogram Liczba danych

Opcje Histogramu Ilość klas Limit dolny Limit górny Typ wykresu Wykres liniowy Skumulowany

Wykres pudełkowy z wąsami średnia mediana minimum maksimum kwartyl dolny kwartyl górny

Prawdopodobieństwo

Rozkład dwumianowy

Opcje danych Rozkład dwumianowy Wartość zmiennej Opcje danych Opcje analizy Rozkład Próby

Obliczanie prawdopodobieństwa Nazwa rozkładu P(X < a) P(X = a) lub wartość dystrybuanty Prawdopod. P(X > a) Wartość zmiennej

Rozkład Poissona

Opcje danych Rozkład Poissona Wartość zmiennej Opcje danych Opcje analizy Średnia

Rozkład Normalny

Opcje danych Rozkład Normalny Wartość zmiennej Opcje danych Opcje analizy Średnia Odchylenie standardowe

Analiza danych w podzbiorach Dane, które chcemy analizować Kod, według którego chcemy analizować dane

Definicja formuł do tabeli danych Obliczenie stopy zwrotu Definicja formuły w tabeli danych – klikamy 2 razy lewym przyciskiem myszy na nazwę kolumny LAG – funkcja pozwalająca na popranie do wyliczeń wartości poprzednich O ile wartości do tyłu ma pobierać Definicja formuły

Korelacja

Korelacja Współczynnik korelacji Rozmiar próbki Wartość krytyczna prawdopodobieństwa

Wybieramy rozkład z jakiego ma wylosować liczby Losowanie liczb Opcja losowania liczb znajduje się w dostępnych analizach Zapis do tabeli z danymi Zmiana rozkładu Dostępne opcje analizy/wykresów

Losowanie liczb Ilość wylosowanych liczb Zapisywanie wylosowanych liczb Po każdym zapisie losuje nowe liczby Zaznaczamy co zapisujemy Nazwa kolumny

Testowanie zgodności rozkładów danych Czyli sprawdzanie, czy dane mają jakiś rozkład Hipotezy: H0: dane mają rozkład normalny H1: dane nie mają rozkładu normalnego • Do oceny hipotez stosuje się następujące testy: • Test Chi-kwadrat (podstawą tego testu są różnice między liczebnością empiryczną a teoretyczną • Test Kołmodorov-Smirnov (podstawą tego testu są odległości między dystrybuantami) Uwaga: Jeżeli któryś z testów odrzuca hipotezę H0 dane nie mają rozkładu normalnego Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0, czyli dane nie mają rozkładu normalnego

Testowanie zgodności rozkładów danych Wybór danych do analizy

Testowanie zgodności rozkładów danych Test Chi-kwadrat Częstość empiryczna Częstość teoretyczna Kwadrat różnicy Wartość testu z ilością stopni swobody Wartość prawdopodobieństwa Różnice między wartościami dystrybuanty Wartość statystyki

Regresja jednej zmiennej Dostępne dane Wartość funkcji (skutek) Argumenty funkcji (przyczyna)

Regresja liniowa • Etapy postępowania przy badaniu modelu funkcji: • Wyznaczamy współczynniki regresji • Przeprowadzamy testy statystyczne współczynników • Oceniamy jakość dopasowania modelu do danych – współczynnik determinacji (mówi nam jaki procent zmienności danych został wyjaśniony zmiennością modelu) • Sprawdzamy reszty w modelu • jeżeli model jest wyznaczony dobrze to między resztami nie występuje korelacja (autokorelacja) – przeprowadzamy test Durbina-Watsona i sprawdzamy czy reszty mają rozkład normalny. • Przeprowadzamy test Fischera

Postać modelu Regresja liniowa Zmienna zależna Zmienna niezależna Błąd standardowy Wartość statystyki t-Studenta Wartość wyestymowana Wartość krytyczna Odpowiadająca wartość prawdopodobieństwa Wyraz wolny Współczynnik kierunkowy Wartość statystyki Fishera Współczynnik korelacji Współczynnik determinacji Statystyka Durbina-Watsona Współczynnik autokorelacji reszt Postać funkcji

Regresja liniowa – testy statystyczne Test istotności współczynników Hipotezy: H0: a=0,b=0 H1: Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0, czyli współczynniki są istotne Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0, czyli współczynniki nie są istotne Test Durbina-Watsona Statystyka Durbina-Watsona przyjmuje wartości od 0 do 4. Jeżeli wartość tej statystyki jest równa 2 to oznacza to, że nie ma korelacji między resztami Test Fischera Hipotezy: H0: Wszystkie współczynniki w modelu są równe 0 H1: Któryś z współczynników w modelu jest różny od 0 Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0 Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0

Regresja liniowa – badanie reszt Zapis wyników analizy Reszty Po zapisie reszt do pliku z danymi badamy czy reszty maja rozkład normalny. Jeżeli reszty mają rozkład normalny oznacza to, że model jest dobrze wyznaczony

Regresja wielu zmiennych Dostępne dane Zmienna zależna Zmienna niezależna Badanie modelu funkcji jest takie same jak w przypadku regresji jednej zmiennej

Regresja wielu zmiennych Jeżeli jakiś współczynnik jest nieistotny to usuwamy go z modelu Usuwanie stałej z modelu – Analysis Options Stała w modelu

Regresja wielomianowa

Regresja nieliniowa Dostępne dane Zmienna zależna Wzór funkcji Parametry początkowe

Jeżeli dane są w postaci tabeli Test jednej średniej

Test jednej średniej Test średniej Hipoteza główna Hipoteza alternatywna Wartość statystyki t-Studenta Wartość krytyczna Przedział ufności

Test jednej średniej Zmiana hipotezy alternatywnej Wartość średniej Poziom istotności Średnia nie jest równa Średnia jest mniejsza Hipoteza alternatywna Średnia jest większa Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0 Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0

Jeżeli dane są w postaci wartości Test jednej średniej Wartość hipotezy głównej Średnia Odchylenie standardowe Rozmiar próbki

Test jednej średniej Poziom ufności Przedział ufności Błąd przybliżenia Hipoteza główna Hipoteza alternatywna Wartość statystyki t-Studenta Poziom istotności Wartość krytyczna Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0 Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0

Jeżeli dane są w postaci kolumn Test równości dwóch średnich Średnia pierwsza Średnia druga

Jeżeli dane są w postaci tabeli Test równości dwóch średnich Dane Grupowanie

Rodzaje plików

Rodzaje plików

Presentation Transcript

REDAGOWANIE PISM

Aproksymacyjne wyszukiwanie informacji w bazach danych

Statystyczna analiza danych za pomocą arkusza kalkulacyjnego EXCEL oraz aplikacji SAS Enterprise Guide v. 4.2

Platformy Technologiczne ADO.NET

WSPÓŁCZESNE MEDIA W POLSCE

Rodzaje kolumn w ChemCADzie

STRATEGIA - rodzaje strategii

WYKŁAD II

Pozyskiwanie zewnętrznych źródeł finansowania Joanna Sutuła

KRWAWIENIA

PRZEMYSŁOWE SYSTEMY INFORMATYCZNE

Wrocław, 6.03.2006

WADY SERCA

RODZAJE UBEZPIECZEŃ

Wentylacja

CHEMIA OGÓLNA

TEATR LALEK

R Y N E K P I E N I Ą D Z A

Analiza Matematyczna część 1

Komórka – podstawowy element życia

BEZROBOCIE W POLSCE

Życie w lesie