1.14k likes | 2.14k Views
STATYSTYKA. Dr inż. Izabela Cichocka Statistics is the art of never having to say you’re wrong…. Tematyka wykładów. Co na zaliczeniu wykładu?. Kryteria oceniania. Konsultacje: piątki, godz. 10-12 Tel. (17) 86 61 158 Pokój 215 E-mail: icichocka@wsiz.rzeszow.pl. .
E N D
STATYSTYKA Dr inż. Izabela Cichocka Statistics is the art of never having to say you’re wrong…
Tematyka wykładów Co na zaliczeniu wykładu?
Konsultacje: piątki, godz. 10-12 • Tel. (17) 86 61 158 • Pokój 215 • E-mail: icichocka@wsiz.rzeszow.pl
• Student zdaje ostatni egzamin. Jest to test z odpowiedziami "tak" lub "nie". Siada w sali, gapi się w test przez pięć minut, gdy nagle doznaje olśnienia. Wyjmuje portmonetkę, a z niej monetę i zaczyna nią rzucać, zaznaczając odpowiedzi "tak", kiedy wypadnie orzełek, a "nie", kiedy wypadnie reszka. W pół godziny zrobił wszystkie zadania, podczas gdy wszyscy inni pocą się nad odpowiedziami. Kiedy zostaje kilka minut do końca, student w desperacji zaczyna rzucać monetą, mamrotać i pocić się. Podchodzi do niego egzaminator i pyta, co się dzieje. Student na to:- Sprawdzam moje odpowiedzi i wydaje mi się, że nie były właściwe!
STATYSTYKA Statystyka to nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy danych opisujących zjawiska masowe.
WPROWADZENIE Wyraz statystyka pochodzi od łacińskiego słowa status,co oznacza stan, położenie, stosunki (w języku włoskim stato oznacza państwo) i użyty został przez G. Achenwalla dla oznaczenia nauki o „osobliwościach państwowych”, zwanej państwoznastwem. Statystyka to zbiór metod służących pozyskiwaniu, prezentacji i analizie danych. Inna definicja: statystyka to nauka traktująca o metodach ilościowych badania zjawisk masowych. Zjawisko masowe to takie zjawisko, które badane w dużej masie zdarzeń wskazuje właściwą sobie prawidłowość, jakiej nie można zaobserwować w pojedynczym przypadku. Przykłady zjawisk masowych: spożycie pewnych artykułów na 1 mieszkańca, urodzenia itp.
Zalety statystyki Tworzenie zwartej i treściwej reprezentacji danych: • dysponujemy nowoczesną aparaturą, która w krótkim czasie dostarcza znacznej ilości wyników • wyniki te należy przekształcić w użyteczną informację • człowiek może brać pod uwagę jedynie ograniczoną liczbę faktów • statystyka pomaga zrozumieć dane, wydobyć z nich użyteczną informację i przekształcić ją w wiedzę
Zalety statystyki Wnioskowanie w oparciu o niepewne dane: • dane eksperymentalne są niepewne z powodu błędów pomiarowych, niejednorodności badanego obiektu, niedoskonałości modeli stosowanych do interpretacji • eksperymentatora interesują wnioski pewne • statystyka pozwala wyeliminować lub ograniczyć niektóre czynniki zmienności • wynik podawany jest wraz z oszacowaniem niepewności
Zalety statystyki Przekształcanie danych do postaci użytecznej w rozwiązywaniu postawionego zadania: • informacja zawarta jest w danych w postaci „uwikłanej” • surowe dane należy przekształcić do formy przydatnej w rozwiązywanym problemie • stosujemy modele dobrze zdefiniowane i często łatwo dostępne w systemach analizy danych • zastosowanie adekwatnego modelu pozwala uzyskać odpowiedź na postawione pytanie
Niebezpieczeństwa stosowania statystyki Nieumiejętne stosowanie statystyki polega na: • użyciu niewłaściwych pojęć i modeli, które nie są uzasadnione teoretycznie i źle reprezentują dane • ograniczaniu warstwy informacyjnej poprzez zastosowanie zbyt daleko idących uproszczeń • uruchamianiu procedur komputerowych bez istotnej wiedzy o ich działaniu • niewłaściwej prezentacji danych • celowym ukrywaniu faktów np. dużego rozrzutu danych eksperymentalnych poprzez podanie jedynie wartości średniej
Powinien być określony w sposób zwięzły i precyzyjny. • Przy planowaniu analizy statystycznej należy sformułować hipotezę badawczą.
FUKCJE STATYSTYKI: • informacyjna (dająca pełny i obiektywny obraz badanych zjawisk), • analityczna (dzięki której możliwe jest określenie czynników kształtujących konkretne procesy i zjawiska) • prognostyczna (pozwalająca na przewidywanie kierunku rozwoju analizowanych zjawisk).
Statystyka: a) umożliwia dokładniejszy sposób opisu interesującej nas rzeczywistości, b) zmusza nas do dokładności i śmiałości w działaniui rozumowaniu, c) umożliwia formułowanie uogólnień na podstawie uzyskanych wyników analizy, d) pozwala na przewidywanie rozwoju zjawiskw przyszłości, czyli pobudzanie do prognoz, e)dostarcza narzędzi do porządkowania informacjio zjawiskach – a przez to pozwala na budowę ich ogólnego obrazu, f)dostarcza narzędzi do prowadzenia analizy przyczyn kształtujących badane zjawiskai procesy, a więc umożliwia dokonanie ich klasyfikacji na czynniki systematyczne i przypadkowe.
Powstaje pytanie: dlaczego w zbiorze wielu zdarzeń zachodzą prawidłowości statystyczne podczas, gdy poszczególne zdarzenia są zróżnicowane? Otóż każde zjawisko (ekonomicznej, przyrodnicze, socjologiczne itp.) kształtuje się pod wpływem dwojakiego rodzaju przyczyn: • głównych (podstawowych, typowych, systematycznych). • ubocznych (przypadkowych, indywidualne). Ad1) Przyczyny główne oddziałują na każde zjawiskow sposób jednakowy, mają charakter wewnętrzny, ich istota wypływa z charakteru zjawiska – działają w ściśle określonym kierunku. Przyczyny te są wspólne dla wszystkich jednostek badanej zbiorowości zdarzeń (wpływ czynników głównych). Ad 2) Przyczyny uboczne działają nakażde zjawisko w sposób odmienny. Wyrażają zróżnicowanie osobnicze (wpływ czynnika losowego).
Ostatecznym celem stosowania tych metod jest otrzymanie użytecznych informacji na temat zjawiska, którego dotyczą. Istotne jest, aby badania statystyczne były zaplanowane w sposób nie budzący zastrzeżeń. Ich cel powinien być określony zrozumialei szczegółowo. Materiał statystyczny powinien zaś być wiarygodny i przejrzysty.
Cel badania jest możliwy do osiągnięcia wówczas, gdy jednostki statystyczne są precyzyjnie określone pod względem: • rzeczowym (przedmiot badań), • przestrzennym (miejsce badań), • czasowym (okres badań).
STATYSTYKA Samo znaczenie statystyki w administracji publicznej we współczesnym życiu społeczno-gospodarczym kraju wynika przede wszystkim z: • reaktywowania w roku 1990 samorządu terytorialnego, • transformacji ustrojowej, • obligatoryjności działań kontrolnych, m. in. ze strony gmin, sejmików • samorządowych oraz regionalnych izb obrachunkowych, • wzrostu znaczenia planowania strategicznego rozwoju lokalnego, • konieczności podejmowania działań marketingowych przez władze lokalne w warunkach konkurencyjnego otoczenia.
CEL, PRZEDMIOT I SCHEMAT BADAŃ STATYSTYCZNYCH Przykłady: • ruch demograficzny ludności miast o liczbie mieszkańców przekraczających 50 tys. osób, • sprzedaż działek budowlanych w ciągu ostatnich 5 lat przez na terenie danego powiatu, • opłaty wnoszone z tytułu dzierżawy przez mieszkańców, • wydawane zlecenia dla prowadzenia działalności gospodarczej przez urzędy, • składane zeznania podatkowe w Izbach Skarbowych.
CEL, PRZEDMIOT I SCHEMAT BADAŃ STATYSTYCZNYCH Całokształt czynności dotyczących badania i opisu przejawiających się prawidłowości statystycznych w zjawiskach masowych za pomocą metod statystycznych jest ujmowany w tzw. schemacie badania statystycznego, co podaje następująca definicja.
CEL, PRZEDMIOT I SCHEMAT BADAŃ STATYSTYCZNYCH Schemat badania statystycznego obejmuje następujące kroki: Krok 1. projektowanie BADANIA,Krok 2. gromadzenie materiału statycznego,Krok 3. opracowanie materiału statycznego,Krok 4. analiza statyczna.
PODSTAWOWE POJĘCIA Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter: • pełny - badanie obejmuje całą populację • częściowy - odbywa się na pewnych (zazwyczaj losowo) wybranych elementach populacji, czyli próbie losowej, zazwyczaj reprezentatywnej dla populacji
PODSTAWOWE POJĘCIA STATYSTYKI Zbiorowość statystyczna, nazywana też populacją statystyczną, - zbiór elementów (osób, przedmiotów, zdarzeń) podobnych, lecz nie identycznych pod względem określonej cechy, poddanych badaniom statystycznym.
PODSTAWOWE POJĘCIA STATYSTYKI Element zbiorowości statystycznej (populacji statystycznej) jest nazywany jednostką statystyczną. Liczba jednostek statystycznych, czyli elementów zbiorowości, jest nazywana liczebnością zbiorowości. Cecha statystyczna (nazywana też zmienną) to właściwość elementów zbiorowości statystycznej będąca przedmiotem badania statystycznego.
Próba (zbiorowość próbna) Populacja(zbiorowość generalna) (selekcja) (opis) (obliczenie) (szacowanie) Statystyka Parametr
populacja próba • Statystyka, jako wartość liczona z próby, zmienia się za każdym razem, gdy wybieramy inną próbę.
Klasyfikacja zbiorowości statystycznych Zbiorowość statystyczna Skończona Ma skończoną liczbę jednostek; np. liczba szkół w mieście Nieskończona Ma nieskończona lub niemożliwą do ustalenia liczbę jednostek statystycznych; Np. zbiorowość mikroorganizmów, gwiazdy na niebie
Klasyfikacja zbiorowości statystycznych Zbiorowość statystyczna Jednowymiarowa badana ze względu na jedną cechę np. sklepy ze względu na oferowany asortyment towarów Wielowymiarowa badana jednocześnie ze względu na kilka cech np. gospodarstwa domowe ze względu na wielkość dochodu, wykształcenie głowy rodziny, liczbę dzieci w rodzinie
Klasyfikacja zbiorowości statystycznych Zbiorowość statystyczna Statyczna Wszystkie jednostki statystyczne pochodzą z tego samego okresu np. liczba zgonów w 2010r. Dynamiczna Jednostki statystyczne pochodzą z różnych okresów np. liczba zawartych małżeństw w kolejnych miesiącach 2011r.
Klasyfikacja cech statystycznych Cecha statystyczna jakościowa (niemierzalna) wyrażona w sposób opisowy. ilościowa (mierzalna) wyrażone za pomocą liczb skokowa przyjmuje skończoną lub przeliczalną liczbę wartości; w pewnym przedziale zmienności może przyjąć tylko niektóre wartości. ciągła - może przyjąć każdą wartość z określonego przedziału liczbowego
PRZYKŁAD 1 Badamy wysokość kredytów wśród klientów indywidualnych PKO BP w dniu 30.06.2012r. Zbiorowość statystyczna: indywidualni kredytobiorcy PKOBP Jednostka statystyczna: jeden klient – obiekt materialny (kto – klient PKO BP, kiedy – 30.06.2012r., gdzie – Polska) Typ zbiorowości: skończona, jednowymiarowa, statyczna Cecha statystyczna: wysokość kredytu (tys. zł) Typ cechy statystycznej: mierzalna, ciągła
PRZYKŁAD 2 Badamy opinię pracowników, dotyczącą decyzji zarządu jednej z warszawskich firm o połączeniu z firmą AB. Zbiorowość statystyczna: pracownicy firmy Jednostka statystyczna: jeden pracownik – obiekt materialny (kto – pracownik firmy, kiedy – np. 31.05.2011r., gdzie – Warszawa, Polska) Typ zbiorowości: skończona, jednowymiarowa, statyczna Cecha statystyczna: opinia (kategoria cechy: popieram, nie popieram, nie wiem) Typ cechy statystycznej: niemierzalna
Skale pomiarowe • Uzależnione są od rodzaju opisywanych zmiennych • Determinują, co można zrobić z daną zmienną
Skale pomiarowe • Zmienne jakościowe • Skala nominalna • Skala porządkowa (rangowa) • Zmienne ilościowe • Skala przedziałowe (interwałowa) • Skala ilorazowa (stosunkowa)
Skala Skala jest to odwzorowanie, czyli model rzeczywistych zjawisk i relacji. Skale buduje się, przyporządkowując symbole mierzonym cechom według określonych zasad. Skalowanie to czynność odwzorowania mierzonej cechy za pomocą wybranej skali.
Skale pomiarowe należy odróżnić od instrumentu pomiarowego (=kwestionariusza). W rzeczywistości są one składnikiem konstrukcji instrumentu pomiarowego, a nie samym instrumentem.
Szczegółowo omówimy skalę: • nominalną • porządkową • przedziałową • stosunkową
Skala nominalna – polega na nadawaniu etykietek interesującym nas obiektom; nie wartościuje ich ani nie porządkuje jedynie przypisuje je do określonych kategorii; umożliwia stwierdzenie różnic lub równości między mierzonymi cechami • lubię Statystykę • nie lubię Statystyki
Skala nominalna • Pozwala rozpoznawać obiekty jednakowe i różne, bez wypowiadania się o relacjach między nimi, np.rodzaj zakładu pracy, płeć, itp. • Często pomiar na skali nominalnej jest liczbowym etykietowaniem badanych obiektów, np. kody w niektórych bazach danych • Bardzo słaba skala pomiarowa • Graficzna prezentacja, dominanta
Skala porządkowa – organizuje obiekty zgodnie z natężeniem mierzonej cechy; dowiadujemy się, że o kolejności obiektów oraz o ich pozycji względem siebie i mierzonej cechy, umożliwia uporządkowanie badanych cech obiektu • bardzo lubię kawę • lubię kawę • nie lubię kawy
Skala porządkowa • wprowadza relację porządku w zbiorze zmiennych jakościowych, np. uszkodzenie słabe, średnie, silne; ... • Jest skalą mocniejszą niż nominalna • Powoduje najwięcej problemów i nieporozumień, przedmiot powszechnie popełnianych błędów
Skala porządkowa • Przykład: skala ocen (ndst, dst, db, bdb) • Wszelkiego rodzaju obliczenia są tutaj nadużyciem: nieznana jest odległość między poszczególnymi ocenami (różnica między różnymi stopniami jest różna; często mieszane kategorie) • Możliwe jest jedynie określenie, że np. silny stopień uszkodzenia jest mocniejszy niż słaby
Skala przedziałowa (interwałowa) – umożliwia nie tylko stwierdzenie relacji mniejszości lub większości, lecz również odstępów między przedziałami skali. Porządkuje obiekty, określa względne różnice między nimi • bardzo lubię bardzo nie lubię • 1 2 3 4 5
Skala przedziałowa • Zachowuje własności skali porządkowej, ale dodatkowo wyposażona jest w stałą jednostkę miary i umowne zero • Możliwy jest pomiar odległości między uporządkowanymi zmiennymi • Jest skalą mocniejszą od porządkowej
Skala przedziałowa • Przykład: skala Celsjusza dla temperatury • Możliwe jest określenie o ile stopni dana temperatura różni się od innej • Ale nie można opisać sensownie stosunku dwóch wartości zmiennych • Np. średnia temperatura lipca w centralnej Polsce (170C) różni się od średniej rocznej temperatury tego obszaru (70C) o 10 stopni, ale nie oznacza to np., że w lipcu jest prawie 2 razy cieplej niż średnio w roku
Skala ilorazowa (stosunkowa) – umożliwia pomiar na najwyższym poziomie, dzięki istnienia naturalnego punktu zerowego lub naturalnej jednostki miary, na tej skali można porównać pomiary, obliczać ich relacje • np. kwota pieniędzy wydawana w ciągu miesiąca na piwo…
Skala ilorazowa • różni się od skali przedziałowej tym, że jest posiada zero absolutne, a nie umowne • Możliwe jest określenie ile razy dana cecha jest większa od innej • Jest to najsilniejsza skala pomiarowa
Skala ilorazowa • Przykład: liczba kandydatów na studia • Na Wydz. Ekon. było 100 kandydatów na studia, na Wydz. Inf. 500 kandydatów (jest to 5 razy więcej niż na Wydz. Ekon) – zerem absolutnym jest tu brak kandydatów na studia.
skalowanie zrównoważone – wymaga się ustalenia klasy środkowej oraz wyznaczenia jednakowej liczby klasy o jednakowej intensywności po obu stronach ustalonej klasy środkowej. Posiada równą liczbę pozytywnych i negatywnych kategorii • wspaniale • dobrze • ani dobrze ani źle– klasa środkowa • źle • okropnie
skalowanie niezrównoważone – po obu stronach skali występuje różna liczba klas lub klasy o niejednakowej intensywności (uwypukla kategorie ujemne lub dodatnie) • znakomicie • dobrze • zadawalająco • okropnie