650 likes | 1.61k Views
STATYSTYKA OPISOWA. Dr Aldona Migała-Warchoł Statistics is the art of never having to say you’re wrong…. Warunki zaliczenia wykładu. Warunkiem zaliczenia wykładu jest uzyskanie co najmniej 50 pkt. z egzaminu. Egzamin w formie pisemnej (test + pytania otwarte) Liczba punktów decyduje o ocenie:
E N D
STATYSTYKA OPISOWA Dr Aldona Migała-Warchoł Statistics is the art of never having to say you’re wrong…
Warunki zaliczenia wykładu • Warunkiem zaliczenia wykładu jest uzyskanie co najmniej 50 pkt. z egzaminu. Egzamin w formie pisemnej (test + pytania otwarte) • Liczba punktów decyduje o ocenie: • 0-49 pkt. – ndst • 50-59 pkt. – dst • 60-69 pkt. – ponad dst • 70-79 pkt. – db • 80-89 pkt. – ponad db • 90-100 pkt. – bdb
• Student zdaje ostatni egzamin. Jest to test z odpowiedziami "tak" lub "nie". Siada w sali, gapi się w test przez pięć minut, gdy nagle doznaje olśnienia. Wyjmuje portmonetkę, a z niej monetę i zaczyna nią rzucać, zaznaczając odpowiedzi "tak", kiedy wypadnie orzełek, a "nie", kiedy wypadnie reszka. W pół godziny zrobił wszystkie zadania, podczas gdy wszyscy inni pocą się nad odpowiedziami. Kiedy zostaje kilka minut do końca, student w desperacji zaczyna rzucać monetą, mamrotać i pocić się. Podchodzi do niego egzaminator i pyta, co się dzieje. Student na to:- Sprawdzam moje odpowiedzi i wydaje mi się, że nie były właściwe!
STATYSTYKA Statystyka to nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy danych opisujących zjawiska masowe.
WPROWADZENIE Wyraz statystyka pochodzi od łacińskiego słowa status,co oznacza stan, położenie, stosunki (w języku włoskim stato oznacza państwo) i użyty został przez G. Achenwalla dla oznaczenia nauki o „osobliwościach państwowych”, zwanej państwoznastwem. Statystyka to zbiór metod służących pozyskiwaniu, prezentacji i analizie danych. Inna definicja: statystyka to nauka traktująca o metodach ilościowych badania zjawisk masowych. Zjawisko masowe to takie zjawisko,które badane w dużej masie zdarzeń wskazuje właściwą sobie prawidłowość, jakiej nie można zaobserwować w pojedynczym przypadku. Przykłady zjawisk masowych: spożycie pewnych artykułów na 1 mieszkańca, urodzenia itp.
Statystyka: a) umożliwia dokładniejszy sposób opisu interesującej nas rzeczywistości, b) zmusza nas do dokładności i śmiałości w działaniui rozumowaniu, c) umożliwia formułowanie uogólnień na podstawie uzyskanych wyników analizy, d) pozwala na przewidywanie rozwoju zjawiskw przyszłości, czyli pobudzanie do prognoz, e)dostarcza narzędzi do porządkowania informacjio zjawiskach – a przez to pozwala na budowę ich ogólnego obrazu, f)dostarcza narzędzi do prowadzenia analizy przyczyn kształtujących badane zjawiskai procesy, a więc umożliwia dokonanie ich klasyfikacji na czynniki systematyczne i przypadkowe.
Powstaje pytanie: dlaczego w zbiorze wielu zdarzeń zachodzą prawidłowości statystyczne podczas, gdy poszczególne zdarzenia są zróżnicowane? Otóż każde zjawisko (ekonomiczne, przyrodnicze, socjologiczne itp.) kształtuje się pod wpływem dwojakiego rodzaju przyczyn: • głównych (podstawowych, typowych, systematycznych). • ubocznych (przypadkowych, indywidualne). Ad1) Przyczyny główne oddziałują na każde zjawiskow sposób jednakowy, mają charakter wewnętrzny, ich istota wypływa z charakteru zjawiska – działają w ściśle określonym kierunku. Przyczyny te są wspólne dla wszystkich jednostek badanej zbiorowości zdarzeń (wpływ czynników głównych). Ad 2) Przyczyny uboczne działają nakażde zjawisko w sposób odmienny. Wyrażają zróżnicowanie osobnicze (wpływ czynnika losowego).
Ostatecznym celem stosowania tych metod jest otrzymanie użytecznych informacji na temat zjawiska, którego dotyczą. Istotne jest, aby badania statystyczne były zaplanowane w sposób nie budzący zastrzeżeń. Ich cel powinien być określony zrozumialei szczegółowo. Materiał statystyczny powinien zaś być wiarygodny i przejrzysty.
Cel badania jest możliwy do osiągnięcia wówczas, gdy jednostki statystyczne są precyzyjnie określone pod względem: • rzeczowym (przedmiot badań), • przestrzennym (miejsce badań), • czasowym (okres badań).
STATYSTYKA Samo znaczenie statystyki w administracji publicznej we współczesnym życiu społeczno-gospodarczym kraju wynika przede wszystkim z: • reaktywowania w roku 1990 samorządu terytorialnego, • transformacji ustrojowej, • obligatoryjności działań kontrolnych, m. in. ze strony gmin, sejmików • samorządowych oraz regionalnych izb obrachunkowych, • wzrostu znaczenia planowania strategicznego rozwoju lokalnego, • konieczności podejmowania działań marketingowych przez władze lokalne w warunkach konkurencyjnego otoczenia.
CEL, PRZEDMIOT I SCHEMAT BADAŃ STATYSTYCZNYCH Przykłady: • ruch demograficzny ludności miast o liczbie mieszkańców przekraczających 50 tys. osób, • sprzedaż działek budowlanych w ciągu ostatnich 5 lat na terenie danego powiatu, • opłaty wnoszone z tytułu dzierżawy przez mieszkańców, • wydawane zlecenia dla prowadzenia działalności gospodarczej przez urzędy, • składane zeznania podatkowe w Izbach Skarbowych.
CEL, PRZEDMIOT I SCHEMAT BADAŃ STATYSTYCZNYCH Schemat badania statystycznego obejmuje następujące kroki: Krok 1. projektowanie BADANIA,Krok 2. gromadzenie materiału statystycznego,Krok 3. opracowanie materiału statystycznego,Krok 4. analiza statystyczna.
PODSTAWOWE POJĘCIA STATYSTYKI Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter: • pełny - badanie obejmuje całą populację • częściowy - odbywa się na pewnych (zazwyczaj losowo) wybranych elementach populacji, czyli próbie losowej, zazwyczaj reprezentatywnej dla populacji
PODSTAWOWE POJĘCIA STATYSTYKI Zbiorowość statystyczna, nazywana też populacją statystyczną, - zbiór elementów (osób, przedmiotów, zdarzeń) podobnych, lecz nie identycznych pod względem określonej cechy, poddanych badaniom statystycznym.
PODSTAWOWE POJĘCIA STATYSTYKI Element zbiorowości statystycznej (populacji statystycznej) jest nazywany jednostką statystyczną. Liczba jednostek statystycznych, czyli elementów zbiorowości, jest nazywana liczebnością zbiorowości.
PODSTAWOWE POJĘCIA STATYSTYKI Cecha statystyczna (nazywana też zmienną) to właściwość elementów zbiorowości statystycznej będąca przedmiotem badania statystycznego.
Klasyfikacja zbiorowości statystycznych Zbiorowość statystyczna Skończona Ma skończoną liczbę jednostek; np. 50 firm farmaceutycznych Nieskończona Ma nieskończona lub niemożliwą do ustalenia liczbę jednostek statystycznych; Np. zbiorowość mikroorganizmów, klienci odwiedzający centrum handlowe
Klasyfikacja zbiorowości statystycznych Zbiorowość statystyczna Jednowymiarowa badana ze względu na jedną cechę np. firmy farmaceutyczne badane ze względu na wielkość obrotów Wielowymiarowa badana jednocześnie ze względu na kilka cech np. firmy farmac. w których badamy zależność wielkości obrotów od liczby przedstawicieli handlowych
Klasyfikacja zbiorowości statystycznych Zbiorowość statystyczna Względnie jednorodna Jej podzbiorowości mało różnią się własnościami np. zbiorowość gospodarstw 2 – osobowych badana ze względu na tygodniowe wydatki na żywność Niejednorodna Jej podzbiorowości wyraźnie różnią się własnościami np. zbiorowość gospodarstw o różnej wielkości badana ze względu na tygodniowe wydatki na żywność
Klasyfikacja zbiorowości statystycznych Zbiorowość statystyczna Statyczna Wszystkie jednostki statystyczne pochodzą z tego samego okresu np. firmy farmac. zarejestrowane we wrześniu 2006 r., spółki na giełdzie notowane 15.06.2007r. Dynamiczna Jednostki statystyczne pochodzą z różnych okresów np. kolejne sesje giełdowe w październiku 2008r.
Klasyfikacja cech statystycznych Cecha statystyczna ilościowa (mierzalna) wyrażone za pomocą liczb jakościowa (niemierzalna) wyrażona w sposób opisowy. skokowa przyjmuje skończoną lub przeliczalną liczbę wartości; w pewnym przedziale zmienności może przyjąć tylko niektóre wartości. ciągła - może przyjąć każdą wartość z określonego przedziału liczbowego
PRZYKŁAD 1 Badamy wysokość kredytów wśród klientów indywidualnych PKO BP w dniu 30.06.2007r. Zbiorowość statystyczna: indywidualni kredytobiorcy PKOBP Jednostka statystyczna: jeden klient – obiekt materialny (kto – klient PKO BP, kiedy – 30.06.2007r., gdzie – Polska) Typ zbiorowości: skończona, jednowymiarowa, względnie jednorodna, statyczna Cecha statystyczna: wysokość kredytu (tys. zł) Typ cechy statystycznej: mierzalna, ciągła
PRZYKŁAD 2 Badamy opinię pracowników, dotyczącą decyzji zarządu jednej z warszawskich firm o połączeniu z inną firmą. Zbiorowość statystyczna: pracownicy firmy Jednostka statystyczna: jeden pracownik – obiekt materialny (kto – pracownik firmy, kiedy – np. 31.05.2008r., gdzie – Warszawa, Polska) Typ zbiorowości: skończona, jednowymiarowa, względnie jednorodna, statyczna Cecha statystyczna: opinia (kategoria cechy: popieram, nie popieram, nie wiem) Typ cechy statystycznej: niemierzalna
Rodzaje cech • ilościowe • jakościowe Skale pomiarowe • Uzależnione są od rodzaju opisywanych zmiennych • Determinują, co można zrobić z daną zmienną
Skale pomiarowe • Zmienne jakościowe • Skala nominalna • Skala porządkowa (rangowa) • Zmienne ilościowe • Skala przedziałowe (interwałowa) • Skala ilorazowa (stosunkowa)
Skala Skala jest to odwzorowanie, czyli model rzeczywistych zjawisk i relacji. Skale buduje się, przyporządkowując symbole mierzonym cechom według określonych zasad. Skalowanie to czynność odwzorowania mierzonej cechy za pomocą wybranej skali.
Skale pomiarowe należy odróżnić od instrumentu pomiarowego (=kwestionariusza). W rzeczywistości są one składnikiem konstrukcji instrumentu pomiarowego, a nie samym instrumentem.
Stosuje się następujące skale pomiarowe: • nominalną • porządkową • przedziałową • stosunkową
Skala nominalna – polega na nadawaniu etykietek interesującym nas obiektom; nie wartościuje ich ani nie porządkuje jedynie przypisuje je do określonych kategorii; umożliwia stwierdzenie różnic lub równości między mierzonymi cechami • lubię lody • nie lubię lodów
Skala nominalna • Pozwala rozpoznawać obiekty jednakowe i różne, bez wypowiadania się o relacjach między nimi, np.rodzaj zakładu pracy, płeć, itp. • Często pomiar na skali nominalnej jest liczbowym etykietowaniem badanych obiektów, np. kody w niektórych bazach danych • Bardzo słaba skala pomiarowa • Graficzna prezentacja, dominanta
Skala porządkowa – organizuje obiekty zgodnie z natężeniem mierzonej cechy; dowiadujemy się o kolejności obiektów oraz o ich pozycji względem siebie i mierzonej cechy, umożliwia uporządkowanie badanych cech obiektu • bardzo lubię lody • lubię lody • nie lubię lodów
Skala porządkowa • wprowadza relację porządku w zbiorze zmiennych jakościowych, np. uszkodzenie słabe, średnie, silne; ... • Jest skalą mocniejszą niż nominalna • Powoduje najwięcej problemów i nieporozumień, przedmiot powszechnie popełnianych błędów
Skala porządkowa • Przykład: skala ocen (ndst, dst, db, bdb) • Wszelkiego rodzaju obliczenia są tutaj nadużyciem: nieznana jest odległość między poszczególnymi ocenami (różnica między różnymi stopniami jest różna; często mieszane kategorie) • Możliwe jest jedynie określenie, że np. silny stopień uszkodzenia jest mocniejszy niż słaby
Skala interwałowa (przedziałowa) – umożliwia nie tylko stwierdzenie relacji mniejszości lub większości, lecz również odstępów między przedziałami skali. Porządkuje obiekty, określa względne różnice między nimi • bardzo lubię bardzo nie lubię • 1 2 3 4 5
Skala przedziałowa • Zachowuje własności skali porządkowej, ale dodatkowo wyposażona jest w stałą jednostkę miary i umowne zero • Możliwy jest pomiar odległości między uporządkowanymi zmiennymi • Jest skalą mocniejszą od porządkowej
Skala przedziałowa • Przykład: skala Celsjusza dla temperatury • Możliwe jest określenie o ile stopni dana temperatura różni się od innej • Ale nie można opisać sensownie stosunku dwóch wartości zmiennych • Np. średnia temperatura lipca w centralnej Polsce (17C) różni się od średniej rocznej temperatury tego obszaru (7C) o 10 stopni, ale nie oznacza to np., że w lipcu jest ponad 2 razy cieplej niż średnio w roku
Skala ilorazowa (stosunkowa) – umożliwia pomiar na najwyższym poziomie, dzięki istnienia naturalnego punktu zerowego lub naturalnej jednostki miary, na tej skali można porównać pomiary, obliczać ich stosunek • np. kwota pieniędzy wydawana w ciągu miesiąca na lody ................. zł
Skala ilorazowa • różni się od skali przedziałowej tym, że posiada zero absolutne, a nie umowne • Możliwe jest określenie ile razy dana cecha jest większa od innej • Jest to najsilniejsza skala pomiarowa
Skala ilorazowa • Przykład: liczba kandydatów na studia • Na Wydz. Ekon. było 100 kandydatów na studia, na Wydz. Inf. 500 kandydatów (jest to 5 razy więcej niż na Wydz. Ekon) – zerem absolutnym jest tu brak kandydatów na studia.
Skalowanie to czynność odwzorowania mierzonej cechy za pomocą wybranej skali. skalowanie zrównoważone – wymaga się ustalenia klasy środkowej oraz wyznaczenia jednakowej liczby klasy o jednakowej intensywności po obu stronach ustalonej klasy środkowej. Posiada równą liczbę pozytywnych i negatywnych kategorii • wspaniale • dobrze • ani dobrze ani źle– klasa środkowa • źle • okropnie
skalowanie niezrównoważone – po obu stronach skali występuje różna liczba klas lub klasy o niejednakowej intensywności (uwypukla kategorie ujemne lub dodatnie) • znakomicie • dobrze • zadawalająco • okropnie
parzysta liczba alternatyw – respondent nie ma możliwości odniesienia się do punktu neutralnego • zdecydowanie negatywny • zdecydowanie pozytywny
nieparzysta liczba alternatyw – skala zawiera środkową neutralną pozycję • zdecydowanie negatywny • obojętny • zdecydowanie pozytywny
skala rankingowa – gdy respondent porządkuje wymienione w kwestionariuszu kategorie według podanego kryterium (hierarchii ważności) • metoda porównywania parami – respondent wybiera jedną z dwóch możliwości zgodnie z podanymi kryteriami
skala sumowania ocen: porównawcza • respondent wymienionym cechom czy obiektom przyporządkowuje, zgodnie ze swoimi preferencjami oceny liczbowe, tak by dawały wymagana sumę, najczęściej 10 lub 100 rangowa • respondent rozdziela punkty między cechy lub obiekty według ustalonego kryterium, np. w hierarchii ważności
skala Stapela – zestaw skal o wartości od –5 do +5; nie uwzględnia się przedziałów neutralnych; skala Stapela jest zatem przykładem skalowania wymuszającego.
Skala Stapela • Poniżej przedstawiono cechy charakteryzujące sklepik monopolowy Robik. Proszę ocenić sklepik według własnych preferencji, mając na uwadze, że od +1 do +3 ocena pozytywna, natomiast od –1 do –3 jest negatywną oceną
skala Likerta – zestaw skal porządkowych • składają się z wielu pozycji ; krótkie zdanie oznajmujące charakterystycznie określone postawy wobec obiektu • wszystkie pozycje skali mają przyporządkowane skale intensywności będące skalami dwubiegunowymi zazwyczaj pięciostopniowymi • stopnie skali opisane są werbalnie i numerycznie; • wyższe wartości numeryczne odzwierciedlają postawy pozytywne, a niższe negatywne
Skala Likerta Proszę podać swoją opinie w 5-stopniowej skali, dotyczącej wpływu działalności firm zagranicznych w Polsce