320 likes | 668 Views
Wojewódzki Urząd Pracy w Szczecinie, od 2005 roku wdraża długofalowy program badania regionalnego rynku pracy. Zachodniopomorskie Obserwatorium Rynku Pracy CEL: źródło czytelnej, jasnej i zrozumiałej informacji…. Konceptualizacja. Konceptualizacja.
E N D
Wojewódzki Urząd Pracy w Szczecinie, od 2005 roku wdraża długofalowy program badania regionalnego rynku pracy. • Zachodniopomorskie Obserwatorium Rynku Pracy • CEL: źródło czytelnej, jasnej i zrozumiałej informacji…
Konceptualizacja • Zrozumienie implikacji pomiędzy celem badania, problemem decyzyjnym a problemem badawczym jest szczególnym elementem w procesie badań. • Niewłaściwe wybranie problemu badawczego jest pierwszym etapem w procesie badań i dlatego rzutuje na jakość całego procesu badawczego a tym samym na jakość wyników badań. • Np. spadek bezrobocia jest symptomem problemu badawczego a nie problemem badawczym, a już z pewnością nie jest celem badania. • Wzrost migracji zarobkowych jest symptomem, ale nie celem badania
Reprezentatywność - magiczne słowo w badaniach marketingowych • Co to jest reprezentatywność wyników badań? • Jak sprawdzić czy badania są reprezentatywne? • Jaki jest związek pomiędzy reprezentatywnością wyników badań a jakością, wiarygodnością wyników dla całej populacji? • O co tyle krzyku z tą reprezentatywnością?
Reprezentatywność • Pojęcie reprezentatywności nie ma ścisłego naukowego sensu, ma ono pewne potoczne znaczenie
Reprezentatywność • Pojecie jakości w badaniach wiąże się z ich wiarygodnością. • Wiarygodność badań to zaufanie do metody i sposobu przeprowadzania badań, • Badania reprezentatywne to takie, których wyniki można z dużym prawdopodobieństwem (95%, 99%) – równym przedziałowi ufności uogólniać na całą populację generalną. • Próba reprezentatywna jest miniaturką populacji badanej i odzwierciedla jej najważniejsze cechy.
Reprezentatywność • Próbę uznamy za reprezentatywną dla populacji, z której została dobrana, jeśli zagregowane cechy tej próby ściśle odzwierciedlają te same zagregowane cechy populacji. • Jeśli na przykład 50% populacji stanowią kobiety, to próba musi zawierać „w przybliżeniu” 50% kobiet, aby była reprezentatywna. • Chociaż dobór próby może oznaczać każdą procedurę wyboru jednostek obserwacji - na przykład ankietowanie co dziesiątego przechodnia na ruchliwej ulicy - kluczem do uogólniania wniosków z próby na szerszą populację jest probabilistyczny dobór próby, powiązany z ważną ideą doboru losowego.
Koszty badań reprezentatywnych • Koszt badania reprezentacyjnego jest rosnącą funkcją liczebności próby dla przyjętego schematu losowania. L. Kish wyróżnia następujące składowe: • kosztów stałych • niezależne ani od liczebności próby, ani od sposobu przeprowadzania badania. Zalicza tu koszty opracowania koncepcji badań, sporządzenia kwestionariusza lub innych tego rodzaju narzędzi badań, analizy wyników, przygotowania, wydrukowania i rozkolportowania raportu z badań itp.; • niezależne od wielkości próby, ale zależne od sposobu przeprowadzenia badań. Zalicza tu koszty szeregu prac o charakterze administracyjno-organizacyjnym, uzyskania odpowiednich danych w celu sporządzenia operatu losowania, przygotowania instrukcji, przeprowadzenia szkolenia itp.;
Koszty badań reprezentatywnych • kosztów zmiennych; • proporcjonalne do wielkości próby, ale niezależne od sposobu przeprowadzenia badań. Zalicza tu koszty uzyskania i ewidencji informacji w trakcie badań, kodowania danych i dokonania obliczeń numerycznych, szeregu prac o charakterze biurowym itp.; • proporcjonalne do wielkości próby, ale też zależny od sposobu przeprowadzenia badań. Zalicza tu koszt szkolenia i utrzymania w terenie wykonawców zależny od liczby punktów badań, koszty przejazdu zależne od miejsca zamieszkania respondentów, koszt sporządzenia operatu losowania, jeżeli będzie on różny dla różnych sposobów badania itp.
Błąd szacunku, przedział ufności, liczebność próby badawczej, a cena badania • Liczba przeprowadzonych ankiet = 1078? • Jakie znaczenie ma liczba przeprowadzonych ankiet? • Za co płacić?
Błąd szacunku • Średni błąd szacunku – dokładność badania • Sam decydujesz o ile chcesz się mylić
Które badanie jest najbardziej dokładne? • Które badanie wybierze przedsiębiorca?
Losowanie proste bez zwracania, gdy znana jest liczebność populacji generalnej, przy szacowaniu średniej z populacji. • Losowanie proste bez zwracania, gdy znana jest liczebność populacji generalnej, przy szacowaniu frakcji z populacji.
MINIMALNA LICZEBNOŚĆ PRÓBY BADAWCZEJ LOSOWANIE PROSTE NIEZALEŻNE POPULACJA NIESKOŃCZONA Wzór stosowany dla oszacowania frakcji populacji np – niezbędna liczebność próby (U)2 – liczba odchyleń standardowych, którą należy odczytać z tablicy rozkładu normalnego dla poziomu ufności 1 - p – ocena frakcji populacji posiadającej wyróżnioną cechę q - 1 – p UWAGA Iloczyn p* q szacuje się na próby wstępnej, której liczebność zależy od ocenianej frakcji p. Jeżeli ta oceniana frakcja zawiera się w granicach 0,2 p 0,8, to wystarczy dla oszacowania iloczynu p*(1 – p) pobrać próbkę wstępną liczącą n = 60 elementów. Jeśli natomiast szacowana frakcja p jest mniejsza od 0,2, to należy pobrać tak dużą próbkę wstępną, aby n*p = 25, a w przypadku gdy p jest większe od 0,8, należy pobrać próbkę n*q = 25. (U)2 * p*q np = d2
LOSOWANIE PROSTE NIEZALEŻNE POPULACJA NIESKOŃCZONA Wzór stosowany dla oszacowania średniej populacji np – niezbędna liczebność próby (U)2 – liczba odchyleń standardowych, którą należy odczytać z tablicy rozkładu normalnego dla poziomu ufności 1 - - odchylenie standardowe badanej zmiennej w populacji (znane lub oszacowane na podstawie wcześniejszych badań) d - dopuszczalny maksymalny błąd szacunku średniej m np = (U)2 * 2 d2
Przedział ufności • Dokładność naszych statystyk z prób wyrażamy w kategoriach poziomu ufności co do tego, że statystyki te mieszczą się w określonym przedziale od parametru. • Przykładowo, możemy powiedzieć, że mamy 95-procentową ufność, że nasza statystyka z próby (na przykład 50-procentowe poparcie dla nowego kodeksu studenckiego) mieści się w przedziale ±5% od parametru w populacji. • Gdy poszerza się przedział ufności dla danej statystyki, nasza ufność się zwiększa. Możemy na przykład powiedzieć, że mamy 99,9-procentową ufność, że nasza statystyka mieści się w granicach trzech błędów standardowych od prawdziwej wartości parametru. • Przedział ufności – pewność że wynik obejmuje dany odsetek zjawisk
Przedział ufności • Gdy już zdecydujesz się, jaki poziom błędu z próby możesz tolerować, będziesz w stanie obliczyć liczbę przypadków potrzebnych w twojej próbie. • Czyli dla przykładu, jeśli chcesz mieć 95-procentową pewność, że wyniki twoich badań są dokładne w granicach ± 5% od parametrów w populacji, powinieneś dobrać próbę o liczebności co najmniej ….. • No właśnie to trzeba obliczyć • !Wzór na obliczenie minimalnej liczebności próby zależy od metody doboru
Populacja generalna • Populacją generalną nazywamy skończoną zbiorowość, o której badacz chce uzyskać określone informacje. Są to wszystkie jednostki, które z punktu widzenia celu badania mogą być poddane badaniom, u których występuje interesująca badacza cecha. • W celu zdefiniowania populacji generalnej badacz powinien wziąć pod uwagę takie charakterystyki jak: • element badania (treść informacji) • jednostkę badania (nośnik informacji) • wymiar czasowy • przestrzenny • Są to charakterystyki niezbędne do zdefiniowania danej populacji.
Populacja generalna • Uwaga na błędy populacji • Błędy niewłaściwego wytypowania populacji generalnej, wynikające z różnicy miedzy populacją niezbędną do otrzymania potrzebnych danych a populacją szukaną przez badacza. • Błędy wytypowania niewłaściwego wykazu populacji badanej, wynikacie z różnicy między populacją zdefiniowaną przez badacza a listą badanych jednostek przez niego używaną, np. książka telefoniczna
Badamy wizerunek miasta Warszawy wśród mieszkańców – jak zdefiniować populację? • Badamy migracje zarobkowe – jak zdefiniować populację • Kogo zakwalifikować do badania?
Dobór próby do badań – warstwowy, warstwowo - losowy, kwotowy – synonimy? - czy to te same czy odrębne metody doboru próby do badań • Uwaga dokładnie określmy metodę doboru próby do badań!
Dobór warstwowy a kwotowy • Dobór warstwowy polega na podziale całej populacji generalnej na tzw. warstwy i dokonaniu losowania bezpośredniego niezależnych prób w obrębie każdej warstwy. • Podział populacji na warstwy musi być przeprowadzony w taki sposób, aby każdy element wchodził tylko do jednej warstwy i znajdował się w którejś z nich. • Metoda ta pozwala zapobiec dobieraniu nieadekwatnych prób losowych ze zbiorowości, w których występuje silne rozproszenie badanych cech. • W porównaniu do nieograniczonego doboru losowego metoda ta charakteryzuje się większą dokładnością wyników przy zachowaniu tej samej wielkości próby. • Dobór warstwowy czasami nazywany jest losowo – warstwowym. Ponieważ na poziomie każdej warstwy powinno dobierać się jednostki stosując dobór losowy. • Uwaga! Czasami firmy badawcze na poziomie warstwy stosują dobór przypadkowy!
Dobór warstwowy a kwotowy • Wyróżnia się trzy rodzaje technik losowania z poszczególnych warstw: • dobór proporcjonalny, polegający na wyborze z każdej warstwy takiej liczby elementów, jaka pozostaje w proporcji do liczebności (udziału) tej warstwy w całej populacji. Dużym ułatwieniem, jakie stwarza ta technika doboru w sferze analizy danych jest możliwość przeprowadzenia obliczeń dla całej próby jednocześnie, nie zaś dla każdej warstwy oddzielnie, dobór ten posiada bowiem zaletę samoważenia. • dobór nieproporcjonalny polegający na wyróżnieniu warstw w populacji generalnej, które są niedoreprezentowane w próbie (ich udział w populacji jest niewielki), a następnie doborze z każdej warstwy takiej liczby elementów, która pozostaje w proporcji do iloczynu liczebności warstwy i odchylenia standardowego badanej cechy w danej warstwie. Postępowanie takie jest intuicyjnie poprawne, bowiem dla reprezentowania warstwy o większym rozproszeniu badanej cechy potrzeba większej liczby elementów w próbie niż dla warstwy o mniejszym rozproszeniu, a jednocześnie z większej warstwy powinna być wylosowana większa próba. • dobór optymalny jest taką techniką doboru, w której z poszczególnych warstw do próby, losuje się taka liczbę elementów, która jest proporcjonalna do iloczynu liczebności warstwy i wielkości odchylenia standardowego badanej cechy w danej warstwie, a odwrotnie proporcjonalny do pierwiastka kwadratowego z kosztu badania jednostki należącej do danej warstwy. W takich przypadkach dobór elementów z każdej warstwy do próby powinien być odwrotnie proporcjonalny do pierwiastka kwadratowego z kosztu badania każdej jednostki. • Uwaga sprecyzujmy jaka ma być metoda doboru w ramach warstwy
Dobór warstwowy a kwotowy • Dobór kwotowy próby badawczej opiera się za założeniu, że próba jest reprezentatywna dla wszystkich interesujących nas cech, jeżeli jej struktura oparta na kilku istotnych cechach jest identyczna ze strukturą zbiorowości generalnej. • Innymi słowy dobór kwotowy opiera się na znajomości struktury populacji generalnej (tzw. zmiennych kontrolnych) i jej odwzorowaniu na strukturze próby badawczej. • Liczebność segmentacyjną próby badawczej ustalić można na podstawie przemnożenia rozkładu procentowego wybranych cech w populacji generalnej przez ogólną liczebność próby. • Im więcej wyróżnionych cech jako zmiennych kontrolnych, tym więcej podziałów segmentowych i tym trudniej jest skompletować odpowiedni skład próby.
Dobór warstwowy a kwotowy • Polega na odwzorowaniu struktury populacji generalnej na strukturze próby badawczej • W próbie kwotowej wychodzi się od macierzy lub tabeli, opisującej istotne dla badania cechy populacji. W zależności od celów badania badaczowi może być potrzebna wiedza, jaki jest na przykład udział mężczyzn i kobiet w badanej populacji oraz jaki jest udział każdej płci w poszczególnych kategoriach wieku, poziomu wykształcenia. • W ramach kwoty dobiera się jednostki stosując dobór przypadkowy! • Dobór kwotowy nie jest traktowany jako metoda reprezentatywna. Jest doborem quasi reprezentatywnym
Hipotezy badawcze • Hipotezy naukowe powinny być: • o tyle nowe, że wskazywałyby na jakieś nieznane dotąd aspekty badanych faktów, procesów, zjawisk, ich uwarunkowań i okoliczności; • pojęciowo jasne, tzn. wyrażone w jednoznacznych terminach, możliwie dostatecznie ostrych, ( a jeżeli używa się terminów nieostrych, jak np. młody, stary, duży, mały itp., to należy je odpowiednio zdefiniować, np. „młodymi nazywam ludzi w wieku od...do...lat” itp.); • konkretne - hipoteza nie powinna stanowić zbyt ogólnej generalizacji (np. „ludzie z reguły wyjeżdżają na wakacje do ciepłych krajów” • wolne od sprzeczności wewnętrznych, czyli powinny być tak sformułowane, aby nie zawierały zdań wzajemnie sprzecznych; • dogodne statystycznie – hipotezy badawcze powinny być stosunkowo łatwo przekładalne na hipotezy statystyczne;
Hipotezy • Wraz z długością pozostawania osobą bezrobotną spada zainteresowanie podjęciem pracy • Im starsza osoba tym trudniej się uczy • Młode kobiety nie są zainteresowane pracą w ternie. • Bezrobotni są mniej aktywni społecznie i kulturowo • Im większe dochody drugiego członka rodziny osoby bezrobotnej, tym mniejsza motywacja do podjęcia pracy przez osobą bezrobotną. • Motywacja osoby bezrobotnej do podjęcia pracy jest niska. • Bezrobotni często korzystają z usług instytucji wsparcia • Im wyższe dochody w ostatniej pracy, tym wyższe oczekiwania płacowe osoby bezrobotnej.
Dziękuję za uwagę • Powodzenia!