170 likes | 399 Views
Dobór pytań w metodzie zliczania odpowiedzi ( Item Count Method ). Michał Mierzwa. Pytanie o charakterystykę niewrażliwą. Pytanie o charakterystykę niewrażliwą to pytanie, na którą z dużym prawdopodobieństwem respondenci udzielą odpowiedzi prawdziwej: Przykład:
E N D
Dobór pytań w metodzie zliczania odpowiedzi(ItemCountMethod). Michał Mierzwa
Pytanie o charakterystykę niewrażliwą • Pytanie o charakterystykę niewrażliwą to pytanie, na którą z dużym prawdopodobieństwem respondenci udzielą odpowiedzi prawdziwej: • Przykład: • Czy urodziłaś/eś się w styczniu? • Czy umiesz pływać?
Pytania o charakterystykę wrażliwą • Pytanie o charakterystykę wrażliwą to pytanie, na którą respondenci mogą nie chcieć udzielić odpowiedzi lub udzieliliby odpowiedzi fałszywej. • Przykład: • Czy w Twoim zakładzie pracy rozpowszechniane są narkotyki? • Czy kiedykolwiek wręczyłaś/eś łapówkę?
Metoda Zliczania Odpowiedzi(ItemCountMethod) • Metoda mająca na celu uzyskanie wiarygodnych wyników dotyczących kwestii wrażliwych. Polega na sformułowaniu pytań w taki sposób, aby respondenci byli skłonni udzielać prawdziwych odpowiedzi na pytania o charakterystyce wrażliwej. Po przeprowadzeniu badania ankietowego zliczane są odpowiedzi w sposób, który pozwala na wiarygodne oszacowanie odsetka występowania charakterystyki wrażliwej wśród respondentów.
Niech oznacza populację o znanej liczebności , oraz • , jeśli i-ta osoba posiada wrażliwą charakterystykę , oraz • , jeśli i-ta osoba posiada - dopełnienie Problem stanowi estymacja frakcji występowania charakterystyki wrażliwej
Zastosowanie Metody Zliczania Odpowiedzi wymaga stworzenia dwóch list z pytaniami, na których znajduje się G takich samych pytań niewrażliwych. Niech: • jeśli i-ta osoba posiada niewrażliwą charakterystykę F , oraz • jeśli i-ta osoba posiada - dopełnienie F
Pytanie G+1 na pierwszej liście uwzględnia wrażliwą charakterystykę A, niewrażliwą F oraz obydwie te charakterystyki jednocześnie • Pytanie G+1 na drugiej liście zawiera dopełnienie charakterystyki A, dopełnienie charakterystyki F oraz iloczyn dopełnień charakterystyk wrażliwej i niewrażliwej
Następnie dwie niezależne próby i są losowane z populacji wykorzystując plan losowania . Respondenci z pierwszej próby proszeni są o podanie dotyczącej ich liczby zachowań z listy pierwszej. Respondenci z drugiej próby proszeni są o podanie dotyczącej ich liczby zachowań z listy drugiej. Stąd w populacji:
Estymator frakcji charakterystyki wrażliwej Estymator średniej liczby zachowań w pierwszej grupie respondentów Estymator średniej liczby zachowań w drugiej grupie respondentów Znana frakcja pytania dodatkowego G+1 Estymator parametru
Problem badawczy • Na jakim poziomie należy ustalić frakcję charakterystyki F, • Jak w przybliżeniu powinna kształtować się frakcja odpowiedzi poszczególnych pytań z zestawu G, • Ile powinna wynosić liczba pytań G - tak, aby błąd średniokwadratowy estymatora był jak najmniejszy.
Symulacje • Symulacje badawcze przeprowadzone zostały metodą Monte Carlo o liczbie iteracji 10 000 w programie R. Liczebność respondentów grupy 1. i 2. założona została na poziomie 50. Obliczenia wykonano dla frakcji 0.1, 0.2, 0,3 … 0.9.
RMSE estymatora frakcji charakterystyki wrażliwej a frakcja charakterystyki niewrażliwej F (w %)
Ustalenie frakcji odpowiedzi pytań z zestawu G. dla kombinacji frakcji pierwszych G=2 pytań.
dla różnej liczby pytań G. Frakcja pytań dodatkowych =0,2 Frakcja pytań dodatkowych =0,5
Pytania ankietowe: • Dla grupy 1 i 2 • Czy dojeżdżasz na uczelnię środkami komunikacji miejskiej? • Czy obchodzisz urodziny w czwartym kwartale? • Tylko dla grupy 1 • Czy korzystałeś/aś ze świadczeń socjalnych na uczelni (np. stypendium socjalne) lub ostatnia cyfra twojego numeru albumu jest równa lub większa od 2 lub jedno i drugie? • Tylko dla grupy 2 • Czy nigdy nie korzystałeś/aś ze świadczeń socjalnych na uczelni (np. stypendium socjalne) lub ostatnia cyfra twojego numeru albumu jest mniejsza lub równa 1 lub jedno i drugie? • Frakcja pytania F (o numer albumu) jest znana i wynosi 0,205.
Bibliografia • Cassel C.M., Särndal C.E., Wretman J.H., Foundations of Inference in Survey Sampling, John Wiley & Sons, New York-London-Sydney-Toronto, 1977. • Chaudhuri A., Christofides T. C., Item Count Technique in estimating the proportion of people with a sensitive feature, Journal of Statistical Planning and Inference, 137,pp. 2007. • Fox J. P., Randomize Item Theory Response Models, Journal of Educational and Behavioral Statistics, Vol. 30, No. 2, pp., 2005. • Kuk A. Y. C., Asking Sensitive Questions Indirectly, Biometrika, Vol. 77, No. 2 Jun., 1990. • Pal S., Estimating The Proportion Of People Bearing Sensitive Issue With an Option To Item Count Lists And Randomized Response, Statistics In Transitions- new series, Vol. 8, No. 2, pp., 2007. • R Development Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org, 2012. • Rouse B. A., Kozel N. J., Louise G. Richards, Self Report Methods of Estimating Drug Use: Meeting Current Challenges to Validity, NIDA Research Monograph 57, 1985. • Tsuchiya T., Domain Estimators for the Item Count Technique, Survey Methodology, Vol. 31, no. 1, pp., 2005. • Wywiał J. Elementy metody reprezentacyjnej z wykorzystaniem statystycznego pakietu SPSS. Akademia Ekonomiczna w Katowicach, Katowice 1999.