180 likes | 324 Views
A Magyar Tudomány Ünnepe 2013 A statisztika és a jövőkutatás alapjai Az MTA IX. Osztály Statisztikai és Jövőkutatási Tudományos Bizottságának nyilvános ülése 2013. november 18. Marton Ádám: Egy idegenbe szakadt nagy magyar statisztikus, Leslie Kish.
E N D
A Magyar Tudomány Ünnepe 2013A statisztika és a jövőkutatás alapjaiAz MTA IX. Osztály Statisztikai és Jövőkutatási Tudományos Bizottságának nyilvános ülése2013. november 18 Marton Ádám: Egy idegenbe szakadt nagy magyar statisztikus, Leslie Kish
Bevezető • Leslie Kish-nek (Kiss László), aki magát mintavetőnek, (sampler) nevezte, elméleti és gyakorlati munkássága jelentős hatással volt az összeírások, felvételek megtervezésére, végrehajtására a hivatalos statisztikában, de a kísérletek tervezésére, végrehajtására a kutatásokban is. • Kiváló elméleti felkészültsége mellett alapvetően a gyakorlati problémák érdekelték. Hogyan lehet és kell jól reprezentáló adatokat megszerezni, amelyekből a teljes sokaságra vonatkozó, megbízható következtetések vonhatók le.
Életútja • Leslie Kish 1910-ben született Poprádon. Édesapja Amerikát megjárt elektromérnök volt. 1926-ban a család végleg Amerikába költözött. • Az iskola elvégzése után orvosi kutatóintézetben dolgozott, ahol a kísérleteket biometriai módszerekkel elemezték. R.A.Fisher, Yule, Snedecor, Pearson könyveiből képezte magát. (1936-ban lett amerikai állampolgár). • 1937-ben a magyar brigád tagjaként részt vett a spanyol polgárháborúban, ahol meg is sebesült.1939-ben újra Amerikában volt, ahol matematikusi diplomát szerzett. Később a PhD.-t szociológiából szerezte meg. • Washingtonban a Mezőgazdasági Minisztériumban (kvóta) mintavételi terveket készített. (Division of Program Surveys - DPS). • A II. világháború alatt meteorológusként szolgált a hadseregben. • A háború után ismét Washingtonban a DPS-nél dolgozott(1945-1947). 1947-től élete végéig (2000) Ann Arborban élt és dolgozott.
Jól ismerte a matematikát, de gyakorlati ember volt. Mind kutatóként, mind oktatóként a statisztikai felvételeket a maguk „teljességében”, komplexitásában vizsgálta. • Felismerte,hogy egy felvétel megtervezése (survey design) nem csak a mintavételi tervből áll. Fontos a kérdőívtervezés, a mérési és becslési problémák megoldása, a terepmunka, a mintavételi hiba becslése és nem utolsó sorban a meghiúsulások kezelése. • Az 1940-es évek második felében előtérbe kerültek a társadalomtudományok. A DPS-nél összejött lelkes kutató-fejlesztő csoport onnét kiválva, Rensis Likert vezetésével megalapította Ann Arborban a University of Michigen Institute for Social Research-t. Az alapítók között volt Katona György is. • Folytatták a már Washingtonban megkezdett kutatásokat (gazdaságstatisztikával, establishment survey-k tervezésével nem foglalkoztak).
Néhány szó a mintavételek történetéről • Már a XIX.sz-ban voltak viták a mintavételes (részleges) adatgyűjtésekről. • Kiaer (norvég statisztikus) az ISI 1895. évi közgyűlésére összeállított dolgozatában leírja a reprezentatív mintavétel alapelveit: legyen körültekintően, reprezentatív módon, tudatosan végrehajtott kiválasztás. • A XX. század elején a német statisztikusok a teljes körű felvételeket (cenzusok) tekintették üdvözítő módszernek,míg az angolszászok kiálltak a részleges, de jól végrehajtott minták alapján kialakított (purposive selection) következtetések mellett. • Az International Statistical Institute Berlinben, 1903-ben hozott határozatot a reprezentatív felvételek módszertanáról • Már a század elején igény mutatkozott arra is, hogy megállapítható legyen az adatok pontossága. • 1934: J. Neyman kimutatta, hogy véletlen mintákból becsülhető a mintavételi hiba (sampling error). Ezzel a véletlen minták, ha nem is azonnal, „győzelmet arattak” a kvóta-minták felett. Általánossá válásukhoz azonban még sok időnek kellett eltelni.
A mintavételi és becslési technikák fejlesztése • Leslie Kish egyik első eredménye volt, hogy kidolgozott egy máig alkalmazott technikát arra, hogyan lehet a háztartáson belül egy személyt a kutatás céljainak megfelelően kiválasztani: LK kulcs (Kish-grid). • Sokat foglalkozott a meghiúsulások problémáival (pótlás,becslés, stb.) • Az urbanizáció fejlődése magával hozta a nagyvárosok környékének átalakulását, aminek folyamatát tanulmányozni kezdték. A nevéhez fűződik az „idea of balanced selection of suburbs: representing size, economics, distance from the city”. De ezek még nem voltak valószínűségi minták. • 1948-ban elnökválasztás volt az USA-ban. Truman Győzött. Mindössze 600-as véletlen minta eredménye alapján az ISR-ban őt tekintették esélyesnek Dewey-vel szemben. A jóval nagyobb nem véletlen minták becslései hibásnak bizonyultak. • Paradigmaváltás: a véletlen minták győztek a kvóta minták felett.
Mint ismeretes, az egyszerű véletlen mintákon alapuló felvételek kivitelezése költséges és bonyolult. Leslie Kish ennek áthidalására dolgozott ki számos technikát. Ezek, a teljesség igénye nélkül: • Többirányú és több szintű rétegezés,(multiple stratification) • Kontrollált kiválasztás, többlépcsős mintavétel, elsődleges mintavételi egység (PSU) • Többcélú minták (multipurpose design) • Guruló (rolling) minták, guruló cenzusok • Ismétlődő felvételek, részleges átfedés, (partial overlap), osztott panelek (split panel design) • Ritka populációk vizsgálata • Súlyozási technikák • A mintavételi terv hatása a szórás becslésére (Design effect) • A mintavételi hiba becslése (variance estimation) • Balanced, repeated replication - BRR, Jackknife repeated replication - JRR • Technikák a becslések megbízhatóságának javítására • Kisterületi becslések(Small area estimation)
Leslie Kish véleménye szerint a legnagyobb probléma a jövőben is az egyre több hiányzó adat,a „nonresponse” lesz. Ugyanis: „a legjobb megszerezni az adatot, a legrosszabb nem csinálni semmit”. • Mindig fontos feladat lesz a rétegek körültekintő kialakítása, a súlyozás megoldása. Milyen a rétegek belső homogenitása ( Rate of homogeneity - Roh), a blokkon belüli és a blokkok közötti szórás elemzése. • A felvételeket a maguk teljességében kell kezelni! • Szerette az aforizmákat: Ha sokáig gyötrik az adatokat azok vallani fognak. („If you torture the data long enough, they will confess”) Ismerj meg valami újat mindennap. („Learn something new every day”)
Könyvei: • Sampling program for foreign statisticians (1961) • Survey Sampling 1965, Statistical Design for Research (1987), magyarul: Kutatások statisztai tervezése, (1989). • Sampling Methods for Agricultural Surveys (FAO, 1989). • Konzultáns: World Fertility Survey, UN, UNESCO, WHO, Kina. • Rengeteg tanulmány (Irodalomjegyzék az összeállítás végén).
Tudományos elismerések (a teljesség igénye nélkül) • Volt az ASA (Amerikai Statisztikai Társaság) elnöke • Különböző funkciókat töltött be az ISI-ben (International Statistical Institute) • Alapítója, majd elnöke volt az ISI szekciójának, az IASS-nek (International Association of Survey Statisticiens) • Díjai: ASA Wilks Award (1977), az Amerikai Szociologiai Társaság díja (1989), PAA Mindel Shep Award (1998) • Henry Russel Lecturer (1981), Honorary Fellow of the Royal Statistical Society • 1988 Bologna: az egyetem 900 éves fennállásának jubileumi ünnepségei során disz doktorrá avatták • MTA tiszteleti tagja, az Athéni Egyetem és az ELTE disz doktora (1995) • Ápolta a kapcsolatokat volt a magyar statisztikusokkal, szociológusokkal, kereste múltjának nyomait (Bogács)
Néhány szó a magyarul is megjelent könyvéről:Kutatások statisztikai tervezése (1989) (Statistical Design for Research 1987) • Ebben az utolsó munkájában túllép a lakossági felvételek tervezésének körén. Kísérletek tervezésével is foglalkozik, ami persze nem teljesen más szakma. Óriási gyakorlati tapasztalatain alapuló, mélyen elgondolkodtató munka. A könyv elején négyféle változót vezet be: • magyarázó, előre jelzett, becsülni kívánt változók • kontrollált változók • kezelések, stb. melyek hatását vizsgáljuk • zavaró változók. • Foglalkozik a különbségek, az időbeni változások becslésének tervezésével, becslési technikákkal • Ismét előkerül a mintavételi hiba becslése különös tekintettel a bonyolult súlyrendszerekre. • Elemzi a véletlen változók, a torzítások hatását. Halála után válogatott tanulmányait tartalmazó kötet jelent meg: Selected Papers, Ed. G.Kalton, S.Heeringa, Wiley, 2003.
Leslie Kish válogatott bibliográfiája • Kish, L. (1949), "A Procedure for Objective Respondent Selection Within the Household," • Journal of the American Statistical Association, Vol. 44, 380--387. • Kish, L. (1957), "Confidence Intervals for Clustered Samples," American Sociological • Review, 22, 154-165. • Kish, L. (1959), "Some Statistical Problems in Research Design," American Sociological • Review, 24, 328-338. • Kish, L. (1961 a), "Efficient Allocation of a Multipurpose Sample," Econometrica, 29, 363-385. • Kish, L. (l96Ib), UA Measurement of Homogeneity in Areal Units," Bulletin of the • International StatisticalInstitute, 38, 4, 201-209. • Kish, L. (1962), "Studies ofInterviewer Variance for Attitudinal Variables," Journal of the • American Statistical Association, 57, 92-115. • Kish, L. (1963), "Changing Strata and Selection Probabilities," Proceedings of the Social • Statistics Section, American Statistical Association, 139-143. • Kish, L. (1965a), Survey Sampling, New York: John Wiley and Sons. • Kish, L. (1965b), "Sampling Organizations and Groups of Unequal Sizes," American • Sociological Review, 30, 564-572.
Leslie Kish válogatott bibliográfiája (folytatás) • Kish, L. (1968), "Standard Errors for Indexes From Complex Samples," Journal of the • American Statistical Association, 63, 512-529. • Kish, L. (1969), "Design and Estimation for Subclasses, Comparisons, and Analytical • Statistics," in N. L. Johnson and H. Smith (eds.), New Developments in Survey • Sampling, New York: John Wiley and Sons. • Kish, L. (1971), "Multipurpose Programs for SampIing Errors," Bulletin of the • International Statisticallnstitute, Contributed Papers, 44, 216-221. • Kish, L. (1975), "Representation, Randomization and Control," chapter 9 in H. M. Blalock, • A. Aganbegian, F. M. Borodkin, R. Boudon, and V. Capecchi (eds.) Quantitative • Sociology, New York: Academic Press. • Kish, L. (1976), "Optirna and Proxima in Linear Sample Designs," Journal of the Royal • Statistical Society, Ser. A, 139, 80-95. • Kish, L. (1977), "Robustness in Survey SampIing," Bulletin of the International Statistical • Institute, 47, 515-528. • Kish, L. (1978), "Chance, Statistics, and Statisticians," Journal of the American Statistical • Association, 73, 1-6. Reproduced as Chapter 16 in this volume. • Kish, L. (l979a), "Samples and Censuses," International Statistical Review, 47, 99-109. • Kish, L. (1979b), "Rotating Samples Instead of Censuses," Asian and Pacific Census • Forum (East-West Center, Honolulu), 6, 1-13.
Leslie Kish válogatott bibliográfiája (folytatás) • Kish, L. (1980), "Design and Estimation for Domains," Statistician, 29, 209-222. • Kish, L. (1981), Using Cumulated Rolling Samples, Washington: Library of Congress. • Kish, L. (1984), "Analytical Statistics From Complex Samples," Survey Methodology, 10, • 1-7. • Kish, L. (1985), "Sample Surveys Versus Experiments, Controlled Observations, Censuses, • Registers, and Local Studies," Australian Journal of Statistics, 27,111-122. • Kish, L. (l987a), Statistical Designfor Research, New York: John Wiley and Sons. • Kish, L. (l987b), "Discussion" in R. Platek, J. N. K. Rao, C.-E. Samdal. and M. P. Sing(eds.) Small Area Statistics, New York: John Wiley and Sons. • Kish, L. (l988a), "Multipurpose Sample Designs," Survey Methodology, 14, 19-32. • .Kish, L. (1988b), "A Taxonomy of Elusive Populations," Proceedings of the Section on • Survey Research Methods, American Statistical Association, 44-46. • Kish, L. (1989), Sampling Methodsfor Agricultural Surveys, Rome: FAO. • Kish, L. (l990a), "Rolling Samples and Censuses," Survey Methodology, 16,63-71. • Kish, L. (1990b), "Weighting: Why, When, and How,' Proceedings of the Section on Survey • Research Methods, American Statistical Association, 121-130.
Leslie Kish válogatott bibliográfiája (folytatás) • Kish, L. (1992), "Weighting for Unequal Pi," Journal of Official Statistics, 8, 183-200. • Kish, L. (1994), "Multipopulation Survey Designs,' International Statistical Review, 62, 167- • 186. • Kish, L. (1995a), Questions/Answers (1978-1994), Paris: International Association of Survey • Statisticians. • Kish, L. (1995b), "Methods for Design Effects," Journal of Official Statistics, ll, 55-77. • .Kish, L. (1995c), "The Hundred Years' Wars of Survey Sampling," Statistics in Transition, • 2, 813-830.. • Kish, L. (1996), "Developing Samplers for Developing Countries," International Statistical • Review, 64, 143-162. Kish, L. (1998), "Space/Time Variations and Rolling Samples," Journal • of Official Statistics, 14, 31-46. • Kish, L. (1999), "Cumulating/Combining Population Surveys," Survey Methodology, 25, • 129-138.. • Kish, L., and Anderson, D. W. (1978), "Multivariate and Multipurpose Stratification," • Journal of the American Statistical Association, 73, 24-34.. • Kish, L., and Frankel, M. (1970), "Balanced Repeated Replications for Standard Errors," • Journal of the American Statistical Association, 65, 1071-1094.
Leslie Kish válogatott bibliográfiája (folytatás) • Kish, L., and Frankel, M. R. (1974), "Inference From Complex Samples," Journal of the • Royal Statistical Society, Ser. B, 36, 1-37. Reproduced as Chapter 8 in this volume. • Kish, L., and Hess, I. (1958), "On Noneoverage of Sample Dwellings," Journal of the • American Statistical Association, 53, 509-524. • Kish, L., and Hess, 1. (1959a), "Some Sampling Techniques for Continuing Survey • Operations," Proceedings of the Social Statistics Section, American Statistical • Association, 139-143. • Kish, L., and Hess, 1. (1959b), "A 'Replacernent' Procedure for Reducing Bias of • Nonresponse," American Statistician, 13, 17-19.Kish, L., and Lansing, 1. B. (1954), , • Journal of the American Statistical Association, 49, 520-538. • Kish, L., and Scott, A. 1. (1971), "Retaining Units After Changing Strata and Probabilities," • Journal of the American Statistical Association, 66, 461-470e. • Kish, L., and Slater, C. W. (1960), "Two Studies of Interviewer Variance of Socio- • Psychological Variables," Proceedings of the Social Statistics Section, American • Statistical Association, 66-70.
Leslie Kish válogatott bibliográfiája (folytatás) • Kish, L., Frankel, M. R., and Van Eck, N. (1972), "SEPP: Sampling Errors Program • Package," Ann Arbor, MI: Institute for Social Research, University of Michigan. • Kish, L., Frankel, M. R., Verma, V., and Kaciroti, N. (1995), "Design Effects for Correlated • (Pi - PX' Survey Methodology, 21, 117-124. • Kish, L., Groves, R. M., and Krotki, K. (1976), "Sampling Errors for Fertility Surveys," • Occasional Paper No. 17, World Fertility Survey, Voorburg, Netherlands: International • Statistical Institute. • Kish, L., Lovejoy, W., and Rackow, P. (1961), "A Multi-Stage Probability Sample for • Traffic Surveys," Proceedings of the Social Statistics Section, American Statistical • Association, 227-230. • Kish, L., Narnboodiri, N. K., and Pillai, R. K. (1962), "The Ratio Bias in Surveys," Journal • of the American Statistical Association, 57, 863-876. • Periodic & Rolling Samples and Censuses, for Statistics and Public Policy (Oxford Univ '95) • Developing Samplers for Developing Countries--Hansen Lecture for Wash Stat Soc--Oct '94 • Conversations with Leslie Kish by Frankel and King for Statisticai Science -- '95 • Question/Answer Monograph for Int Assoc Survey Stats --'95