380 likes | 818 Views
Specialeforsvar af Aage T. Andersen Bedømmer: Hans Bay, Vejleder: Anders Milhøj Censor : Lars Borchsenius. Latente variable, faktor analyse og LISREL modeller anvendt på kommuners tilkendelser af førtidspensioner. Problemstilling.
E N D
Specialeforsvaraf Aage T. AndersenBedømmer: Hans Bay, Vejleder: Anders MilhøjCensor : Lars Borchsenius Latente variable, faktor analyse og LISREL modeller anvendt på kommuners tilkendelser af førtidspensioner. udf. Aage T. Andersen
Problemstilling • Analyse af determinanter for kommunernes tildeling af førtidspensioner ved brug af latente variabel modeller • Eksplorativ faktoranalyse • Konfirmativ faktoranalyse • LISREL modeller • Gør disse modeller det nemmere at fastslå hvilke socioøkonomiske forhold i kommunerne der har betydning for tilkendelserne af førtidspension ???? udf. Aage T. Andersen
Præsentation Modellerne vil blive illustreret ved deres sti-diagrammer og de tilhørende resultater. • Eksplorativ faktoranalyse. Sidespring over i regressions analyse på faktorscores. • Konfirmativ faktoranalyse. • LISREL modellen. udf. Aage T. Andersen
λ11 ξ1 δ1 x1 λ21 λ31 λp1 δ2 x2 λ12 λ22 ξ2 λ32 λp2 δ3 x3 λ1r λ2r λ3r ξr δp xp λpr Den eksplorativ model illustreret medsti-diagram. Den generelle model. Fra side 17. udf. Aage T. Andersen
Resultater fra den eksplorative faktor analyse. Følgende modeller blev dannet: 6 En-faktor modeller på X-siden med socioøkonomiske variable. Alders-, bolig-, familie-, erhvervs-, ledigheds- og uddannelsesfaktorer. (En form for variabelreduktion fra ca. 56 til 25 variabel ved En-faktormodellerne) 1 samlet Tre-faktor model – og ikke 6 dimensional rum. Arbejdsstyrke-, Demografi- og Ledighedsfaktorer. (Fra 25 til 22 ved tre-faktormodellen.) En-faktor modeller på Y-siden. ”Samlede tilkendelser”, Baggrund før tilkendelse, De § - der tilkendes efter. • Sidespringet over til Regressions analyse på faktorscore. udf. Aage T. Andersen
ξx1 β1 β2 ξx2 β3 ξx3 ξyi εi β4 ξx4 β5 ξx5 β6 ξx6 Regressionsanalyser på faktor scores. Først score fra de 6 En-faktormodeller på X-siden mod de tre afhængige ”Y-sider”. Der gælder at: i=1 svarer til ”samlede tilkendelses” -modellen”. i=2 svarer til ”baggrunden før” –modellen. i=3 svarer til § -modellen af førtidspensionstilkendelser. ξy hhv. ξx for illustration af, at der er score fra latente variabel, der benyttes. Intercept/konstant led er udeladt af illustration. udf. Aage T. Andersen
Resultat med § -variablene som afhængige og de 6 En-faktormodellers faktorscore som uafhængige variable. Dependent Variable: Ypar R-Square 0.4390 Parameter Standard Variable DF Estimate Error t Value Pr > |t| XALDER 1 -0.19791 0.05149 -3.84 0.0002 XBOLIG 1 -0.09715 0.07277 -1.34 0.1830 Xfam 1 0.34024 0.05267 6.46 <.0001 Xerhv 1 0.06703 0.08423 0.80 0.4268 Xledig 1 0.21704 0.04453 4.87 <.0001 Xuddan 1 0.30850 0.07161 4.31 <.0001 Dependent Variable: Ypar R-Square 0.4322 Parameter Standard Variable DF Estimate Error t Value Pr > |t| XALDER 1 -0.24630 0.04189 -5.88 <.0001 Xfam 1 0.29375 0.04605 6.38 <.0001 Xledig 1 0.20896 0.04294 4.87 <.0001 Xuddan 1 0.38360 0.04228 9.07 <.0001 udf. Aage T. Andersen
β1 ξx1 β2 ξyi εi ξx2 β3 ξx3 Regressionsanalyser på faktorscores Dernæst score fra Tre-faktormodellen på X-siden og samme Y-side Der gælder stadig at: i=1 svarer til ”samlede tilkendelses” -modellen”. i=2 svarer til ”baggrunden før” –modellen. i=3 svarer til § -modellen af førtidspensionstilkendelser. ξy hhv. ξx for illustration af, at der er score fra latente variabel, der benyttes. Intercept/konstant led er udeladt af illustration. udf. Aage T. Andersen
Resultater faktorscores 3-faktormodel Dependent Variable: Yfuld R-Square 0.3768 Parameter Standard Variable DF Estimate Error t Value Pr > |t| M31Arbejdsstyrke 1 -0.39591 0.05011 -7.90 <.0001 M31Demografi 1 -0.26692 0.05105 -5.23 <.0001 M31Ledighed 1 0.39545 0.04836 8.18 <.0001 Dependent Variable: Yfor R-Square 0.3975 Parameter Standard Variable DF Estimate Error t Value Pr > |t| M31Arbejdsstyrke 1 -0.34690 0.04381 -7.92 <.0001 M31Demografi 1 -0.27234 0.04463 -6.10 <.0001 M31Ledighed 1 0.34776 0.04228 8.23 <.0001 Dependent Variable: Ypar R-Square 0.4437 Parameter Standard Variable DF Estimate Error t Value Pr > |t| M31Arbejdsstyrke 1 -0.32431 0.04235 -7.66 <.0001 M31Demografi 1 -0.27010 0.04315 -6.26 <.0001 M31Ledighed 1 0.44890 0.04088 10.98 <.0001 udf. Aage T. Andersen
Over til de konfirmative modeller. • Bygger på ”a priori” viden • Leder frem til LISREL modeller udf. Aage T. Andersen
x1 δ1 x2 δ2 ξ1 λ2 x... δ... λ... Φ13 y8 δ8 λ8 λ9 y9 ξ3 δ9 Φ14 Φ12 x4 δ4 λ... λ4 y... δ... Φ23 x5 δ5 λ5 ξ2 Φ34 Θδ Θδ Φ24 x... δ... λ... Φ1r y10 δ10 λ10 Φ3r x6 ξ4 Φ2r λ11 δ6 y11 δ11 λ6 Φ4r λ... x7 δ7 λ7 y... δ... ξr xp δp λp Θδ Konfirmative modeller Sti-diagramOpstilling af en ”generel” konfirmativ model. udf. Aage T. Andersen
δ19 δ2 δ10 δ11 δ18 δ22 δ1 δ17 δ12 x22 x1 x2 x10 x17 x18 x11 x12 x19 λ19 λ2 λ12 λ10 λ11 λ1 λ17 λ18 λ22 Demografi Ledighed Arbejdsstyrke Φ12 Φ23 Φ13 Konfirmative modeller Sti-diagram.De socioøkonomiske variable. X- Model med tre latente variable og med op til 22 indikatorvariabel. Hvor der ikke tillades nogen korrelation mellem restled. Fra side 74. udf. Aage T. Andersen
Resultater X-siden konfirmativFit indeksene X-side Model Comparison Statistics from 4 RAM data sets Bentler & Bonett's Bollen Bollen Chi- Chi- Bentler's (1980) (1986) (1988) n Square Chi- P> Square/ Comparative Non-normed Normed Index Non-normed Model Parm DF Square ChiSq DF Fit Index Index Rho1 Index Delta2 Mx1_3x22v 47 206 1975.32 0.000 9.59 0.64739 0.60459 0.57799 0.64914 Mx2_3x2ud20v 43 167 1491.16 0.000 8.93 0.68820 0.64526 0.61762 0.68988 Mx3_3X4ud18v 39 132 969.26 0.000 7.34 0.74357 0.70278 0.67132 0.74521 Mx4_3X6ud16v 35 101 847.91 0.000 8.40 0.76098 0.71602 0.68954 0.76243 Fit indeksene ikke så pæne som ønsket. Men parametrene er signifikante og estimaterne er stabile. udf. Aage T. Andersen
Θδ δ2 δ10 δ1 y1 y2 y10 λ10 λ2 λ1 Den latentevariabel for Førtidspensionstilkendelser Konfirmative modeller Sti-diagramDen latente førtidspention. Y- Model med en latente variabel og op til 10 indikatorvariable. Hvor enkelte benyttes med korrelation mellem restled. Fra side 82. udf. Aage T. Andersen
Resultater fra Y-side konfirmativFit indeksene Bentler & Bonett's Bollen Bollen Chi- Chi- Bentler's (1980) (1986) (1988) n Square Chi- P> Square/ Comparative Non-normed Normed Index Non-normed Model Parm DF Square ChiSq DF Fit Index Index Rho1 Index Delta2 My1_Y10var 20 35 785.469 0.000 22.44 0.49214 0.34704 0.33678 0.49556 My2_Y7var 14 14 544.882 0.000 38.92 0.55100 0.32650 0.32080 0.55364 My3_Y7var6Cov 20 8 16.564 0.035 2.07 0.99276 0.98099 0.96387 0.99284 My4_Y7vNY 14 14 101.471 0.000 7.25 0.85551 0.78327 0.75701 0.85716 My5_Y5før 10 5 25.552 0.000 5.11 0.86948 0.73896 0.69483 0.87350 My6_Y4før 8 2 2.237 0.327 1.12 0.99823 0.99469 0.95206 0.99828 My7_Y5§ 10 5 78.885 0.000 15.78 0.69458 0.38915 0.37371 0.70076 My8_Y5§1Cov 11 4 3.412 0.491 0.85 1.00000 1.00607 0.96614 1.00237 My9_Y4§ 8 2 0.093 0.955 0.05 1.00000 1.03613 0.99831 1.01175 Tillades der at parametrisere nogle af restledene forbedrer det disse modellers fit-indeks betydelig. Om det så er godt, kan sikkert diskuteres, men jeg vælger ikke at gøre det efterfølgende. udf. Aage T. Andersen
x1 δ1 λx1 x2 δ2 Arbejdsstyrke λx2 x10 δ10 λx10 Φy11 Φ13 Φ12 x11 δ11 λx11 y1 δ y1 λy1 Tilkendelser af Førtidspensioner Demografi λy2 Φy12 λx12 x12 y2 δ y2 δ12 λy10 x17 δ17 λx17 y10 δ y10 Φ23 Φy13 x18 δ18 λx18 x19 δ19 Ledighed λx19 x22 δ22 λx22 Konfirmative modeller Sti-diagramHer den anvendte med 4 latente variable. Fra side 86. udf. Aage T. Andersen
Resultater, de estimerede korrelationer. Førtidspension Førtidspension Førtidspension Arbejdsstyrke Arbejdsstyrke Demografi Arbejdsstyrke Demografi Ledighed Demografi Ledighed Ledighed Model CF1yF1 CF1yF2 CF1yF3 CF1F2 CF1F3 CF2F3 C1_1y10_3x22v -0.513 -0.392 0.247 0.373 0.243 0.272 C1_1y10_3x20v -0.527 -0.392 0.243 0.348 0.207 0.269 C1_1y10_3x18v -0.538 -0.390 0.249 0.341 0.210 0.324 C2_1y10_3x16v -0.544 -0.395 0.247 0.336 0.205 0.314 C3_1y7_3x22v -0.493 -0.363 0.244 0.372 0.243 0.271 C4_1y7_3x18v -0.518 -0.360 0.253 0.340 0.209 0.323 C5_1y7_3x16v -0.523 -0.365 0.251 0.335 0.204 0.314 C6_1y7ny_3x22v -0.503 -0.391 0.322 0.371 0.237 0.269 C7_1y7ny_3x18v -0.532 -0.387 0.312 0.342 0.213 0.327 C8_1y7ny_3x16v -0.536 -0.392 0.311 0.336 0.207 0.318 C9_1y5f_3x18v -0.618 -0.462 0.208 0.346 0.212 0.325 C10_1y5f_3x16v -0.623 -0.465 0.209 0.340 0.206 0.315 C11_1y5p_3x18v -0.590 -0.447 0.379 0.344 0.214 0.328 C12_1y5p_3x16v -0.596 -0.454 0.379 0.338 0.207 0.318 C13_1y4f_3x18v -0.599 -0.456 0.248 0.346 0.212 0.324 C14_1y4f_3x16v -0.604 -0.460 0.248 0.341 0.207 0.315 C15_1y4p_3x18v -0.577 -0.441 0.379 0.344 0.213 0.327 C16_1y4p_3x16v -0.582 -0.446 0.381 0.338 0.206 0.317 udf. Aage T. Andersen
LISREL modelspecifikation Den første komponent er den latente variabel model: η: Vektor af latente endogene (forklarende) variable, m × 1. ξ: Vektor af latente eksogene (forklarende) variable, n × 1. Β: Koefficient matrice med effekten af de endogene latente variable indbyrdes, m × m. Det antages, at matricen (I-Β) er ikke singulær. Γ: Koefficient matricen med effekten afξ på η, n × m. De eksogene latente variables effekt på de endogene. ζ: Støjleddet (restleddet) hvor om der antages at, E(ζ)= 0 og ζukorreleret medξ. Ψ: Kovariansenmatricen forζ, m × m. Φ: Kovariansenmatricen forξ, n × n. Den anden komponent er målings (measurement) modellen: y: Vektorer med observerede variable, p × 1. x: Vektorer med observerede variable, q × 1. Λy: Koefficient matrice med relationen af på , en p × m matrice. Λx: Koefficient matrice med relationen af på , en q × n matrice. ε: Restledet ved måling af y, p × 1. δ: Restledet ved måling af x, q × 1. Θε: Kovariansenmatricen for ε, p × p. Θδ: Kovariansenmatricen for , q × q. se side 38. udf. Aage T. Andersen
x1 Λx δ1 λ1 x2 δ2 Γ... ξ1 λ2 Λy x... δ... γ11 λ... y1 ε1 λ8 Φ1n λ9 γm1 y2 η1 ε2 x4 δ4 λ... Φ12 λ4 y... γ12 ζ1 ε... x5 δ5 λ5 ξ2 Β1m Ψ1m Θδ Θε x... δ... γm2 λ... ζm y4 ε4 λ10 x6 Φ2n λ11 δ6 ηm y5 ε5 γ1n λ6 γmn λp x7 δ7 λ7 yp εp ξn xq δq λq LISREL modellen i Sti-diagram Er : Β, Γ, Λy, Λx, Φ, Ψ, Θδ og Θε. Elementer der skal estimeres eller specificeres udf. Aage T. Andersen
x1 λx1 δ1 Arbejdsstyrke λx2 x2 δ2 λx10 x10 δ10 γ11 Φ12 λy1 x11 Φ13 y1 δ11 ε1 λx11 Tilkendelser af Førtidspensioner λy2 Demografi γ12 y2 ε2 λx12 x12 δ12 λ10 x17 y10 δ17 λx17 ε10 ζ γ1n Φ23 λx18 x18 δ18 Ledighed λx19 x19 δ19 λx22 x22 δ22 LISREL modellen i Sti-diagramDe anvendte modeller skitseret En simplere model. Men det var ikke mulig at estimere en to faktor model på Y-siden. Tre Korrelationer i Φ og tre ”regressions” koefficienter i Γ. Et restled på eta og ingen korrelationer på restledene i theta tillades. se side 92. udf. Aage T. Andersen
De standardiserede estimater for effekter og korrelationer udf. Aage T. Andersen
Konklusion Der blev fundet det forventelige og med fornøjelse viste det sig, at latente variabel modeller fungerede... Kommunernes tildeling af førtidspensioner afhang således af kommunernes Arbejdsstyrke, Demografi og Ledighed. Arbejdsstyrkefaktoren indikerede, at et lavt niveau af boglig uddannelse, lav gennemsnitlig indkomst og mange sygedagpengeuger medførte et øget behov for tildelinger af førtidspensioner. Demografifaktoren viste, at kommuner med mange unge (og mange lejligheder) havde relativt færre tildelinger af førtidspensioner. Ledighedsfaktoren viste, at des højere ledighed en kommune havde, des flere førtidspensioner ville den typisk have tilkendt. Hvad kunne man arbejde videre med ?? udf. Aage T. Andersen
Ideer... • Analyser de nu kendte modeller på års data i stedet for summerede data. • Og der viser jeg til sidst. • Se på kommune sammenlægningens betydning. • Se på de mere aktiverings rettede tiltag på førtidspensionsområdet. • Overveje at holde sig til rene § -variable. • LISREL, nemt at lave noget sludder... - egentlig skal SAS koden ses for at vide om det nu også er det rigtige der regnes på. udf. Aage T. Andersen
LISREL modeller på årlig basis Oplagt svaghed at der er summeret over år 1992 til 1998. Analyseres de nu kendte modeller pr. år fås følgende: Problemer med bl.a. 0 værdi i variable, men ellers ok. På www.ibt.ku.dk/aage/sp/index.htm findes alle resultater mv. - FINI - udf. Aage T. Andersen
Resterende slids er EKSTRA hvis behovet opstår... udf. Aage T. Andersen
R-square svarende til kommunaliteterne udf. Aage T. Andersen
Resultater fra eksplorativ en-faktormodeller udf. Aage T. Andersen
Resultater fra eksplorativ 3-faktor model udf. Aage T. Andersen
To-faktormodeller ud fra de 6 Enfaktormodeller To Faktormodeller. Et skridt på vejen er at kombinerer de 6 en faktor modeller til to faktor modeller. Det er væsentligt at sikre at det 6 faktorer ikke indeholder den samme information inden den endelige LISREL kan opbygges. Resultatet at to faktor modellerne vil kun blive vist opsummeret i følgende tabel. Som der ses er det problemer med 3 og 4. Noget kunne tyde på de loader på de samme og ikke repræsentere det de var tiltænkt. En indikator af multikolinaritet muligvis. udf. Aage T. Andersen
Erhvervs fordelingen: Kun 3 variable udf. Aage T. Andersen
Scree plot 3 og 4 faktor modeller udf. Aage T. Andersen
Indikatorvariable i konfirmative X modeller udf. Aage T. Andersen
Førtidspension De standardiserede loadings. udf. Aage T. Andersen
Arbejdsstyrke De standardiserede loadings. udf. Aage T. Andersen
Demografi De standardiserede loadings. udf. Aage T. Andersen
LedighedDe standardiserede loadings. udf. Aage T. Andersen
Fordelingen af Ejerlejligheder i Danmark Ejerlejligheder pr. kommune før der normeres og transformeres. Ses i bilag2. Normering efter kommune størrelse. Transformation da normalfordelte-variable ønskes, krav til MLE udf. Aage T. Andersen
SAS-kodeeksempel odsoutput StdManifestEq=L14_1 StdLatentEq=L14_2 CorrExog=L14_3 SqMultCorr=L14_4; Title"L14 1y5§_3x16v"; *L14 1y5§_3x16v; ProcCalisdata=wrk2.Pr1000tal cov METHOD=ML outram=ram14l MAXIT=5000 MAXFU=5000RESMOD; Lineqs P1431= Ly06 F1y + ey06, P1432= F1y + ey07, ML = Ly08 F1y + ey08, P1433= Ly09 F1y + ey09, HQJ = Ly10 F1y + ey10, kortvid = Lx01 F1 + ex01, mlvid = Lx02 F1 + ex02, indkmk = Lx03 F1 + ex03, sdpmk = Lx08 F1 + ex08, Erhvbas = Lx09 F1 + ex09, ejretudd = -1 F1 + ex10, ald1824 = Lx11 F2 + ex11, ald2534 = F2 + ex12, almennyt = Lx13 F2 + ex13, ejerlej = Lx14 F2 + ex14, andel = Lx15 F2 + ex15, ald6066 = Lx17 F2 + ex17, Ef2566 = F3 +ex18, Ef1619 = Lx20 F3 +ex20, par37 = Lx21 F3 +ex21, f2024 = Lx22 F3 +ex22, F1y = py1f1 F1 + py1f2 F2 + py1f3 F3 + d ; Std ey06-ey10 = vey06-vey10, F1-F3=3*vfx:, d=vd, ex01-ex03 = vex01-vex03, ex08-ex10=vex08-vex10, ex11-ex15 = vex11-vex15, ex17-ex18=vex17-vex18, ex20-ex22 = vex20-vex22; Cov F1 F2 = CF1F2, F1 F3 = CF1F3, F2 F3 = CF2F3; var SDP EJYD P37 ADP reva P1431 P1432 ML P1433 HQJ KORTVID MLVID INDKMK TERT ALD5059 NETFLYT PRIM SDPMK ERHVBAS EJRETUDD ALD1824 ALD2534 ALMENNYT EJERLEJ ANDEL AKTIE ALD6066 EF2566 EF2024 EF1619 PAR37 F2024 ; run; udf. Aage T. Andersen