110 likes | 342 Views
Controleren voor 3 de variabelen. Dichotome variabelen: een voorbeeld. Berekenen van (lambda). Item voorspellen Sex onbekend: Voorspelling = “Nee” 13 correct, 6 fout Foutratio = 6/19 Sex bekend: Voorspelling indien vrouw: “Nee” Indien man: “Ja” 14 (=9+5) correct, 5 fout
E N D
Berekenen van (lambda) • Item voorspellen • Sex onbekend: • Voorspelling = “Nee” • 13 correct, 6 fout • Foutratio = 6/19 • Sex bekend: • Voorspelling • indien vrouw: “Nee” • Indien man: “Ja” • 14 (=9+5) correct, 5 fout • Foutratio = 5/19 • Proportionele daling van foutenratio = De proportionele reductie van het aantal fouten bij het voorpellen van “Item” indien “Sex” gekend is vergeleken bij de voorspelling indien “Sex” niet gekend is bedraagt 17%
Controleren voor leeftijd • Item voorspellen • Sex bekend en JONG • Fouten=2 • Sex bekend en OUD • Fouten=1 • Foutratio = 3/19 • Proportionele daling van foutenratio: De proportionele reductie van het aantal fouten bij het voorpellen van “Item” indien “Leeftijd” gekend is bovenop “Sex” vergeleken bij de voorspelling indien alleen “Sex” gekend is bedraagt 40%
Huwelijken / Echtscheidingen / Geboorten (per 1000 inw.) in de VS Las Vegas!
Huwelijken / Echtscheidingen / Geboorten (per 1000 inw.) in de VS: gedichotomiseerde data
Lambda () (Goodman & Kruskal, 1954) In welke mate verbetert de predictie van de rijen als we de kolommen kennen in een 22 kruistabel (en omgekeerd)? Huwelijksratio voorspeld MET kennis over Echtscheidingsratio : Hoog als Echtsch% hoogLaag als Echtsch% laag Huwelijksratio voorspeld ZONDER kennis over Echtscheidingsratio : Hoog (25>23)
Lambda is niet (altijd) symmetrisch predicting huwelijks % = = .522 predicting echtsch.% = = .542 • predicting huwelijks % = .304 • predicting geb.% = .304 predicting geb % = predicting echtsch.% =
Controleren voor 3de variabele: partiële lambda predicting Echtsch.% = .542 Fout% bij het voorspellen van Echtscheidings% op basis van Huwelijks% = 11/48 Met welke proportie daalt dit Fout% als bovendien rekening wordt gehouden met Geb.%? predicting Echtsch.% controlling for Huwelijks% De voorspelling van de Echtscheidingsratio op basis van Geboorteratio en Huwelijksratio is NIET beter dan de voorspelling op basis van Huwelijksratio alleen
Lambda en partiële lambda (echtscheidingen voorspellen) predicting Echtsch.% controlling for Geb.% De voorspelling van de Echtscheidingsratio op basis van Geboorteratio en Huwelijksratio is 26.7% beter dan de voorspelling op basis van Geboorteratio alleen
Veralgemening: verband tussen continue variabelen : In welke mate verbetert de predictie van de rijen als we de kolommen kennen in een 22 kruistabel (en omgekeerd)? Veralgemening r² : In welke mate verbetert de predictie van y als men zich baseert op de regressielijn y=ax+b tegenover een predicite die daar geen gebruik van maakt? Kwadratensom van fouten bij predictie ZONDER kennis van X Kwadratensom van fouten bij predictie MET kennis van X Verbetering: