150 likes | 336 Views
vwo D Samenvatting Hoofdstuk 10. Spreidingsdiagrammen. Gegevens van een tabel uitzetten in een spreidingsdiagram . Alle punten samen vormen een puntenwolk . Is er een samenhang tussen de variabelen spreekt men van correlatie . De best-passende lijn heet regressielijn. 10.1.
E N D
Spreidingsdiagrammen Gegevens van een tabel uitzetten in een spreidingsdiagram. Alle punten samen vormen een puntenwolk. Is er een samenhang tussen de variabelen spreekt men van correlatie. De best-passende lijn heet regressielijn. 10.1
Zwakke en sterke correlatie In een spreidingsdiagram is de puntenwolk gegroepeerd om het punt Dit punt heet het zwaartepunt van de puntenwolk. In het geval X normaal verdeeld is bevindt ongeveer 95% van de punten zich in de verticale strook. 10.1
Regressiemodellen en de GR • Met de GR kun je na het invoeren van een tabel • een spreidingsdiagram plotten • een vergelijking van de regressielijn opstellen • de regressielijn in het spreidingsdiagram plotten • Y voorspellen bij een gegeven X • een lijst van residuen maken. • Het residu bij een waarde van X is het verschil • tussen de waargenomen Y en de door de formule • van de regressielijn voorspelde Ŷ, • dus residu = Y – Ŷ. 10.1
Afhankelijke en onafhankelijke variabelen • Ter voorkoming van misverstanden gebruiken we zo nodig de index X • bij de regressiecoëfficiënten ax en bx om aan te geven dat het om regressie • van X op Y gaat. • Regressie van Y op XŶ = aYX + bY • Regressie van X op Y = aXY + bX 10.1
De methode van de kleinste kwadranten • Bij regressie van Y op X is de lijn Ŷ = aX + b • met a = • en b = Ŷ – a de best-passende lijn. • De getallen a en b heten de regressiecoëfficiënten. 10.2
De covariantie • Bij een positieve correlatie liggen de meeste punten in I en III. • Je mag dan verwachten dat positief is. • cov(X, Y) = 10.2
De productmoment-correlatiecoëfficiënt • De pmcc is de covariantie gedeeld door beide standaardafwijkingen. • Die onafhankelijk is van de gebruikte eenheden. • pmcc r = • pmcc r = 10.2
De richtingscoëfficiënt van de regressielijn • In de regressievergelijking Ŷ = aX + b is 10.3
Het regressie-effect • Bij regressie van Y op X is Ŷ = aYX + bY met • Uit symmetrie volgt: • Bij regressie van X op Y is Ŷ = aXY + bX met • aX · aY = r2 10.3
Betrouwbaarheidsintervallen • De standaardafwijking van de residuen d heet de standaardschattingsfout σd. • Bij regressie van Y op X is σd te berekenen met de formule • en heet het interval 〈Ŷ – σd , Ŷ + σd〉 het 68%- betrouwbaarheidsinterval. • Het interval 〈Ŷ - 2σd , Ŷ + 2σd〉 heet het 95%-betrouwbaarheidsinterval. • Bij het werken met deze betrouwbaarheidsintervallen ga je ervan uit dat bij • elke gegeven X-waarde de Y-waarden normaal verdeeld zijn met gemiddelde Ŷ • en dezelfde standaardafwijking σd. • Deze aanname heet homoscedasticiteit. 10.3
Soorten variabelen en schaaltypen • De meetbare kenmerken (variabelen) zijn op de volgende drie manieren • in te delen in soorten. • Kwantitatieve en kwalitatieve variabelen • - kwantitatief: getal • - kwalitatief: aanwezigheid kenmerk • Discrete en continue variabelen • - discreet: losse waarden • - continu: elke tussenliggende waarde is mogelijk • Schaaltype waarop wordt gemeten • - nominale schaal: namen • - ordinale schaal: volgorde • - intervalschaal: gelijke verschillen • - ratioschaal: ook natuurlijk nulpunt 10.3