190 likes | 557 Views
Ugrupperede observationer Middelværdi, varians og spredning. Varians. Nu er der jo ikke lige mange observationer i hvert interval, derfor må vi vægte disse forskelle: 12%*(8-10,59) 2 +15%*(9-10,59) 2 +21%*(10-10.59) 2 +20%*(11-10,59) 2 +18%*(12-10,59) 2 +14%*(13-10,59) 2 =2,46
E N D
Ugrupperede observationer Middelværdi, varians og spredning
Varians Nu er der jo ikke lige mange observationer i hvert interval, derfor må vi vægte disse forskelle: 12%*(8-10,59)2+15%*(9-10,59)2+21%*(10-10.59)2+20%*(11-10,59)2+18%*(12-10,59)2+14%*(13-10,59)2=2,46 Dette tal kaldes observationssættets varians: Var(X)=2,46 Hvad fortæller Var(X) ? Hvorfor tager vi kvadratet på forskellen mellem middelværdi og observation?
Spredning Vi tager nu kvadratroden af variansen: Og får spredningen, betegnet med det græske bogstav sigma Spredningen kaldes også standardafvigelsen
Forskellige observationssæt Her har jeg lavet et mere spredt sæt, lad os se på forskelle i middelværdi, varians og spredning
Først stolpediagrammer Middelværdi: 10,59 Middelværdi:10,52 Beregn varians og spredning for andet observationssæt!
Varians og spredning Var(X)=1,5%*(5-10,52)2+…….. (resultat 3,6396) Sammenlignet med første observationssæt får vi altså en større varians og en større spredning som forventet!
Udregning af varians Summen af frekvenserne er 100%=1 Middelværdien E(X)=μ=9*25%+10*50%+11*25% Var(X)= 25% * (9-μ)2 + 50% *(10-μ)2 + 25% * (11-μ)2 Hvis vi ganger parenteserne ud fås: 25%*(92+μ2-2*9*μ) + 50%*(102+μ2-2*10*μ) + 25%*(112+μ2-2*11*μ) = μ2 *(25%+50%+25%) -2μ*(9*25% + 10*50% + 11*25%)+25%*92+50%*102+25%*112 Altså er Var(X)=μ2-2μ* μ +25%*92+50%*102+25%*112 Sidste 3 led (grønne) er middelværdien af X2 derved får vi: Var(X)= - μ2 + E(X2) = E(X2) – E(X)2 og spredningen σ(X)=
Varians og spredning Var(X)= E(X2)-E(X)2 σ(X)=
Grupperede observationer Hvis talmaterialet er grupperet:
Covarians Hvis vi ønsker at sammenligne to observationssæt X og Y, kan vi bestemme deres Covarians ved: Cov(X,Y)= E(X*Y)- E(X)*E(Y) Altså som middelværdien af produktet af observationerne minus produktet af de to middelværdier
Regression i regneark • Marker de to observationssæt • Vælg ”Diagram” • Vælg XY-punkt • Tegn grafen • Højreklik på et af punkterne på grafen • Vælg ”Tilføj tendenslinje” • Klik på fanebladet ”Indstillinger”
Bestemmelse af regressionslinje Vi kan ud fra to observationssæt også bestemme regressionslinjen y=ax+b ved hjælp af formler: Vi bestemmer a ved: Og derefter bestemme linjens ligning ved: Herved bestemmes b altså som E(Y)-a*E(X)
Korrelationskoefficienten Korrelationskoefficienten er et mål for hvor god sammenhæng der er mellem X og Y. Denne bestemmes ved: Regnearket beregner R2, som skal ligge tæt på 1, her skal r ligge tæt på -1 eller 1, for at vi vil finde en god sammenhæng.