460 likes | 606 Views
Statistik for geografer. Lektion 8. Stokastiske variable. En stokastisk variabel er en afbildning af udfaldsrummet ind i de reelle tal. Man benytter ofte store bogstaver som X, Y og Z til at betegne en stokastisk variabel. Ved at udføre eksperimenter ( fx. foretage en meningsmåling, måle
E N D
Statistik for geografer Lektion 8
Stokastiske variable En stokastisk variabel er en afbildning af udfaldsrummet ind i de reelle tal. Man benytter ofte store bogstaver som X, Y og Z til at betegne en stokastisk variabel. Ved at udføre eksperimenter ( fx. foretage en meningsmåling, måle nitratindhold i drikkevand osv.) kan man få værdier af en stokastisk variabel. Disse værdier betegnes med de tilsvarende små bogstaver, fx. x1, x2, x3, …… xn , hvis der er udført n eksperimenter. X R S
De vigtigste diskrete fordelinger • Den uniforme fordeling (lige-fordelingen) • Binomial-fordelingen • Poisson-fordelingen
Binomialfordelingen Et basiseksperiment beskrives af et udfaldsrum E med to udfald succes (s) og fiasko (f), dvs. E={s,f}, hvor P(s)=p og P(f)=1-p. Basiseksperimemtet gentages n gange uafhængigt af hinanden. Hvis X betegner antal succes i de n gentagelser gælder der Sætning: E(X)=np ; V(X)=np(1-p) Eks. 5 uafhængige kast med en terning. X er antal 6’ere.
Mere formelt :Kontinuerte fordelinger Definition: Tæthedsfunktion En sandsynlighedstæthedsfunktion på R er en integrabel funktion f : R→[0;∞[ hvor =1 Definition: Kontinuert fordeling En kontinuert sandsynlighedsfordeling er en sandsynlighedsfordeling, som har en sandsynlighedstæthedsfunktion f : funktionen kaldesfordelingsfunktionen for en kontinuert fordeling på R Definition:middelværdi ,varians og spredning Lad X være en stokastisk variabel med tæthedfunktionf(x) Middelværdi : μ=E(X)= Varians : σ2=E((X-μ)2)= Spredningen er σ
Normalfordelingen er det klassiske eksempel på en kontinuert fordeling. Her er tæthedsfunktionen givet ved Middelværdien er μ og spredningen σ. Den stokastiske variabel med denne tæthedsfunktion siges at være N(μ, σ2) –fordelt. Den normalfordelte stokastiske variabel, som har middelværdi 0 og varians 1, kaldes sædvanligvis U, og den tilhørende tæt- hedsfunktion for φ , dvs. at Den tilsvarende fordelingsfunktion kaldes forФ, dvs. at
Der gælder følgende : Man kan derfor klare sig med kendskab til værdier af Ф, som er tabellagt og indlagt i de fleste computersystemer. Undersøgelse af om et observationssæt kan betragtes som Normalfordelt: Apgar- fødselsvægt (SPSS) eller BMI – Geogear (SPSS)
Hvorfor er normalfordelingen interessent? Ja, det er den, fordi gennemsnittet af næsten alle målinger tilnærmelsesvis er normalfordelt. Mere præcist, så gælder den centrale grænseværdisætning :
Annual Maximums of Daily Rainfall in Sydney Not nice and normal QQ-plot is not terrible though
Log-transform Much nicer!!
Detrended QQ-plots Here we see the difference between raw and log-transformed data Deviations seem to be scattered unstructured Deviations are structured
Skewness og QQ-plot Venstre-skæv
Skewness og QQ-plot Højre-skæv
Box-plot Outliers 75% percentil Median