1 / 46

Statistik for geografer

Statistik for geografer. Lektion 8. Stokastiske variable. En stokastisk variabel er en afbildning af udfaldsrummet ind i de reelle tal. Man benytter ofte store bogstaver som X, Y og Z til at betegne en stokastisk variabel. Ved at udføre eksperimenter ( fx. foretage en meningsmåling, måle

barny
Download Presentation

Statistik for geografer

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Statistik for geografer Lektion 8

  2. Stokastiske variable En stokastisk variabel er en afbildning af udfaldsrummet ind i de reelle tal. Man benytter ofte store bogstaver som X, Y og Z til at betegne en stokastisk variabel. Ved at udføre eksperimenter ( fx. foretage en meningsmåling, måle nitratindhold i drikkevand osv.) kan man få værdier af en stokastisk variabel. Disse værdier betegnes med de tilsvarende små bogstaver, fx. x1, x2, x3, …… xn , hvis der er udført n eksperimenter. X R S

  3. Hvorfor er det lige at vi skal lære det her?

  4. Stokastisk variabel

  5. …og det vi vil, er jo …

  6. Diskret variabel (antals variabel)

  7. Beskrivelse af variationen

  8. De vigtigste diskrete fordelinger • Den uniforme fordeling (lige-fordelingen) • Binomial-fordelingen • Poisson-fordelingen

  9. Den Uniforme Fordeling

  10. Binomial Fordelingen

  11. Binomialfordelingen Et basiseksperiment beskrives af et udfaldsrum E med to udfald succes (s) og fiasko (f), dvs. E={s,f}, hvor P(s)=p og P(f)=1-p. Basiseksperimemtet gentages n gange uafhængigt af hinanden. Hvis X betegner antal succes i de n gentagelser gælder der Sætning: E(X)=np ; V(X)=np(1-p) Eks. 5 uafhængige kast med en terning. X er antal 6’ere.

  12. Et eksempel

  13. Poisson Fordelingen

  14. Poisson Fordelingen

  15. Poisson Fordelingen

  16. Poisson Fordelingen

  17. SPSS

  18. Kontinuerte fordelinger

  19. Hvordan beskrives fordelingen?

  20. Tæthedsfunktion

  21. Middelværdi

  22. Beskrivelse af variationen

  23. Mere formelt :Kontinuerte fordelinger Definition: Tæthedsfunktion En sandsynlighedstæthedsfunktion på R er en integrabel funktion f : R→[0;∞[ hvor =1 Definition: Kontinuert fordeling En kontinuert sandsynlighedsfordeling er en sandsynlighedsfordeling, som har en sandsynlighedstæthedsfunktion f : funktionen kaldesfordelingsfunktionen for en kontinuert fordeling på R Definition:middelværdi ,varians og spredning Lad X være en stokastisk variabel med tæthedfunktionf(x) Middelværdi : μ=E(X)= Varians : σ2=E((X-μ)2)= Spredningen er σ

  24. Normalfordelingen er det klassiske eksempel på en kontinuert fordeling. Her er tæthedsfunktionen givet ved Middelværdien er μ og spredningen σ. Den stokastiske variabel med denne tæthedsfunktion siges at være N(μ, σ2) –fordelt. Den normalfordelte stokastiske variabel, som har middelværdi 0 og varians 1, kaldes sædvanligvis U, og den tilhørende tæt- hedsfunktion for φ , dvs. at Den tilsvarende fordelingsfunktion kaldes forФ, dvs. at

  25. Der gælder følgende : Man kan derfor klare sig med kendskab til værdier af Ф, som er tabellagt og indlagt i de fleste computersystemer. Undersøgelse af om et observationssæt kan betragtes som Normalfordelt: Apgar- fødselsvægt (SPSS) eller BMI – Geogear (SPSS)

  26. Den uniforme fordeling

  27. Normalfordelingen

  28. Normalfordelingen

  29. Standard normalfordelingen

  30. Hvorfor er normalfordelingen interessent? Ja, det er den, fordi gennemsnittet af næsten alle målinger tilnærmelsesvis er normalfordelt. Mere præcist, så gælder den centrale grænseværdisætning :

  31. QQ-plot – What and How?

  32. Output

  33. Annual Maximums of Daily Rainfall in Sydney Not nice and normal QQ-plot is not terrible though

  34. Log-transform Much nicer!!

  35. Detrended QQ-plots Here we see the difference between raw and log-transformed data Deviations seem to be scattered unstructured Deviations are structured

  36. Skewness og QQ-plot Venstre-skæv

  37. Skewness og QQ-plot Højre-skæv

  38. Box-plot Outliers 75% percentil Median

  39. Boxplot illustrerer forskelle

More Related