1 / 26

Nattfågeldata Workshop, 21-22 maj 2014

Nattfågeldata Workshop, 21-22 maj 2014. Claudia von Brömssen , SLU. Antalsdata Om någonting händer slumpmässigt i tid och rum, t.ex.: antal åskväder under en sommar, antal fåglar som ses under en timme, antal olyckor i en korsning under ett år antal växter av en viss sort i ett område

carlow
Download Presentation

Nattfågeldata Workshop, 21-22 maj 2014

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. NattfågeldataWorkshop, 21-22 maj 2014 Claudia von Brömssen, SLU

  2. Antalsdata • Om någonting händer slumpmässigt i tid och rum, t.ex.: • antal åskväder under en sommar, • antal fåglar som ses under en timme, • antal olyckor i en korsning under ett år • antal växter av en viss sort i ett område • … • Poisson fördelningen används för att beskriva dessa typer av data. Det krävs att uppkomsten av åskväder, fåglar,…är oberoende händelser i tiden eller i rummet.

  3. Exempel: Fågelräkning på en sträcker i Svensk Fågeltaxering: svarthätta och stare Medel: 5.78 23.6 Oberoendehändelser Ejoberoende

  4. En Poissonfördelningsomskullekunnapassaförattbeskrivaantalsvarthättor under den tiddet tar attobserverasträckan. En diskretsannolikhets-fördelning. Enbartheltalsvärdenärtillåtna.

  5. Inlägg: Binära data – 0/1 data Om man bara observerar om någonting inträffar eller ej kallar man variabeln binär. T.ex. fågeln observeras /observeras inte Binära data modelleras ofta med Binomialfördelningen. För att kunna göra så måste enheterna vi observera vara oberoende.

  6. Nattfågeldata: Observationer mellan 2003 och 2013. 2 perioder per år. T.ex. Rördrom: Röd: period 1 Blå: period 2

  7. Trend analys: • Mann-Kendall test fungerar även på antalsdata, eftersom Mann-Kendall test enbart beräknas på ranger. • Eftersom data är insamlade under 2 perioder ska det tas hänsyn till också – en test beräknas för varje period och en övergripande test för båda perioder tillsammans. • Separat för de 2 perioderna: • Kombinerad:

  8. Trend analys: • Mann-Kendall test fungerar även på antalsdata, eftersom Mann-Kendall test enbart beräknas på ranger. • Eftersom data är insamlade under 2 perioder ska det tas hänsyn till också – en test beräknas för varje period och en övergripande test för båda perioder tillsammans. • Separat för de 2 perioderna: • Kombinerad:

  9. Modellering av fågeldata: Vill man modellera antalsdata så använder man vanligtvis Poisson-fördelningen. Om antalen är höga kan också normalfördelningen fungera. För Rördromen skulle vi kunna ansätta modellen med en linjär trend och en skillnad mellan perioderna. Antal Rördrommar = År + Period Eller Antal Rördrommar= År + Period+ År*Period

  10. Modellering av fågeldata: Antal Rördrommar = År + Period Antalet rördrommar påverkas av år (=trend) och period under året. De två effekterna är additiva, dvs påverkar inte varandra Eller Antal Rördrommar= År + Period+ År*Period Det finns dessutom en interaktion mellan år och period, dvs trenderna ser olika ut för olika perioder (realistisk?)

  11. Modellering av fågeldata: Beroende i data Eftersom samma plats observeras under 11 år och dessutom 2 gånger varje år så är data inte oberoende. Beroendet finns i första hand mellan observationerna gjorda samma år. Finns många under period 1, så finns också många under period 2.

  12. Modellering av fågeldata: Beroende i data Beroende kan också finnas över åren. Samma fåglar bor kvar eller återvänder.

  13. Modellering av fågeldata: Beroende i data Mann-Kendall testet skattar beroende mellan de två perioderna, men olika år antas vara oberoende. Detta är ofta en rimligt förenkling av modellstrukturen, men bör kunna motiveras. Om man modellera fågeldata med en linjär modell måste även då beroenden anges. För att kunna göra det måste man gå från vanliga linjära modeller (regression, ANOVA) över till mixed models. Är data dessutom antalsdata (eller 0/1 data) så använder man generaliserade linjära mixed modeller (GLIMM).

  14. Modellering av fågeldata: Rördrom Basmodell (linjär modell, normalfördelade data, inga beroenden tas hänsyn till): model1<-lm(Rördrom~År+Period, data=nattf) lm … linearmodel Rördrom~År+Period … modellformel data=nattf … datamaterialet nattf används (tidigare inläst från ett .txt fil

  15. Modellering av fågeldata: Rördrom model1<-lm(Rördrom~År+Period, data=nattf) Call: lm(formula = Rördrom ~ År + Period, data = nattf) Residuals: Min 1Q Median 3Q Max -11.5636 -2.7773 -0.3864 4.1750 7.6455 Coefficients: Estimate Std. Error t valuePr(>|t|) (Intercept) 2449.9455 716.0068 3.422 0.00286 ** År -1.2091 0.3566 -3.391 0.00307 ** Period2 -13.3636 2.2552 -5.926 1.05e-05 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 5.289 on 19 degreesoffreedom Multiple R-squared: 0.7104, Adjusted R-squared: 0.6799 F-statistic: 23.31 on 2 and 19 DF, p-value: 7.706e-06

  16. Modellering av fågeldata: Rördrom Normalfördelning användes här och residualplottarna ska kontrolleras för att se om detta antagandet var uppfyllt.

  17. Modellering av fågeldata: Rördrom Residualerna är någorlunda normalfördelade och möjligtvis skulle normalfördelningen kunna användas för att modellera antalet rördrommar. Vi har dock ett till problem med normalfördelningen: När vi gör ett konfidensintervall: predict(model1,interval='confidence') fit lwrupr … 17 18.463636 14.4445664 22.482706 18 5.100000 1.0809300 9.119070 19 17.254545 12.7766101 21.732481 20 3.890909 -0.5870263 8.368844 21 16.045455 11.0389706 21.051938 22 2.681818 -2.3246658 7.688302

  18. Modellering av fågeldata: Poissonregression Generellt är det bättre att använda Poisson-fördelningen för dessa data: model2<-glm(Rördrom~År+Period, family=poisson, data=nattf) glm … generalised linearmodel (generaliserad linjär modell) family=poisson … anger vilken fördelning data har I samband med poissonregression används log-transformation av responsen.

  19. Modellering av fågeldata: Poissonregression > predict(model2, interval='confidence') 1 2 3 4 5 6 7 8 3.461132 2.532419 3.381664 2.452950 3.302195 2.373482 3.222727 2.294014 9 10 11 12 13 14 15 16 3.143259 2.214545 3.063790 2.135077 2.984322 2.055609 2.904854 1.976141 17 18 19 20 21 22 2.825386 1.896672 2.745917 1.817204 2.666449 1.737736

  20. Modellering av fågeldata: Poissonregression Call: glm(formula = Rördrom ~ År + Period, family = poisson, data = nattf) Deviance Residuals: Min 1Q Median 3Q Max -3.4937 -1.1050 0.0838 1.0331 2.5218 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 162.63615 35.13731 4.629 3.68e-06 *** År -0.07947 0.01751 -4.540 5.64e-06 *** Period2 -0.92871 0.12055 -7.704 1.32e-14 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for poisson family taken to be 1) Null deviance: 140.685 on 21 degrees of freedom Residual deviance: 53.772 on 19 degrees of freedom AIC: 153.85 Number of Fisher Scoring iterations: 5

  21. Modellering av fågeldata: Poissonregression I poisson-fördelningen finns bara en parameter (l), som står för både väntevärde och varians i fördelningen. (Jämför normalfördelningen där 2 parametrar finns: väntevärde m och varians s2). I Poisson regression kan man får problem med överspridning, dvs variationen är större än modellen tillåter. Null deviance: 140.685 on 21 degrees of freedom Residual deviance: 53.772 on 19 degrees of freedom AIC: 153.85 Eftersomkvotenmellan residual deviance ochdegress of freedom är 53.772/19 = 2.83 somärbetydligtstörreän 1 såfinnsdet problem med överspridning (standard error blirfelaktiga)

  22. Modellering av fågeldata: Poissonregression med beroenden I vårt fall kan det vara en effekt av att vi har ignorerat beroenden i datamaterialet. För att modellera beroendet använder vi: library(MASS) model4<-glmmPQL(Rördrom~År+Period, random=~1|År/Period, family='poisson', data=nattf) glmmPQL … model som kan hantera poisson fördelning och beroende mellan data random=~1|År/Period … skattar beroendet mellan perioderna inom samma år

  23. Modellering av fågeldata: Poissonregression med beroenden Linearmixed-effectsmodel fit by maximum likelihood Data: nattf AIC BIC logLik NA NANA Randomeffects: Formula: ~1 | År (Intercept) StdDev: 3.073866e-15 Formula: ~1 | Period %in% År (Intercept) Residual StdDev: 7.274755e-06 1.457754 Variancefunction: Structure: fixedweights Formula: ~invwt Fixedeffects: Rördrom ~ År + Period ValueStd.Error DF t-value p-value (Intercept) 162.63615 55.11721 10 2.950732 0.0145 År -0.07947 0.02746 9 -2.894019 0.0178 Period2 -0.92871 0.18909 10 -4.911361 0.0006 Correlation: (Intr) År År -1.000 Period2 -0.001 0.000 StandardizedWithin-Group Residuals: Min Q1 Med Q3 Max -1.9362271 -0.7191128 0.0577341 0.7533531 1.9399027

  24. Modellering av fågeldata: Poissonregression med beroenden Bästa modell Fixedeffects: Rördrom ~ År + Period ValueStd.Error DF t-value p-value (Intercept) 162.63615 55.11721 10 2.950732 0.0145 År -0.07947 0.02746 9 -2.894019 0.0178 Period2 -0.92871 0.18909 10 -4.911361 0.0006 Signifikanta skillnader mellan perioderna. Signifikant trend. För log-transformerade data är minskningen per år 0.07947.

  25. Modellering av fågeldata: Poissonregression med beroenden

  26. Modellering av fågeldata: Poissonregression med beroenden Samma modell för Vaktel: Utan interaktion med interaktion

More Related