160 likes | 605 Views
Regresjonsanalyse Korrelasjon. HSTAT1101: 13. oktober 2004 Odd Aalen. Hovedproblemstilling i regresjon og korrelasjon. Måler flere størrelser Ønsker å finne ut av sammenhengen mellom dem Regresjon og korrelasjon er statistiske metoder til å bestemme slike sammenhenger. Fra læreboka:
E N D
RegresjonsanalyseKorrelasjon HSTAT1101: 13. oktober 2004 Odd Aalen
Hovedproblemstilling i regresjon og korrelasjon • Måler flere størrelser • Ønsker å finne ut av sammenhengen mellom dem • Regresjon og korrelasjon er statistiske metoder til å bestemme slike sammenhenger
Fra læreboka: Sammenheng mellom høyde og skonummer for 22 studenter.
Asia Pacific J Clin Nutr (2002) 11(1): 8–12 Dietary patterns and risk factors for Type 2 diabetes mellitus in Fijian, Japanese and Vietnamese populations Kazue Tomisaka and coauthors
Paper from British Medical Journal BMJ 2002;324:23 ( 5 January )Education, income inequality, and mortality: a multiple regression analysis Andreas Muller
Mortality and level of educationAge adjusted death rates by educational attainment for the 50 US states and the District of Columbia (DC), 1989-90 (y=6.16+0.103×x).
The Gini coefficient • The Gini coefficient ranges from 0 to 1 and measures the degree of income inequality. A value of 0 indicates that each household obtains the same amount of income, while a value of 1 indicates that only one household earns all income
Mortality and Gini coefficientAge adjusted death rates by Gini coefficient for the 50 US states and the District of Columbia (DC), 1989-90 (y=1.831+15.705×x)
Tilpasning av linje til tre punkter • Velger linjen som minimerer summen av kvadrat-avstandene
b a Formel for linje: y = a + b x a - skjæringspunkt med y-aksen b - helningskoeffisient
Correlation: 1 Correlation: How close are the points to a straight line? Correlation is always between -1 and +1. Correlation 0 means no association Correlation: -1 Correlation: 0
Eksempler på korrelasjoner Korrelasjon -0-94 Korrelasjon 0.39
Data • Målinger av PEF (Peak Expiratory Flow Rate) for 95 studenter. Tre målinger sittende og tre målinger stående. I eksemplene brukes gjennomsnittlig PEF (PEFMEAN) • Registrering av kjønn,høyde og vekt
Spredningsdiagram (“scatter plot”) for PEF mot høyde • Korrelasjon: 0.67