240 likes | 330 Views
12. Datan käsittely – lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento 16.4.2009 Thomas Hackman. 12. Datan käsittely. Sisältö Tähtitieteellisten havaintojen virheet Korrelaatio Funktion sovitus Aikasarja-analyysi. 12.1 Tähtitieteellisten havaintojen virheet.
E N D
12. Datan käsittely – lyhyt katsaus Havaitsevan tähtitieteen peruskurssi I, luento 16.4.2009 Thomas Hackman HTTPK I, kevät 2009, luento 12
12. Datan käsittely • Sisältö • Tähtitieteellisten havaintojen virheet • Korrelaatio • Funktion sovitus • Aikasarja-analyysi HTTPK I, kevät 2009, luento 12
12.1 Tähtitieteellisten havaintojen virheet • Satunnaiset virheet: • Kohina • Mittaustarkkuus • Systemaattiset virheet: • Havaintolaitteen aiheuttamat vääristymät • Ympäristön aiheuttamat virheet (esim. ilmakehän vaikutukset havaintoihin, käsiteltiin luvussa 2) HTTPK I, kevät 2009, luento 12
12.1.1 Havaintojen kohina • Signaali-kohinasuhde jossa Son signaali = rekisteröityjen fotonien määrä, jaN on kohina Sama spektri eri S/N -suhteella HTTPK I, kevät 2009, luento 12
12.1.2 Havaintolaitteen vaikutukset havaintoihin • Aallonpituusherkkyys • Resoluutio • Laitteen sisäiset sironnat ja heijastumat • Optiset virheet • Havaintolaitteen liikkuminen • Detektorin herkkyysvaihtelut (lämpötilan vaikutus, pikselien herkkyydet …) • ym. HTTPK I, kevät 2009, luento 12
12.1.3 Havainnon mittaaminen • Havaintolaitteen vaikutus havaintoihin voidaan usein esittää muodossa • f ovat ”todelliset” arvot, g on havaintolaitteen antama tulos, hon instrumentin aiheuttama vääristymä ja n ovat satunnaiset virheet HTTPK I, kevät 2009, luento 12
12.1.4 Virheiden poistaminen • Kohinan voi suodattaa, mutta resoluutio kärsii • Havaintolaitteen vääristymien korjaaminen esim. flat-field -kalibrointi • Huomattavasti poikkeavat arvot: outliers • root-mean-square: jossa f on havaintoihin y sovitettava funktio. • Outlierin kriteeri: HTTPK I, kevät 2009, luento 12
12.1.4 Havaintojen redukointi • Redukointi: • Poistetaan mahdollisimman paljon detektorin ja havaintomenetelmän aiheuttamia virheitä • Muutetaan havainnot analyysissa tarvittavaan muotoon • Esim. 2-uloitteinen CCD kuva a spektri • Huom. väärin tehty redukointi a Menetetään informaatiota tai vääristetään dataa • Tarve määrittää mitä tehdään, esim.: • Parempi S/N huonompi resoluutio HTTPK I, kevät 2009, luento 12
12.2 Korrelaatio • Korrelaatio kertoo kahden muuttajan välisestä riippuvuudesta • Korrelaatiokertoimia: • Pearsonin korrelaatiokerroin • Spearmanin järjestyskorrelaatiokerroin • Kendallin järjestyskorrelaatiokerroin HTTPK I, kevät 2009, luento 12
12.2.1 Pearsonin korrelaatiokerroin • Mittaa lineaarista riippuvuutta • Otoksen hajonta: jossa xon keskiarvo • Kahden muuttujan välinen kovarianssi: • Pearsonin korrelaatiokerroin: HTTPK I, kevät 2009, luento 12
12.2.2 Korrelaation todennäköisyys • Nollahypoteesi: x ja y eivät korreloi • Oletetaan: x ja y:lle on saatu rxy • Mikä on nollahypoteesin todennäköisyys? • Jos N on suuri (N>20) => rxynoudattaa normaalijakaumaa • Merkitään • => todennäköisyys että korrelaatio ”sattumalta” olisi suurempi kuin rxy: HTTPK I, kevät 2009, luento 12
12.3 Funktion sovitus • Sovituksen kriteeri yleensä mahdollisimman pieni virheiden neliöiden summa: • Sopii erityisesti, jos virheet ovat satunnaisia gaussisesti jakaantuneita HTTPK I, kevät 2009, luento 12
12.3.1 Pienimmän neliösumman menetelmä • Sovitettava funktio: • Määritellään: • ovat pisteet johon sovitetaan funktio HTTPK I, kevät 2009, luento 12
12.3.1 Pienimmän neliösumman menetelmän ratkaisu • Jos N=Ksaadaan yksiselitteinen ratkaisu yhtälöstä A a = y • Kuitenkin jotta sovitus olisi luotettava niin • Etsimme ratkaisua jossa on mahdollisimman pieni => ratkaisu saadaan normaaliyhtälöistä: HTTPK I, kevät 2009, luento 12
12.3.2 Suoran sovitus • Sovitettava funktio HTTPK I, kevät 2009, luento 12
12.3.3 Ratkaisu suoran sovitukseen • Saamme ratkaisun yhtälöryhmästä • Merkitään ratkaisu: HTTPK I, kevät 2009, luento 12
12.3.4 Virheiden huomioiminen pns:n sovituksessa • Mittausten hajontaa kuvaa yleisessä tapauksessa kovarianssimatriisi: • Jos virheet riippumattomia: HTTPK I, kevät 2009, luento 12
12.3.4 Virheiden huomioiminen pns:n sovituksessa • Normaaliyhtälöt saadaan muotoon • Merkitään • Ratkaisu on • Kertoimien aivirheet saadaan matriisista C-1 HTTPK I, kevät 2009, luento 12
12.3.4 Epälineaarinen sovitus • Esitetyllä pienimmän neliösumman menetelmällä voidaan ratkaista vain lineaarisia ongelmia • Epälineaaristen ongelmien ratkaisuja • Ongelman muuttaminen lineaariseen muotoon • Esim. • Tarkkaan ottaen ei kuitenkaan enää saada alkuperäisen funktion parametreille pns:n sovitusta • Erilaiset optimointimenetelmät • Eivät välttämättä anna globaalia minimiä vaan lokaali minimi HTTPK I, kevät 2009, luento 12
12.4 Aikasarja-analyysi • Parametriset menetelmät: • Sovitetaan dataan jaksollinen funktio • Esim. Fourier sarjan sovitus • Ei-parametriset menetelmät: • Etsitään periodisuutta esim. datan maksimeista tai minimeistä • Esim. Kuiper- tai Swanepoel & De Beer -menetelmät HTTPK I, kevät 2009, luento 12
12.4.1 Fourier-sarjan sovitus • Malli: • Huom.: Malli on epälineaarinen => ratkaisua ei saada suoraan pienimmän neliösumman menetelmällä • Ratkaisumenetelmä: Three stage period analysis (Jetsu & Pelt 1999) keskiarvo periodi HTTPK I, kevät 2009, luento 12
12.4.2 Esimerkki aikasarja-analyysista • Tähden HD 199178 valokäyrä, Aikasarja-analyysi HTTPK I, kevät 2009, luento 12
12.4.3 Jaksollisen käyrän sovittaminen:Tähti-planeettajärjestelmä • Sisärata: M=7.7 MJup ; ulkorata: M=17MJup Marcy et al., 1999, 2001 HTTPK I, kevät 2009, luento 12
Kirjallisuutta • H. Karttunen: Datan käsittely, CSC 1994 • W.H. Press et al.: Numerical recipes, kotisivu: http://www.nr.com HTTPK I, kevät 2009, luento 12