70 likes | 205 Views
Data mining for fog prediction. Peter Bednár , František Albert. Cieľ a súčasný stav. Cieľ predikcia meteorologických javov (hmla, nízka oblačnosť) doprava, poľnohospodárstvo, civilná ochrana, … Súčasný stav:
E N D
Data mining for fog prediction Peter Bednár, František Albert
Cieľ a súčasný stav • Cieľ • predikcia meteorologických javov (hmla, nízka oblačnosť) • doprava, poľnohospodárstvo, civilná ochrana, … • Súčasný stav: • predikcia založená na fyzikálnych modeloch (globálne aplikovateľné, môžu byť parametrizované) • výpočet veličín v čase a priestore, empirické vzťahy pre výpočet indikátorov • Je možné použiť metódy objavovania znalostí na krátkodobú lokálnu predikciu?
Pochopenie dát – 1/2 • Údaje zo sledovacích staníc (METAR) • merané a pozorované fyzikálne veličiny (teplota, vlhkosť, rýchlosť a smer vetra, zrážky, oblačnosť, …) • Satelitné snímky • multispektrálne snímkovanie, spracované do farebnej snímky s vyznačenou oblasťou oblačnosti a hmly. • Globálny fyzikálny model • vypočítané fyzikálne veličiny
Pochopenie dát – 2/2 • METAR, dáta pre 10 letísk v Spojených Arabských Emirátoch, 10 rokov/1h • Cieľ je krátkodobá predikcia (+3h) pre DXB • “miera spoľahlivosti”, vysvetlenie modelu
Predspracovanie dát • Integrácia • Dekódovanie METARu • Normalizácia časových intervalov • Odvodené atribúty • pomer/trend • Problémy • chýbajúce dáta (v priemere 30%, pre niektoré lokality až 90%) – doplnenie z alternatívnych zdrojov • nevyvážené dáta (0.2% pozitívnych)
Modelovanie a vyhodnotenie • Predikcia časového radu s pevným “oknom” (t-n, …, t-1, t) -> (t+1, t+2, t+3) • Dekompozícia modelu: • Detekcia vzniku hmly v danej lokalite • Šírenie hmly z okolia • Rozhodovacie stromy (C5.0) • Vyhodnotenie • úplnosť = TP/(TP + FN), false alarm = FP/(TP + FP) • True skill score = úplnosť – false alarm • Model pre šírenie (94-11=83) , Model pre detekciu vzniku (76-33=43)