1 / 7

Data mining for fog prediction

Data mining for fog prediction. Peter Bednár , František Albert. Cieľ a súčasný stav. Cieľ predikcia meteorologických javov (hmla, nízka oblačnosť) doprava, poľnohospodárstvo, civilná ochrana, … Súčasný stav:

walt
Download Presentation

Data mining for fog prediction

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Data mining for fog prediction Peter Bednár, František Albert

  2. Cieľ a súčasný stav • Cieľ • predikcia meteorologických javov (hmla, nízka oblačnosť) • doprava, poľnohospodárstvo, civilná ochrana, … • Súčasný stav: • predikcia založená na fyzikálnych modeloch (globálne aplikovateľné, môžu byť parametrizované) • výpočet veličín v čase a priestore, empirické vzťahy pre výpočet indikátorov • Je možné použiť metódy objavovania znalostí na krátkodobú lokálnu predikciu?

  3. Pochopenie dát – 1/2 • Údaje zo sledovacích staníc (METAR) • merané a pozorované fyzikálne veličiny (teplota, vlhkosť, rýchlosť a smer vetra, zrážky, oblačnosť, …) • Satelitné snímky • multispektrálne snímkovanie, spracované do farebnej snímky s vyznačenou oblasťou oblačnosti a hmly. • Globálny fyzikálny model • vypočítané fyzikálne veličiny

  4. Pochopenie dát – 2/2 • METAR, dáta pre 10 letísk v Spojených Arabských Emirátoch, 10 rokov/1h • Cieľ je krátkodobá predikcia (+3h) pre DXB • “miera spoľahlivosti”, vysvetlenie modelu

  5. Predspracovanie dát • Integrácia • Dekódovanie METARu • Normalizácia časových intervalov • Odvodené atribúty • pomer/trend • Problémy • chýbajúce dáta (v priemere 30%, pre niektoré lokality až 90%) – doplnenie z alternatívnych zdrojov • nevyvážené dáta (0.2% pozitívnych)

  6. Modelovanie a vyhodnotenie • Predikcia časového radu s pevným “oknom” (t-n, …, t-1, t) -> (t+1, t+2, t+3) • Dekompozícia modelu: • Detekcia vzniku hmly v danej lokalite • Šírenie hmly z okolia • Rozhodovacie stromy (C5.0) • Vyhodnotenie • úplnosť = TP/(TP + FN), false alarm = FP/(TP + FP) • True skill score = úplnosť – false alarm • Model pre šírenie (94-11=83) , Model pre detekciu vzniku (76-33=43)

  7. Ďakujem za pozornosť

More Related