180 likes | 271 Views
Spatial Association. Spatial Association Rule. X → Y P 1 .. P m → Q1 .. Qn (c%) Los predicaat: 1-predicate Set van P 1 t/m P k : k-predicate. Support & confidence. sup(X → Y) de kans dat de implicatie voorkomt in de dataset conf(X → Y) = sup(X → Y) / sup(X).
E N D
Spatial Association Rule • X → Y • P1 .. Pm → Q1 .. Qn (c%) • Los predicaat: 1-predicate • Set van P1 t/m Pk: k-predicate
Support & confidence • sup(X → Y) • de kans dat de implicatie voorkomt in de dataset • conf(X → Y) = sup(X → Y) / sup(X)
Sterkte van een regel • Sterk = relaties in een regel komen vaker voor • Sterk = hoge support en confidence • … maar hoe hoog?
Minimum support/confidence • Input voor mining algoritme • Voor elk niveau in de hiërarchie • minsup[l] • minconf[l]
Voorbeelden (1) • Spatial antecedenten, non-spatial consequent • is_a(x, house) close_to(x, beach) → is_expensive(x) (85%)
Voorbeelden (2) • (Non)-spatial antecedenten, spatial consequent • is_a(x, gas_station) → close_to(x, highway) (50%)
Voorbeelden (3) • Combineren van support & confidence • is_a(A, large_town) intersects(A,B) adjacent_to(A, C) → is_a(B,motorway), C!=B, is_a(C,sea) (36%,80%
Hiërarchieën (1) • Data structureren in spatial hierarchy • Efficiënter • Processing gaat ‘top-down’ • Progressief zoeken • (road (national_highway (A27, A2, …), provincial_highway (N238, N235, …), city_street (Oudegracht, Heidelberglaan, …), …), …)
Hiërarchieën (2) water river sea lake Rijn Large lake Waddenzee Noordzee IJsselmeer
ILP Algoritme (1) • Gebaseerd op ILP • Inductive Logic Programming • ‘feature extraction’ om een deductive database te krijgen • Logische variant van relational database
ILP Algoritme (2) • Spatial observations • O[Amsterdam | Amsterdam]is_a(Amsterdam, large_town)intersects(Amsterdam, A2)intersects(Amsterdam, A10)close_to(Amsterdam, Schiphol)…
ILP Algoritme (3) • O[Schiphol | Amsterdam]is_a(Schiphol, airport)intersects(Schiphol, A4)… • O[s] = O[s|s] O[ri|s’]
ILP Algoritme (4) • Twee subproblemen • Find large/frequent spatial patterns • Generate strong spatial association rules • Prunen
Algoritme #2 (1) • Vindt sterke multi-level spatial association rules • Beperking zoekruimte • Relevant object set • Concept hierarchies • minsup/minconf
Algoritme #2 (2) • Predicaten berekenen op hoog niveau (lage resolutie) • Prunen adhv minsup[1] • Overblijvende predicaten berekenen op lagere niveaus
Algoritme #2 (3) • Alle k-predicates (voor alle k’s) berekenen • Prunen adhv minconf[l]
Conclusie • Veel problemen • Schaalbaarheid • Ontbrekende data • Nog veel user input nodig • O.a. minsup/minconf • Aantal oplossingen • Maar niet eenduidig