1 / 25

Predstavljanje nesavršenog znanja

Predstavljanje nesavršenog znanja. Motivacija: Racionalna odluka inteligentnog agenta ovisi o relativnim odnosima važnosti ciljeva i stupnjeva vjerovanja u ostvarenje tih ciljeva. Agent ne može garantirati ostvarenje cilja.

zoe
Download Presentation

Predstavljanje nesavršenog znanja

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Predstavljanje nesavršenog znanja Motivacija: Racionalna odluka inteligentnog agenta ovisi o relativnim odnosima važnosti ciljeva i stupnjeva vjerovanja u ostvarenje tih ciljeva. Agent ne može garantirati ostvarenje cilja. Potrebno je uvesti predstavljanje stupnja vjerovanja u postizanje cilja, t.j. stupnja vjerovanja u istinitost rasuđivanjem izvedenog zaključka. Nesavršen zaključak ili cilj mora se izvesti iz nesavršenog poznavanja stanja svijeta (činjenica) i nesavršene baze znanja.

  2. Predstavljanje nesavršenog znanja Zadatak: Oblikovati sustav temeljen na predstavljanju i obradbi nesavršenog znanja. Ideja: Činjenicama i pravilima (ili logičkim izrazima) pridijeliti težinske faktore koji preslikavaju nesavršeno znanje (stupanj vjerovanja) o tim temeljnim entitetima sustava. Definirati postupak pridjeljivanja težinskih faktora novo izvedenom zaključku.

  3. Predstavljanje nesavršenog znanja Shematski prikaz stanja svijeta i baze znanja: u okviru formalne logike ili prirodnog zaključivanja pravilima (Wfi – težinski faktori činjenica, Wrj – težinski faktori pravila): Činjenice: F1, Wf1 F2, Wf2 … Fn, Wfn Pravila: ( A11, A12, …, A1k )  C1 , Wr1 ( A21, A22, …, A2l )  C2 , Wr2 … ( Am1, Am2, …, Amp )  Cm , Wrm Problem: semantika težinskih faktora !

  4. Predstavljanje nesavršenog znanja Semantika težinskih faktora: 1. NEIZVJESNOST (nepotpuno poznavanje stvarnoga svijeta) Npr.: Temperatura pare je 280 C, (0.8). Ovdje 0.8 predstavlja neku mjeru nepotpunog poznavanja temperature, t.j. možda pogrešku mjernog instrumenta ±20%. Pristupi uvođenju mjere za neizvjesnost (nepotpunog poznavanja svijeta): Predikatna Logika + vjerojatnost u automatiziranom dokazivanju teorema (ATP) P , W1 ; Modus ponens s vjerojatnostima premisa P  Q , W2 : da li W1 i W2 mogu biti nekozistentni ? _________ Q , W3 ? ; Kolika je vjerojatnost zaključka ? Faktori izvjesnosti u sustavima s pravilima ("Ad Hoc" postupak). Različite formalne logike (npr. DST) Mrežni kauzalni modeli

  5. Predstavljanje nesavršenog znanja Teorijske osnovice za rukovanje s NEIZVJESNOSĆU Racionalni agent odabire akciju temeljem preferencija. 1. Vjerojatnost– pogodna za obradbu izostavljenih ili nedostajućih podataka. 2. Predstavljanjem i obradbom preferencija bavi se teorija korisnosti (engl. utility theory). 3. Teorija odlučivanja = teorija vjerojatnosti + teorija korisnosti. (O teoriji korisnosti i teoriji odlučivanja bit će riječi kasnije o mrežnim modelima predstavljanja znanja)

  6. Predstavljanje nesavršenog znanja Semantika težinskih faktora: 2. NEIZRAZITOST (nejasnost, neodređenost, nepreciznost) Npr: Temperatura pare je visoka. visoka – neizrazita vrijednost, ali traži pripadnu mjeru i semantiku Pristupi uvođenju mjere neizrazitog znanja: Neizrazita logika (engl. fuzzy). Neizrazita logika + faktori izvjesnosti. Teorija mogućnosti (engl. possibility theory).

  7. Predstavljanje nesavršenog znanja Težinski faktori predstavljeni predikatnom logikom + vjerojatnost (Nilsson, 1989.g.) U "Modus ponens" vodimo indikatore ri: P, r1ri = stupanj verovanja u istinitost (P  Q), r2 (engl. degree of belief) Q, r3modeliramo s vjerojatnošću Tumačenje preko svjetova: Svaka logička formula je istinita (T) u svijetu W1, a neistinita (F) u svijetu W2. P se nalazi u W1 s vjerojatnošću p, a u W2 s vjerojatnošću (1 – p). Za skup od L formula postoji 2L mogućih svjetova. Stvarno postoji K 2L svjetova, jer su neki nemogući. Npr. za P=T, Q=F, nemoguć je svijet u kojem (P  Q) =T.

  8. Predstavljanje nesavršenog znanja Logika + vjerojatnost Promatramo "Modus ponens": Konzistentni su samo svjetovi (interpretacije) sukladni tablici implikacije: W1 W2 W3 W4 (4 svijeta) potpun i isključiv skup P vektor p1 p2 p3 p4 pi = vjer. da je naš svijet baš Wi ( pi = 1) __________________________ P T T F F r1 = p1 + p2 (P  Q) T F T T r2 = p1 + p3 + p4 Q T F T F r3 = p1 + p3 V4 vektor R vektor L = 3 (broj formula i r-ova). K = 4 (broj svjetova), K < 2L . Indikatori ri predstavljanju sumu vjerojatnosti onih svjetova u kojima je ta formula istinita.

  9. Predstavljanje nesavršenog znanja Logika + vjerojatnost Definiramo formalan sustav: Vektor Vi s (vrijednostima komponenata F=0 ili T=1) prikazuje istinitost pojedine formule u nekom svijetu Wi . Vektore V1, ... ,Vk (sa L komponenata) grupiramo u matricu(L x K): V. Vjerojatnosti ri grupiramo u L-dimnenzijski vektor R. Vjerojatnosti pi grupiramo u K-dimenzijski vektor P. Vjerojatnosti se povezane matričnom jednadžbom: R = VP Ako postoje vjerojatnosti danih formula, moguće je probabilističko rasuđivanje: a) Koja je vjerojatnost novo generirane formule ? (npr. Q u "Modus ponensu). b) Kako promjena jedne vjerojatnosti utječe na ostale vjerojatnosti u skupu ?

  10. Predstavljanje nesavršenog znanja Logika + vjerojatnost Za "Modus ponens" matrica V je: 1 1 0 0 ; P ; 0  pi  1 V = 1 0 1 1 ; (P  Q) ; pi = 1 1 0 1 0 ; Q ; Opažamo: Preslikavanje R = VP je linearno. Vršne vrijednosti Pse preslikavaju u vršne vrijednosti R. Vršne vrijednosti P su za pi=1 (samo jedan pi zbog pi=1). Vršni vektori P su: [1,0,0,0], [0,1,0, 0], [0,0,1,0], [0,0,0,1] – (stupčani vektori). Zbog linearnog preslikavanja vršnim P odgovaraju vršni R vektor koji su ustvari pojedine koloneV matrice. Odnos vršnih vrijednosti može se prikazati grafički.

  11. r3 = prob(Q) 1 1 1 r2 = prob(PQ) r1 = prob(P) Predstavljanje nesavršenog znanja Logika + vjerojatnost K=4 vrha u L=3 dimenzije: (piramida s vrhom [1,1,1]) Zaključci: 1. Za dani r1 = prob(P) i r2 = prob(PQ), ne postoji jednoznačni r3 = prob(Q) (proboj kroz piramidu). Probabilističko zaključivanje nije jednoznačan proces. 2. Postoje nekonzistentne vjerojatnosti pridijeljene istinitosnim vrijednostima već i za r1 i r2 (od ishodišta do dijagonale donje ravnine). 3. Za L rečenica i K skupova mogućih svjetova, konzistentan prostor je ograničen hiperravnimon s K vrhova u L dimenzija (analitički zahtjevno). 4. Za male matrice V, i posebne degenerirane slučajeve (npr. linearna kombinacija p-ova i r-ova) postoje aproksimacijske metode.

  12. Predstavljanje nesavršenog znanja Faktori izvjesnosti kao težinski faktori u sustavima s pravilima ("Ad Hoc" postupak) Faktori izvjesnosti (CF) - (engl, certainty factor) Ideja: Činjenicamai pravilimapridružiti težinske faktore CFi koji opisuju značaj toga entiteta u sustavu. Pri izračunu prekrivanja parova činjenica i AKO dijelova pravila odrediti CFAKO za cijeli AKO dio pravila. Temeljem izvornog CF pravila i izračunatog CFAKO za AKO stranu pravila odrediti novi faktor izvjesnosti CFC svakog pravila. Ako je novi faktor izvjesnosti pravila manji od unaprijed postavljenog praga, to pravilo treba isključiti iz skupa za donošenje zaključka.

  13. Predstavljanje nesavršenog znanja Određivanje izvornih faktora izvjesnosti Činjenice: pridruživanje CF svakoj činjenici je sasvim heuristički (npr. točnost mjerenja neke veličine, statistički iz povijesti itd.). Pravila: Najčešće koristimo pojednostavljene uvjetne vjerojatnosti kao faktore izvjesnosti. AKO: E, TADA: H, P(H | E)(ovdje samo jedan član na AKO strani) gdje je P(H | E) uvjetna vjerojatnost da će se dogoditi H (hipoteza) ako se dogodio E (evidencija). Uvjetna vjerojatnost P(H | E) može semantički preuzeti ulogu faktora izvjesnosti CF pravila. Primjer iz medicine: Liječnik zna (iz svoje statistike) da je apriorna vjerojatnost meningitisa P(M), apriorna vjerojatnost ukrućenog vrata P(V), te vjerojatnost ukrućenog vrata kod dijagnosticiranog meningitisa P(V | M). Kolika je vjerojatnost meningitisa ako se pojavi pacijent s ukrućenim vratom ? P(M | V) je vjer. hipoteze uz evidenciju t.j. P(H | E), odnosno faktor izvjesnosti CF. P(M | V) = P(V | M) · P(M) / P(V) uz uporabu Bayesovog pravila

  14. Predstavljanje nesavršenog znanja Određivanje izvornih faktora izvjesnosti Pravilo s više dijelova na AKO strani: AKO: E1, E2, ... , Em, TADA: H, P(H | E1, E2, ..., Em) Bayesovo pravilo daje: P(E1, E2, ..., Em | Hk) P(H) P(H | E1, E2, ..., Em) = ------------------------------------- P(E1, E2, ..., Em) m istodobnih Em (simptoma) zahtijeva 2m (svi podskupovi) apriornih vjerojatnosti. Eksponencijalna složenost nedopustiva. Redukcija složenosti: Ei su međusobno nezavisni (vrlo jako pojednostavljenje). P(E1, E2, ..., Em | Hk) = P(E1 | Hk) · P(E2 | Hk) · … · P(Em | Hk) P(E1, E2, ..., Em) = P(E1) · P(E2) · … · P(Em) P(E1 | Hk) P(E2 | Hk) P(Em | Hk) P(H | E1, E2, ..., Em) = P(Hk) ------------ ------------ ... ------------ P(E1) P(E2) P(Em)

  15. Predstavljanje nesavršenog znanja Računanje s faktorima izvjesnosti (CF) Određivanje CF za aktivirano pravilo Činjenice: s faktorima izvjesnosti CF1 . . . CFn Pravilo: Faktor izvjesnosti pravila CFR . Novi faktor izvjesnosti pravila nakon slaganja svih članova na AKO strani s odgovarajućim činjenicama: CFC = CFR min[CF1 , . . . , CFn] Odabere se minimalni CF temeljem slaganja parova činjenica s AKO dijelovima u pravilu. Dobiveni minimalni CF množi izvorni CFR pravila. Slijedi faktor izvjesnosti zaključka (TADA strane pravila) CFC .

  16. Predstavljanje nesavršenog znanja Upis nove činjenice kao rezultat zaključivanja Npr.: Činjenica: F1 , CFF1 =0.9 Pravilo: AKO F1, TADA (F2 uz CFF2 = 0.7) , CFR = 0.8 Pravilo se aktivira (F1  AKO F1) i nova činjenica F2 upisuje se u skup činjenica, ali sa promijenjenim faktorom izvjesnosti CFF2 : CFF2 = 0.9 x 0.7 x 0.8 = 0.504

  17. Predstavljanje nesavršenog znanja Višestruki doprinos istoj hipotezi Pravilo može svojim zaključkom upisati činjenicu Fn (uz faktor izvjesnosti CFFn ) , koja već postoji u skupu činjenica kao F (uz faktor izvjesnosti (CFF ). (Vidi raniji primjer uz pretpostavku da je F1 = F2). Obnovljena (ista) činjenica dobiva novi faktor izvjesnosti: CF = max [ CFFn , CFF ]

  18. Predstavljanje nesavršenog znanja Ekspertni sustav MYCIN (Stanford Univ., 1984) i faktori izvjesnosti Činjenice: (sensitive organism-1 penicillin -1.0) ; org-1 nije osjetljiv na pencl. Pravila: Ako: E1, E2, ... , Ek ; niz evidencija Tada: H, CF ; izvjesnost hipoteze H CF - faktor izvjenosti (confidence factor), -1, 1 +1 - potpuna potvrda hipoteze -1 - potpuna potvrda negacije hipoteze 0 - početna izvjesnost hipoteze (niti je potvđena niti odbačena)

  19. Predstavljanje nesavršenog znanja Ekspertni sustav MYCIN (Stanford Univ., 1984) i faktori izvjesnosti MB(H,E) - MD(H,E) CF = --------------------------- 1 - min MB(H,E), MD(H,E)  MB [0, 1] - mjera vjerovanja (measure of belief) u H zbog E MD [0, 1] - mjera nevjerovanja (measure of disbelief) u H zbog E Za jedan E: 1 ako P(H) = 1 MB(H,E) = max( P(HE), P(H) ) - P(H) ------------------------------------ inače 1 - P(H) 1 ako P(H) = 0 MD(H,E) = min( P(HE), P(H) ) - P(H) ------------------------------------ inače - P(H) P(H), P(HE) su apsolutne i uvjetne vjerojatnosti

  20. Predstavljanje nesavršenog znanja Ekspertni sustav MYCIN (Stanford Univ., 1984) i faktori izvjesnosti Za višeE: MB(H, Ei  Ek) = MB(H, Ei) + MB(H, Ek) - MB(H, Ei) MB(H, Ek) Za više hipotezaHi : MB(H1  H2, E) = min(MB(H1, E), MB(H2, E)) MB(H1  H2, E) = max(MB(H1, E), MB(H2, E)) Za MD, min se zamjenjuje sa max i obrnuto. Strategija upravljanja: ulančavanje unatrag Konjunkcija AKO strane: min operacijom uz empirički prag CF > 0.2. Zaključak: <CF_ako_strane> * <CF_tada_strane> Kombinacija pravila (više pravila govore o istom H) npr. za dva CF: oba CF > 0: CFnovi = CF1 + CF2 - CF1*CF2 oba CF < 0: CFnovi = CF1 + CF2 + CF1*CF2 inače: CFnovi = (CF1 + CF2) / (1 - minCF1,CF2)

  21. Predstavljanje nesavršenog znanja Ekspertni sustav MYCIN (Stanford Univ., 1984) i faktori izvjesnosti Problemi: 1) Npr. za više MB i jedan MD: MB(H, Ei)=0.8 za i=1,...,10 (10 dokaza u korist hipoteze) MD(H, E11)=0.2 (1 dokaz protiv hipoteze) MBuk(H, Ei)  0.999 CF  (0.999 - 0.2)/(1-0.2), te ostaje vrlo blizu toj vrijednosti ma koliko dokaza u korist hipoteze H (nije sukladno intuiciji) 2) P(H1) = 0.8, P(H1 | E) = 0.9 -> CF(H1 | E) = 0.5 P(H2) = 0.2, P(H2 | E) = 0.8 -> CF(H2 | E) = 0.75 Veća uvj. vjer. -> niži CF: kontradikcija 3) CF(H, e) = CF(H, i) * CF(i, e) ; i = među-hipoteza P(H | e)  P(H | i) * P(i | e) ; u teoriji vjer. ne vrijedi

  22. Predstavljanje nesavršenog znanja DEMPSTER - SHAFER (1970) teorija - DST Problemi teorije vjerojatnosti: Izražavanje neznanja: postoje 2 hipoteze: A, B, i nema drugih informacija. Po teoriji vjerojatnosti: P(A) = P(B) = 0.5, te P(H)+P(H)=1 DST: nema potvrde za takvo rasuđivanje. Definiramo: Okvir rasuđivanja (spoznaje) U=Hi, hipoteze (potpun skup međusobno isključivih događaja). Neka je U = {H1, H2, H3, H4}. Po teoriji vjerojatnosti pridjeljuje se pojedinoj hipotezi tako da:  pi = 1. DSTpridjeljuje tzv. osnovne vjerojatnosti svim podskupovima od U (u našem primjeru postoji 16 podskupova) za koje postoji neka potvrda. Npr.: m(H1) = 0.3 m(H2) = 0.2 m(H3) = 0.1 m(H1, H3) = 0.4 (H1 ili H3) m(Ai) = 0 za ostale podskupove jer za njih nema potvrde. m(Ai) = 1 uvjet konzistentnosti (ovdje 0.3+0.2+0.1+0.4)

  23. Predstavljanje nesavršenog znanja DEMPSTER - SHAFER (1970) teorija – DST m(Ak) nije vjerojatnost jer za p(Ak), Ak jedan i samo jedan događaj. Definicije: Fokalni elementi: svi podskupovi Ai za koje m(Ai) > 0. Jezgra: unija svih fokalnih elemenata; ovdje {H1, H2, H3. Primjer izražavanja neznanja: U = {A, B). Postoji događaj A ili B i nema drugih informacija. Teorija vjerojatnosti: p(A)=0.5, p(B)=0.5 DST: pridjeljujemo osnovne vjerojatnosti svim podskupovima: m(0) = 0 ; potvrđeno je da postoji barem jedan događaj m(A) = 0 ; nije potvrđeno da je A m(B) = 0 ; nije potvrđeno da je B m(A, B) = 1 ; sigurno je ili A ili B

  24. Predstavljanje nesavršenog znanja DEMPSTER - SHAFER (1970) teorija – DST Def. funkcija vjerovanja (Bel, belief) u događaj A (A je podskup U): Bel(A) zbraja sve osnovne vjerojatnosti svih podskupova od A: Bel(A) =  m(Bj) gdje su Bj svi podskupovi od A. Bel(A)=m(A) za pojedinačne elemente, dok je Bel(A)>m(A) inače. Npr. neke vrijednosti Bel za gornji slučaj: Bel(H1) = m(H1) = 0.3 ; jednako osnovnoj vjerojatnosti Bel(H1, H3) = m(H1, H3)+m(H1)+m(H3) = 0.4 + 0.3 + 0.1=0.8 > m(H1, H3) Obilježja Bel: Bel(0) = 0, nema vjerovanja u prazan skup Bel(U) = 1, u potpunom skupu je sva istina (to je ujedno m(Ai)) Vjerovanje u negaciju hipoteze A, t.j. Bel(A): Neka je A=H1, a A je sve osim A, t.j. sve osim H1: Bel(A) = m(H1) = 0.3 Bel(A) = Bel(H2, H3, H4) = m(H2) + m(H3) + 0 (ostali m) = 0.2 + 0.1= 0.3 Bel(A) + Bel(A)  1

  25. Predstavljanje nesavršenog znanja DEMPSTER - SHAFER (1970) teorija – DST Def. vjerodostojnost(plauzibilnost) A: Pl(A) = 1 - Bel(A) - to je maksimalno moguće vjerovanje u A Pl(A) - Bel(A) - neizvjesnostu A. Bel(A), Pl(A) - interval sigurnostivjerovanja u A Primjeri: 0, 0 hipoteza je neistinita 1, 1 hipoteza je istinita 0.3, 1 hipoteza je djelomično istinita 0, 1 nema dokaza u korist hipoteze 0, 0.8 hipoteza je djelomično neistinita (0.2 u korist neistinosti) 0.2, 0.7 ima dokaza da je hipoteza istinita (0.2) i nestinita (0.3) Sustav znanja s pravilima i DST indikatorima: Ako: E1 ... En, Tada: H, Bel(H), Pl(H) Problem: eksponencijalan skup apriornog znanja. Npr. 100 zavisnih događaja, teorija vjer.: 2100, DST: 2200.

More Related