1 / 27

FUZZY INFORMATION RETRIEVAL

FUZZY INFORMATION RETRIEVAL. Kelompok 4 Betha Nurina Sari Rina Ayoni Dewi Retnani Latifah Nur Fadilahtul M Kingkin Bangkit R Eka Yanuar P. INFORMATION RETRIEVAL.

reuel
Download Presentation

FUZZY INFORMATION RETRIEVAL

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. FUZZY INFORMATION RETRIEVAL Kelompok 4 Betha Nurina Sari Rina Ayoni Dewi Retnani Latifah Nur Fadilahtul M Kingkin Bangkit R Eka Yanuar P

  2. INFORMATION RETRIEVAL • Information Retrieval (IR) :cabang dari ilmu komputer yang meliputi penyimpanan, pemeliharaan dan pencarian informasi dengan data dalam jumlah besar. • Data-data tersebut dapat berupa teks, video, gambar, multimedia dan lain-lain. (Snasel, Abraham, Owais, Platos, Kromes, 2008).

  3. MODEL Information Retrieval • Boolean Suatu cara dalam mengekspresikan keinginan pemakai ke sebuah kueri dengan mamakai operator-operator Boolean yaitu : “and”, “or”, dan “not”. • Vektor Strategi pencarian dokumen yang mendekati kondisi queri, pola bobot mengurutkan dokumen berdasarkan derajat kesamaan pada queri (Rubens, 2006)

  4. Komponen Information Retrieval • Representasi query menggambarkan permintaan informasi user • Representasi dokumen menggambarkan koleksi teks • Fungsi Ranking merangking dokumen menurut relevansinya (OussalahdanElitgani, 2005)

  5. FUZZY INFORMATION RETRIEVAL • Saatinidikembangkan model baru IR yang berbasis fuzzy untukdigunakandalampengambilaninformasi(Oussalah dan Eltigani, 2005). • Model IR dengan teori fuzzy atau menggunakan logika fuzzy mulai dikembangkan oleh beberapa peneliti. Teori ini dikembangkan sekitar akhir 1970 dan dirangkum oleh Salton (Grossman dan Frieder, 2004).

  6. FUZZY INFORMATION RETRIEVAL • Sistem IR mencaridokumenberdasarkan query yang diberikan. Dokumendan query adalahcontohdaribahasa natural. Bahasainiseringkaliambigudantidakpasti. Sulituntukmenentukansesuatu yang ambigudantidakpastidalamlogika crisp (Rubens,2006). • Logika fuzzy berdasarpadateori yang berhubungandengan class dariobyekdenganbatasan yang tidakjelasdengankeanggotaanberdasarkanderajat. Dokumen, query dankarakteristiknyadapatdenganmudahdilihatsebagai class granular dariobyekdenganbatasan yang tidakjelasdankeanggotaan fuzzy dibanyakaspek (Rubens,2006).

  7. FUZZY INFORMATION RETRIEVAL • Logika fuzzy adalahsistemlogika yang merupakanperluasanlogika multi value. Menggunakanlogika fuzzy memberikankeuntungandarimetode Boolean saatmengatasikekurangan. Model logika fuzzy menyediakan framework yang mudahdimengertiuntukpenggunaawamdarisistem IR. Dokumen yang didapatdari query dievaluasidenganaturan Fuzzy Inference System (FIS) yang memilikisemantik yang tepat (Rubens, 2006)

  8. FUZZY SET • FUZZY SET(Himpunan fuzzy) himpunan dari pasangan terurut A = {(x, µa(x)) : x€X)}. Dimana X adalah himpunan semesta dari obyek dan µa(x) adalah nilai keanggotaan suatu obyek x dalam A yang berada dalam interval tertutup [0,1].

  9. FUZZY RELATION • Fuzzy relation dijelaskan sebagai sebuah metode untuk menggambarkan hubungan antara dua objek (kata) yang berbeda. • Dalamkasus IR adalahkata yang berbeda. Contohnyakata ‘fuzzy’ dan ‘neural network’ adalahduakata yang berbedatapijikaterdapatlebihdarisatudokumen yang memilikiduakatatersebutmakabisajadikeduanyaadahubungan. (Darmadidkk, 2006)

  10. JenisRelasiuntukpencarian paper denganRelasi fuzzy • Keyword to paper Nilaididapatkandarihasilpencarianpadakaryailmiahdenganmenggunakan keyword denganmelihatjumlahkata yang ditemukan. Nilai fuzzy ditentukandengan Nilai_keyword_terhadap_paper = min(1,n/20) (1) (Darmadidkk, 2006)

  11. JenisRelasiuntukpencarian paper denganRelasi fuzzy • Paper to paper (2) • Keterangan: • R : Relasi • Pi : Paper / dokumenke – i • Pj : Paper / dokumenke – j • D : Keyword • µ: Membership function sebagaisuatumapping • µPi : D  [0,1] (Darmadidkk, 2006)

  12. JenisRelasiuntukpencarian paper denganRelasi fuzzy • Paper to keyword (3) • Keterangan: • R : Relasi • Pi : Paper / dokumenke – i • Pj : Paper / dokumenke – j • D : Keyword • µ: Membership function sebagaisuatumapping • µPi : P  [0,1] (Darmadidkk, 2006)

  13. JenisRelasiuntukpencarian paper denganRelasi fuzzy • Keyword to keyword (4) • Keterangan: • R : Relasi • Pi : Paper / dokumenke – i • Pj : Paper / dokumenke – j • D : Keyword • µ: Membership function sebagaisuatumapping • µPi : P  [0,1] (Darmadidkk, 2006)

  14. Extended Fuzzy • Rumus diatas masih belum cukup untuk menghasilkanpencariandimanajugamelibatkanhubungan dengan kata dan atau karya ilmiah lain padahalaman yang sama. Untukmewujudkanhaltersebut maka dilakukan lagi satu tahapan perhitungan yaituuntukmenentukanhubungandengankata atau karya ilmiah lain serta menentukan juga bentukurutankeluaran yang diinginkan (rangking). Perhitungantersebutdisebutsebagaiextended fuzzy (Darmajidkk, 2006)

  15. Contoh extended fuzzy • Katapencarianadalah K1 dan K1 mempunyaihubungandengankata yang lain. Hubungannyadijabarkansebagaiberikut: K1 = {1/K1,0.8/K7,0.5/K8} • Makapencarianjugamelibatkankedua keyword diatassehinggapencarianakanmencari K1,K7,K8. Kemudian dari hasil pencarian masing – masing keyword didapatkan 3 hasil fuzzy set yang masing – masing mempunyai nilai sendiri – sendiri.

  16. Misalnya : • P5 = {1/K1,0.5/K7} • P6 = {1/K7} • P7 = {0.4/K1,0.8/K7} • P8 = {0.8/K8} • P9 = {0.7/K8} • P10 = {0.9/K8} • Hubungan antara ketiga fuzzy sets diatas dibentukdenganmengalikannilai (Dot Product) relasikeyworddengannilaielement pada hasil (Darmajidkk, 2006)

  17. Fuzzy Retrieval MenurutOussalahdanElitgani (2005) • Menentukan himpunan fuzzy µ(ti) berhubungan dengan tiap indeks kata kunci ti pada daftar dokumen : (5) • idf(ti) adalah frekuensi dokumen sebaliknya dari kata kunci ti diberikan idf(ti) = log(N/ni) • N adalah jumlah total dokumen dalam database dan ni adalah jumlah total dokumen yang berisi indeks kata kunci ti.

  18. Fuzzy Retrieval MenurutOussalahdanElitgani (2005) • Alternatif dari rumus (5) dalam menemukan himpunan fuzzy untuk tiap dokumen dari indeks kata kunci : µ(dj)(tj) = µ(ti)(dj) (6) (7) dimana qk adalah komponen kek dari query q digunakan pada ekspresi logika L seperti q = L(q1,q2,...) dan L adalah ekstensi himpunan fuzzy L.

  19. Fuzzy Retrieval MenurutOussalahdanElitgani (2005) • Relevansi dari dokumen dj untuk query dapat diekspresikan sebagai hasil dari implikasi fuzzy berikut : (8) dimana I menunjukkan operator fuzzy I. • ContohnyadenganmenggunakanImplikator Lukasiewicz (9)

  20. Contohpenerapan : • Ada himpunan 3 dokumen : D1 : “student have access to computers” D2 : “people do not like computers and laptops” D3 : “computer courses are fmiliar to students” Query q : “student have computer OR laptops” • Himpunan indeks kata kunci : K = (students, have, access, to, computers, people, do, like, laptops, courses, are, familiar), dengan t1 = students, t2 = have,..., t12= familiar (OussalahdanElitgani, 2005)

  21. Contohpenerapan Penerapanrumus 5 Penerapanrumus 6 (OussalahdanElitgani, 2005)

  22. ContohPenerapan sehingga (OussalahdanElitgani, 2005)

  23. ContohPenerapan Denganoperasi Max makahasilnya • Menggunakan rumus 9 maka Sehinggadapatdisimpulkandokumen d1 yang paling relevandengan query. Sedangkandokumen d2 dan d3 sama-samarelevan (OussalahdanElitgani, 2005)

  24. Aturan Fuzzy untukmencaridokumen • Jika term index menunjukpadajuduldokumenmakadiberikannilai yang paling tinggi • Jikamenunjukpadadaftar keyword padadokumen, makadokumentersebutdiberinilaitertinggikedua. • JikapadaBabatausubbabmakadiberinilaitertinggiketiga. • Jikaditemukanpadabagianisi yang berhuruftebalmakahubungannyasecara virtual akandiperluas • Jikasebuah quantifier ditemukanmaka index yang berhubungandenganquanifierituakandialokasikanfrekuensilebihataukurangberdasarkansifatalami quantifier dengancaramengalikanfi,j (1) dengankuantitastetap (OussalahdanElitgani, 2005)

  25. Algoritmapencariandokumen • Rentangkandokumendanbangunrepresentasi index yang darisemuadokumen • Tulisulang query darirepresentasi index • Aplikasikandengan p>0 dandan µ(dj) ditentukanoleh untukmengkalkulasihimpunan fuzzy µ(dj), untuk j = 1 to n. (OussalahdanElitgani, 2005)

  26. AlgoritmaPencarianDokumen • Tentukan µqmenggunakan • TentukankesamaanSim(dj,q) untuk j = 1 to n menurut danurutkankesamaanmenurut (OussalahdanElitgani, 2005)

  27. DaftarPustaka • Darmadi, B.A, Intan R., Lim, R., 2006, Aplikasi Search Engine Paper / KaryaIlmiahBerbasis WEB denganMetode Fuzzy Relation, http://puslit.petra.ac.id/journals/informatics/ • Grossman, D.A, Frieder, O. 2004, Information Retrieval : Algorithms and Heuristics 2nd Edition, Springer, Netherland • Oussalah, M. and Eltigani, 2005, A., Personalized Information Retrieval System in The Framework of Fuzzy Logic, EUSFLAT-LFA 2005 • Rubens, N.O, 2006, The Application of Fuzzy Logic to The Construction of the Ranking Function of Information Retrieval, Computer Modelling and New Technologies, 2006, Vol.10, No.1, 20-27, Transport and Telecommunication Institute, Lomonosov 1, LV-1019, Riga, Latvia • Snasel, V; Abraham, A; Owais, S; Platos, J; Kromer,P , 2008, Optimizing Information Retrieval Using Evolutionary Algorithm and Fuzzy Inference System.

More Related