160 likes | 272 Views
Scalable Web Search by Adaptive Online Agents: An InfoSpiders Case Study Pembangunan Enjin Gelintar (TP2433). Tan Sim Tee A97299 Quah Cheak Seong A97271 Chung Wui Fah A97154 Lee Chun Aik A97212
E N D
Scalable Web Search by Adaptive Online Agents:An InfoSpiders Case StudyPembangunan Enjin Gelintar(TP2433) Tan Sim Tee A97299 Quah Cheak Seong A97271 Chung Wui Fah A97154 Lee Chun Aik A97212 Ng Wai Mann A97262
Persekitaran jaringan informasi telah menjadi semakin kompleks iaitu masalah “decentralization”, “noise”, “heterogeneity” dan juga “dynamics”. • Demi memenuhi keperluan pengguna, satu sistem “multi-agent” telah diwujudkan untuk menatasi masalah tersebut. • Kerjasama terhasil daripada interaksi secara tidak langsung antara agen-agen dan bersesuaian dengan persekitaran. • “Multi-agent” terdiri daripada satu kumpulan agen yang benar untuk memenuhi keperluan dan kehendak pengguna. • Kandungan agen adalah bergantung kepada persekitaran dan perubahan yang berlaku dalam sesuatu pencarian maklumat.
Sekiranya terdapat sumber yang mencukupi dalam persekitaran, dengan itu agen yang baru akan terbentuk dengan banyak dan akan bergabung dengan agen yang lepas. • Jikalau sumber adalah terdapat mencukupi maka, agen itu akan bersaing antara satu sama lain dan terdapat sebilangan agen akan disingkirkan dalam persaingan tersebut. • Selain itu, pihak server boleh membenarkan agen mobile untuk melaksanakannya dan mungkin akan menghasilkan agen yang baru dengan menggunakan perkakasan di dalam persekitaran operasi. • Dengan itu, terbentuk satu sistem enjin gelintar yang berfungsi dengan berkesan dalam pencarian maklumat iaitu sisem enjin gelintar “InfoSpiders”.
Enjin gelintar ialah suatu perkakasan / program yang digunakan untuk mencari dan mencapai maklumat berdasarkan kepada sebutan gelintar. • Dengan terbuktinya teknik pencarian maklumat, enjin gelintar telah mengikuti perkembangan web dan membekalkan pengguna sebanyak mungkin bantuan untuk mencari dan mancapai maklumat dalam web. • Terdapat 3 bentuk enjin gelintar dalam web iaitu: i)Web Crawlers ii)Web Portals iii)Meta Search Engines • Enjin gelintar memerlukan kueri iaitu carian berasaskan kata kunci atau gelintar iaitu navigasi melalui set jalinan untuk mencapai maklumat.
Enjin gelintar semakin berkembang saiz, keberkesanan, persembahan danm pelbagai jenis perkhidmatan yang ditawarkan. • Model di sebalik enjin gelintar menjalankan tugasnya dengan memproses maklumat dalam satu koleksi dokumen dan kemudian menghasilkan satu indeks. • Proses seterusnya yang terlibat semasa mencari maklumat dengan enjin gelintar ialah menyingkirkan perkataan yang tidak perlu, mencantumkan perkataan dengan menggunakan “Thesaurus” dan juga skema pemberat perkataan yang digunakan. • Agen membahagikan kueri yang banyak ke pelbagai enjin gelintar yang lain untuk menambahkan keberkesanan enjin gelintar dan teknik ini dinamakan “Meta-search”.
Terdapat pelbagai jenis agen web iaitu i) Citeseer- Satu agen yang bertindak dengan sendiri sebagai web agen secara auto mobile mencari dan mencapai maklumat. ii) Ahoy- Satu agen bertindak sebagai “Homepages finder” yang bergantung kepada “Meta-search” enjin. iii) Webfind- Satu agen yang bertindak sebagai pencari lokasi berkenaan kertas sainstifik tetapi ia bergantung kepada pelbagai jenis infomasi “Repository”. • Terdapat pelbagai agen kelas direka untuk mempelajari keperluan pengguna daripada “Browsing”. • Teknik “Approach and methods” yang telah diaplikasikan ke dalam pembangunan populasi agen informasi “InfoSpiders”.
Agen ini berinteraksi dengan persekitaran maklumat di mana ia terdiri daripada koleksi rangkaian yang sebenar dan datanya disimpan dalam cakera tempatan. • Contohnya: data “Feedback” berkaitan dan “Cache file”. • Demi berinteraksi dengan persekitaran tersebut, pengguna mengakses data di klien tempatan (pencarian status terkini) dan di web. • Pengguna juga berinteraksi dengan melakukan pengaksesan berkaitan yang disimpan di tempat klien dan akan diakses oleh agen dan kemudiannya mereka melapor kepada pengguna. • Klien tiada interaksi secara langsung antara pengguna dan agen selepas penghantaran “query” dan “starting points”. • Prototaip “Infospiders” berlancar di UNIX dan MacOS.
Antara muka web ini adalah berdasarkan kepada perpustakaan W3C . • Agen menggunakan alat pencarian maklumat seperti filter(penapis) untuk masalah ”noise words” dan “stemmer based” (pencantas) pada alkhwarizmi Porter. • Alat ini manyimpan perwakilan oleh dokumen yang dicapai di dalam mesin klien. • Setipan dokumen diwakili oleh suatu senarai “link” cantasan kata kunci. • Jika kandungan “cache” bagi dalaman mencapai satu tahap, strategi penggantian “LRU (Least Recently Used)” digunakan.
Di dalam tajuk ini membincangkan had skala oleh suatu enjin gelintar dan mencadangkan satu penyelesaian bergantung kepada populasi dari agen infomasi. • Persaingan antara “Human Browser” dan “Infospiders” akan wujud dalam proses pencarian maklumat. • Apabila “New Page” sudah dicipta, purata masa akan diambil kira sehingga maklumat yang dikehendaki dapat dicari, pada masa ini kita dapat membandingkan purata masa untuk mencari maklumat dengan menggunakan “InfoSpiders”.
Perkembangan dan kemajuan “InfoSpiders” yang berlanjutan akan mewujudkan ia sebagai maklumat penting pada masa hadapan. • Pengguna seharusnya bergantung kepada agen persendirian dalam kemajuan kekompleksan maklumat web. • Agen akan mengubahkan medan di antara kepintaran dan dunia kita. • Berharaplah kita dapat mewujudkan masa dan kebolehan kognitif yang lebih baik.