270 likes | 437 Views
شیوه موثر جستجو در منابع اطلاعاتی (اینترنت). حسن بشيري دانشگاه صنعتی همدان مهرماه 92. رئوس مطالب. اهمیت اطلاعات یافتن اطلاع در کتاب چگونه موتورهای جستجو کار می کنند معرفی گوگل و نحوه جستجو موثر در آن معرفی چند ابزار جستجو معرفی نرم افزار googldesktop و everything. نياز اطلاعاتي.
E N D
شیوه موثر جستجو در منابع اطلاعاتی (اینترنت) حسن بشيري دانشگاه صنعتی همدان مهرماه 92
رئوس مطالب • اهمیت اطلاعات • یافتن اطلاع در کتاب • چگونه موتورهای جستجو کار می کنند • معرفی گوگل و نحوه جستجو موثر در آن • معرفی چند ابزار جستجو • معرفی نرم افزار googldesktop و everything
نياز اطلاعاتي • چرا ما به دنبال يافتن اطلاعات هستيم؟ • پارادايم حاکم بر نظام جهان انرژي اطلاعات ] [ [ ] اطلاعات مفيد زمان انرژي زمان بيشينه کردن بيشينه کردن
يافتن اطلاع در کتاب • مطالعه همه كتاب • مراجعه به فهرست • استفاده از نمايه • كليد واژههاي به كار رفته در كتاب • يافتن اطلاعات در دنياي عظيم اطلاعاتي وب ؟
اطلاعات در وب • اطلاعات متني • بيشترين حجم اطلاعات وب • اطلاعات تصويري (image) • اطلاعات چند رسانهاي (Multimedia)
يافتن اطلاعات در اينترنت • از قبل بدانيم كه اطلاعات مورد نظر در چه آدرسي قرار دارند! • کتابهای زرد (Yellow Pages) • آدرس سايتهاي مرتبط با موضوع را بدانيم و از طریق دنبال کردن لینک آنها امیدوار به یافتن اطلاع باشیم. • از ابزارهايي كه براي يافتن اطلاعات تهيه شدهاند استفاده كنيم. اين ابزارها همان موتورهاي جستجو هستند. آمارها نشان ميدهد كه بيش از 80% كاربران براي يافتن اطلاعات خود به محض اتصال به اينترنت از موتورهاي جستجو استفاده ميكنند.
اینترنت چقدر بزرگ است؟ • "The Web holds about a trillion pages. The human brain holds about 100 billion neurons," Kelly writes in his 2010 book "What Technology Wants" • گروه World Wide Web Foundationبه رهبری TimBerners-Lee و حمایت 1 میلیون دلاری شرکت گوگل برای یافتن دقیق بزرگی اینترنت پژوهشی را آغاز کردهاند. • اما چند آمار ارائه شده تا کنون ...
اینترنت چقدر بزرگ است؟ (آمار سال 2012) • 2.2 billion – Number of email users worldwide. • 144 billion – Total email traffic per day worldwide. • 634 million – Number of websites (December). • 51 million – Number of websites added during the year. • 246 million – Number of domain name registrations across all top-level domains. • 2.4 billion – Number of Internet users worldwide. • 1.2 trillion – Number of searches on Google in 2012.
موتورهاي جستجو چگونه كار ميكنند؟ • درخواست كاربر در موتور جستجو (Query) • در حالت ايدهآل كاربر ميخواهد سوال بپرسد. • به دنبال اطلاع خاصي است. (Question Answering) • موتورهاي جستجو قادر به پاسخ دادن سوال نيستند. • موتورهاي جستجو مستنداتي (Document) را به كاربر برميگردانند كه با استفاده از تكنيكهايي حدس زدهاند به موضوع مورد درخواست كاربر نزديكتر است. • اين موتورهاي جستجو بايد بدانند كه هر صفحه وب راجع به چه چيزي صحبت ميكند!!
رتبه بندي نتايج (Ranking) • موتورهاي جستجو تقريبا هميشه بيش از يك نتيجه بر ميگردانند. • چقدر از صحت اطلاعات برگشتي اطمينان داشته باشيم؟ • آگاهي به سيستم رتبهبندي موتور جستجو • روي نتايجي تكيه كنيم كه از سايتهاي معتبر برگشت داده ميشوند. • از موتورهاي جستجو براي يافتن اطلاعات در سايتهاي معتبر استفاده كنيم.
تاريخچه • دلايل استفاده از Google به عنوان موتور جستجوگر برتر • ايندكس كردن بيشترين صفحات وب • سيستم رتبهبندي نتايج (رايگيري يا محبويت سايت) • انعطاف بالا در عمل جستجو • جستجو روي فايلهاي مختلف (.pdf, .ppt, .xls, .html .doc, …) • جستجو روي تصاوير، اخبار، آدرس و شماره تلفن افراد (US) • استفاده از Spell checker • بیش از 5 میلیارد جستجو در روز (آمار سال 2012) • استفاده از طبقهبندي موضوعي
ورود پرسوجو به صورت منطقي است. (AND, OR) • وظيفه كاربر است كه كلمات كليدي را مناسب انتخاب كند. • كاربر تا جاي ممكن بايد با استفاده از كلمات رزرو شده دامنه جستجو را محدود كند. • چگونه دامنه جستجو را محدود كنيم؟ • كاربران معمولا در هر جستجو تنها تا دو سطح (2 صفحه 10تايي) پيش ميروند!
تعداد صفحات نمایه شده توسط Google منبع از: www.worldwidewebsize.com
آمارهایی از گوگل منبع از: www.worldwidewebsize.com
محدود كردن دامنه جستجو • ساختن عبارت با “ “ research method “research method” • استفاده شده در عنوان با كلمات كليدي allintitle: و intitle: allintitle:research method intitle:researchmethod
محدود كردن دامنه جستجو • به همراه نداشتن برخي كلمات با – (علامت منها) research method -qualitative • جستجو در يك سايت خاص باsite: site:profs.hut.ac.ir/~bashiri site:profs.hut.ac.ir/~bashiriallintitle:“research method” • كلمات كليدي OR و AND research ANDmethod research ORmethod
محدود كردن دامنه جستجو • معني + در query +new +methods +in “reverse engineering” • مشخص كردن نوع فايل با filetype: “research method” filetype:pdf • inurl: و allinurl: inurl:researchmethod allinurl:researchmethod • spell: spell:researchmethed
آيا موتورهاي جستجو همه اطلاعات وب را در اختيار دارند؟ • Googleبا بيشترين صفحات ايندكس شده تنها بخشي از وب را ايندكس كرده است! • بطور متوسط در هر دقيقه 25 صفحه به اينترنت اضافه ميشود. • مساله hidden web!! • برخي از سايتها سرويسهاي داخلي فراهم ميكنند كه تنها به اعضاي گروه سرويس ميدهند. • ساختارها و پروتکولهاي تعريف شده در جستجو • Robot.txt • فراموش نكنيم كه وب بزرگترين منبع اطلاعاتي است و استفاده صحيح آن موجب صرفهجويي در زمان و دسترسي به اطلاعات مورد نياز براي دانستن است.
مثال • برای تغییرات اجتماعی بازی به نامه بازی سرکار طراحی شده است. راجع به این بازی چیز زیادی نمی دانیم اما شنیده ایم که این بازی در استرالیا طراحی شده است و ربطی به سرکار ندارد. تنها به دلیل احترامی که برای سرکار عارف هندی قائل هستند، نام بازی را سرکار گذاشتهاند. • نتیجه • جستجو یک فرایند یادگیر – تکراری است که باید در هر مرحله تکرار شود. • کار با دنیای عظیم اطلاعات و سازماندهی اطلاعات یک مهارت است
Meta Search Tools... Search using multiple search engines Search using a meta search tool
Meta Search Tools... • Meta search tools (remote sites): • MetaCrawler (www.metacrawler.com) • Ixquick (www.ixquick.com) • Dogpile (www.dogpile.com) • ProFusion (www.profusion.com) • Meta search tools (local, installable software): • Copernic (www.copernic.com) • SearchPad (www.searchpad.com) • LexiBot (www.completeplanet.com)
بهتر بيابيم! نرمافزارهاي Peer to Peer eMule Shareaza Kaza Torrent - Bittorrent معرفي وب سايت gigapedia.org(http://library.nu/) avexhome.ws rapidshare.com 4shared.com en.bookfi.org sciencedirect • تمثیل «یار در خانه و ما گرد جهان میگردیم ... • معرفی نرم افزار googledesktop • معرفی نرم افزار everything