210 likes | 418 Views
بهنام خدا مقابله با سرقت ادبی راهکارهای نرم افزاری امیر پارسی تیرماه 1393 پژوهشگاه علوم و فناوری اطلاعات ایران.
E N D
بهنام خدامقابله با سرقت ادبی راهکارهای نرم افزاریامیر پارسیتیرماه 1393پژوهشگاه علوم و فناوری اطلاعات ایران
ای همه هستی ز تو پیدا شده خاک ضعیف از تو توانا شدههر که نه گویای تو خاموش به هر که نه یا دتو، فراموش به
تعریف سرقت ادبی به عملی گفته میشود که طی آن، شخص کار یا ایدۀ شخص دیگری را به نام خود مطرح میکند.استفادۀ گسترده از کامپیوتر و گسترش اینترنت سبب شده که این کار بسیار سادهتر انجام شود.گر چه این عمل بیشتر در کارهای علمی، مقالات و گزارشها اتفاق میافتد اما تقریباً در هر حوزهای مثل طرحهای هنری و کد برنامههای کامپیوتری هم ممکن است اتفاق بیفتد.
تشابهیابی چیست؟ تشابهیابی به فرآیند کشف و نمایش بخشهای سرقت شده در یک کار یا مدرک اطلاق میشود.
تشابهیابی در متن • در روش اول، متن مورد نظر را با متون مرجع (که نوعاً در پایگاههای اطلاعاتی قرار دارند) مقایسه میکنند. • در روش دوم، با تحلیل متن و بدون مقایسه این کار انجام میشود (تحلیل شیوهی نوشتار نویسنده). برای تشخیص تشابههای متنی، دو روش شناختهشده وجود دارد:
روشهای تشابهیابی در متن با روش مقایسه: • کپی دقیق • بازنویسی • ترجمه
منابع مرجع • پایگاههای اطلاعاتی داخلی • اینترنت (مثل ایرانداک و ...) • پایگاههای اطلاعاتی ساماندهیشدة خارج از کشور (الزویر، اسکوپوس و ...)
نرم افزارهای خارجی تحت عنوان کلی Plagiarism Checker • رایگان اما محدود/با هزینه • نوع مدرک • برخط/ گسسته • میزان امکانات • ...
نرم افزارهای خارجی - مزایا • کیفیت سرویس دهی • دقت • سرعت • سرویس های متنوع • بی نیاز کردن ما از هزینه های طراحی • دسترسی به منابع خارجی
نرم افزارهای خارجی - معایب • عدم دسترسی به منابع داخلی • متون • اصطلاحنامه ها و سایر ابزارهای تحلیل در زبانشناسی فارسی • نادیده گرفتن ویژگی های زبان فارسی • عدم اطمینان به آنها در سرقت مطالب و ایده های نو (مقالات، طرحهای پیشنهادی، ...) • عدم اطمینان به آنها در شرکت در تحریم ها علیه ایران
نرم افزارهای خارجی – معایب (ادامه) • فراهم شدن زمینه برای جاسوسی علمی • نبود امکان توسعه با گسترش نیازهای کشور
نرم افزارهای داخلی– محاسن • آنچه معایب سیستمهای خارجی محسوب میشد، محاسن نرم افزارهای داخلی است.
نرم افزارهای داخلی– معایب • به طور جدی راه اندازی نشده اند. • از بلوغ کافی برخوردار نیستند. • هم در ویژگی های کارکردی • هم در ویژگی های غیرکارکردی • برای دسترسی به برخی منابع خارجی، با قدری مشکل مواجهاند. • تعدادشان چندان قابل توجه نیست. بنابراین گزینههای چندانی پیش رو نیست.
نرم افزارهای داخلی– معایب (ادامه) • در دسترسی به منابع، با انواع مختلف فیلترینگ روبرو هستند. • با کمبود منابع مالی و غیر آن روبرو هستند. • فرهنگ سازی • کمبود منابع مالی بخش خصوصی برای توسعه • با مشکلاتی که دیگر نرم افزارها در سطح کشور با آنها مواجهند، روبرو هستند. از جمله کپی رایت.
محدودیت هایی که هر دو گروه با آنها مواجهند • منابع داخلی سامان یافته نیستند. • به دلیل کاربرد کدپیج های متنوع فارسی، جستجو در برخی منابع مثل فایل های PDF که مورد استفاده هستند، با دشواری روبروست. • حجم قابل توجهی از منابع با فرمت های دیگر هستند. مثلا زرنگار، ... • بخشی از منابع به صورت اسکن شده هستند که تبدیل آنها به متن و نهایتا تحلیل آنها، به سادگی میسر نیست.
آنچه در ایرانداک انجام شده است: • تشابهیابی در متن به روش کپی دقیقدر اینترنت و پایگاه داخلی ایرانداک • و امکان استفاده از پایگاههای اطلاعاتی دیگر در سراسر کشور در صورت همکاری سازمان های دارنده اطلاعات • نصب سیستم بر روی شبکه وب، به صورت آزمایشی
محدودیتها • فعلا فقط چکیدهها، و البته بهزودی در: • متن کامل پایاننامههایی که به شکل فایل ورد ارسال شده اند. • مقالات و منابع خارجی داوری شده • سرویس استفاده از اینترنت، گر چه مراحل تست را پشت سر گذاشته اما پس از خرید این سرویس از منابع خارجی، قابل استفاده توسط همگان خواهد بود.
آنچه باید انجام شود: • کوتاهمدت • افزودن متن پایاننامه • عقد قرارداد با پایگاههای خارجی برای استفاده از آنها بهعنوان مرجع • استفاده از اصطلاحنامههای طراحیشده در ایرانداک در الگوریتمهای بازنویسی • توسعه روز افزون منابع به شکل رایگان یا غیر آن • بلندمدت • حرکت بهسوی تمامی زمینههای پیش گفته