310 likes | 544 Views
Basics of Modeling اصول مدلسازی. بابک اعرابی دانشکده مهندسی برق و کامپیوتر، دانشگاه تهران پژوهشکده علوم شناختی، پژوهشگاه دانشهای بنیادی. Workshop on Cognitive Science & Cognitive Modeling دوشنبه 1 شهریور 1393 – ساعت 3 تا 5. مدلسازی چیست؟. برخورد انسان با پدیده های طبیعی مشاهده
E N D
Basics of Modelingاصول مدلسازی بابک اعرابی دانشکده مهندسی برق و کامپیوتر، دانشگاه تهران پژوهشکده علوم شناختی، پژوهشگاه دانشهای بنیادی Workshop on Cognitive Science & Cognitive Modeling دوشنبه 1 شهریور 1393 – ساعت 3 تا 5
مدلسازی چیست؟ • برخورد انسان با پدیده های طبیعی • مشاهده • اندازه گیری (کمی سازی) • تلاش برای برقراری روابط این-همانی • دسته بندی • انتزاع
انتزاع • ساده نیست! • دو اسب و دو درخت هر دو مصداق هایی از عدد دو هستند • انتزاع مفهوم عدد دو • دو درخت و سه درخت و چهار درخت هر سه بیانگر تعدادی درخت هستند • انتزاع مفهوم درخت
مدل سازی نوعی انتزاع است • حرکت از جزء به کل • مشاهدات و اندازه گیری های جزئی • بیان/انتزاع روابط بین کمیت های اندازه گیری شده • توگویی که روابط انتزاع شده در توصیف پدیده مورد مطالعه محدود به مشاهدات نیستند • مسیری استقرائی • استقراء تجربی نه استقراء ریاضی که نوعی قیاس است
آیا حرکت از جزء به کل ممکن است؟ • نه! • مگر در قالب قیدها • مثلا نوعی هموار بودن در رفتار تابع • گاه قید اعمال شده واضح نیست (Implicit) • گاه آنقدر به اعمال قید عادت کرده ایم که آن را نمی بینیم • اهمیت حیاتی دارد که در هر فرایند مدل سازی قید هایی که حرکت از جزء به کل را ممکن کرده اند بشناسیم • انتزاع نه فقط در چارچوب مشاهدات که در چارچوب مجموعه مشاهدات و اندازه گیری ها و قیدها و فرضیات انجام می شود
مدل سازی و نظریه سیستم ها • نگرش سیستمی دید حاکم بر نحوه توصیف پدیده ها است محیط پدیده مورد مطالعه • انگار می توان پدیده را از محیط جدا کرد و به مطالعه آن پرداخت
مدل سازی و نظریه سیستم ها • تعامل محیط با پدیده مورد مطالعه از طریق تعدادی معدود کمیت قابل مشاهده و اندازه گیری • ورودی ها: کمیت های محیطی موثر در رفتار پدیده • خروجی ها: نحوه تاثیر پدیده بر محیط • نوعی فرض علیت بر این توصیف حاکم است • مدل سازی در مورد پدیده های غیر علی حرف نمی زند
مدل سازی و نظریه سیستم ها • آیا همواره می توان پدیده مورد مطالعه را از محیط جدا کرد؟ • آیا همواره می توان تعامل پدیده مورد مطالعه و محیط را محدود به تعدادی ورودی و خروجی مشخص کرد؟ • آیا همیشه همه عوامل موثر بر یک پدیده را می شناسیم؟ • آیا همه عوامل موثر بر یک پدیده تحت کنترل ماست؟ • آیا رابطه علی بین ورودی و خروجی ها قابل اثبات است؟ • نایقینی و مدلسازی
مدل سازی و نظریه سیستم ها • برای آنکه به یک تعبیر عملیاتی برسیم که امکان محاسبه را به ما بدهد توافق می کنیم سیستم ورودی ها خروجی ها ورودی های ناشناخته محیط
مدل محاسباتی • تعدادی معادلات و روابط ریاضی که ارتباط بین ورودی و خروجی ها را بصورت کمی بیان می کند • با کمیت های نه تنها قابل مشاهده که قابل اندازه گیری سر و کار داریم • مدل توصیفی در مقابل مدل محاسباتی • سنت غالب در علوم شناختی مانند علوم انسانی، علوم اجتماعی، علوم پزشکی، و اقتصاد مدل سازی توصیفی بوده است • حرکت به سمت کمی سازی: فرصت ها و تهدیدها • مدل هایی با امکان توصیف کمی و کیفی در کنار هم و نایقینی
آیا مدل همان سیستم است؟ • این آرزوی ماست • نایقینی مدل خروجی مدل سیستم ورودی ها خروجی سیستم محیط ورودی های ناشناخته 12
رویکردهای متداول در مدل سازی • جعبه سفید امکان مطالعه اجزای سیستم و نحوه تعامل آنها شکاندن سیستم به اجزاء غیر قابل تجزیه بیشتر نگرش غالب از قدیم تا نیمه قرن بیستم • جعبه سیاه امکان مشاهده ورودی و خروجی های سیستم عدم امکان مشاهده و درک داخل سیستم نگرش عمدتا توسعه یافته با ابزارهای محاسباتی • جعبه خاکستری راه واقعا موثر
تقسیم بندی سیستم ها / مدل ها • دینامیکی / ایستا • خطی / غیر خطی • متغیر با زمان / نامتغیر با زمان • تصادفی / معین • ایستان / غیر ایستان • علی / غیرعلی • آیا لزوما مدل و سیستم باید از یک جنس باشند؟
هدف از مدل سازی • پیش بینی • کنترل • بازیابی گذشته (فیلترکردن) • شبیه سازی و تحلیل فرآیند • رفتاری • ساختاری • تشخیص خطا • هدف از مدل سازی در روند مدل سازی تاثیر مستقیم دارد • مدلی که برای تمام اهداف خوب باشد نداریم
مدل خوب چه مدلی است؟ • جواب به این سوال ساده نیست! • به هدف از مدل سازی وابسته است • یک جواب نسبتا معقول و مقبول و کمی ایده آل: مدلی که خروجی آن برای ورودی ها و شرایط مختلف محیط و سیستم مشابه خروجی سیستم باشد. (نگاه رفتارگرا با درنظر گرفتن ملاحظات ساختاری) • معمولا محدوده ای ورودی ها و شرایط محیط و سیستم مد نظر است. در آن محدوده ارزیابی می کنیم • مدل سازی بدون ارزیابی ارزشی ندارد آزمون پذیری، ابطال پذیری، و حوزه علوم تجربی
شناسایی سیستم ها • مدل سازی داده-محور (Data driven) • از جنس جعبه سیاه یا جعبه خاکستری • مدل سازی جعبه سفید نیاز به دانش حوزه فراوان داردکمتر روش های عمومی دارد • توصیف کلاسیک منصوب به زاده 1962 • توسعه اصلی همگام با ابزارهای محاسباتی ار 1970 به بعد
شناسایی سیستم ها Identification System Equivalence Family of Models • Data Driven • Fitness function • Parametric Models • Optimization Too Large Family Too small Family Black box & Structure
شناسایی سیستم ها • داده های ورودی خروجی بجای سیستم • خانواده مدل پارامتری • ملاک برازش بجای ملاک این همانی • حل مسئله بهینه سازی در فضای پارامتری • به این ترتیب مسئله زمینی و حل پذیر شده است
ورودی های مدل چه باشد؟ • انتخاب ورودی از یک بستر بزرگ • تحلیل همبستگی • تحلیل اطلاعات متقابل • تعداد ورودی زیاد • تعداد ورودی کم • ورودی های ناشناحته • Disturbance • نایقینی و مدل سازی
انتخاب خانواده مدل • نه خیلی بزرگ • نه خیلی کوچک • مسئله مهم تعمیم پذیری • تناسب پیچیدگی داده ها با میزان انعطاف خانواده مدل • شناسایی ساختار و شناسایی پارامتر • نیاز به دانش حوزه در انتخاب خانواده مدل و شناسایی ساختار
چند خانواده مدل مهم • مدل رگرسیون خطی • مدل های خطی دینامیکی مبتنی بر رگرسیون خطی • مدل های غیرخطی دینامیکی مبتنی بر رگرسیون خطی • مدل های غیرخطی ایستا و دینامیکی • مدل های خطی-محلی • مدل های شبکه عصبی • مدل های فازی • مدل های فازی-عصبی • مدل های فازی-تصادفی
دینامیک کجا ها وارد شود؟ • رگرسیون روی ورودی • رگرسیون روی خروجی • دینامیک مرتبه چند باشد؟ • آیا همه دینامیک ها لازم است؟ • مسئله تاخیر
شناسایی ساختار • محدود کننده خانواده مدل است • معنی ساختار در رگرسیون خطی • معنی ساختار در شبکه عصبی • معنی ساختار در سیستم فازی • پرهزینه! نیاز به تکرار شناسایی پارامترها • بسیار موثر در کیفیت تعمیم پذیری مدل
مسئله تعمیم پذیری • مدل قرار نیست فقط برای داده هایی که در توصیف سیستم استفاده شده اند ”خوب“ باشد • ارزیابی مدل از منظر تعمیم پذیری • تقسیم داده ها داده های آموزش و آزمون (و ارزیابی) • Bias Variance trade off • Regularization • حالا چه مدلی خوب است؟ • عدم حساسیت نزدیک ساختار بهینه • سادگی مدل و اصل خست!
شناسایی پارامتر • سیستماتیک ترین بخش کار • روش های جستجو در فضای پارامتری • روش های بهینه سازی • روش های بهینه سازی مبتنی بر گرادیان • جستجوی محلی در مقابل جستجوی سراسری • مسئله هزینه جستجو
انتخاب داده های ورودی • همیشه ممکن نیست! • اگر ممکن بود آزمایش طراحی کنید • ضربه • پله • سینوسی • White Noise • PRBS amplitude modulation • Chirp amplitude modulation
انواع داده ها • عددی • عددی با نایقینی • توصیفی و کلامی • داده های نا موجود • مدل هایی که توان حمل نایقینی دارند • مدل هایی که توان کار با Hybrid Data دارند
نکات نهایی • مدل سازی یک فرایند اتوماتیک نیست • مدل سازی داده محور با نیم نگاهی به دانش حوزه • اگر امکان مدل سازی جعبه سفید وجود دارد، انجام دهید • سادگی و خست اصول محوری • مدل های محاسباتی مرکز توجه در مدل سازی شناختی • ارزیابی مدل مهم تر از مدل سازی است • قابلیت تعمیم پذیری کلمه کلیدی در ارزیابی • قابلیت حمل نایقینی کلمه کلیدی در انتخاب خانواده مدل
از توجه شما متشکرم