730 likes | 999 Views
- به نام خدا - ( سمینار درس کنترل پیش بین). کاربرد شبکه های عصبی در کنترل پیش بین استادمحترم : جناب آقای دکترتوحیدخواه تهیه کننده : حمیدرضا ایرانمنش دی ماه 1390. مروری بر مطالب در یک نگاه. مقدمه ای بر کاربرد شبکه های عصبی در کنترل پیش بین
E N D
- به نام خدا - (سمینار درس کنترل پیش بین) کاربرد شبکه های عصبی در کنترل پیش بین استادمحترم : جناب آقای دکترتوحیدخواه تهیه کننده : حمیدرضا ایرانمنش دی ماه 1390
مروری بر مطالب در یک نگاه • مقدمه ای بر کاربرد شبکه های عصبی در کنترل پیش بین • بخش اول : یک مدل پیش بین غیرخطی براساس شبکه عصبی BP • تعاریف و مفاهیم • ساختار مدل پیش بین • شبیه سازی مدل پیش بین غیرخطی • بخش دوم : جبرانسازی کامل جهت تاخیر زمانی در سیستم کنترل تحت شبکه • براساس GPC و شبکه عصبی BP • مدهای پاسخ • استراتژی صف • مدل سیستم کنترل تحت شبکه • قوانین پایه • جبرانسازی تاخیر کنترل کننده - به – محرک • جبرانسازی جهت تاخیر سنسور – به – کنترل کننده • محاسبه مقدار پیش بینی خطا در شبکه عصبی پس انتشار • آزمایش شبیه سازی جهت جبران سازی تاخیر NCS • نتیجه گیری • مراجع
مقدمه ای بر کاربرد شبکه های عصبیدر کنترل پیش بین • کنترل پیش بین مدل به دلیل تاثیر کنترلی بسیار مناسب , به طور گسترده ای در فرآیندهای صنعتی به کار گرفته شده است. • شبکه های عصبی مصنوعی دارای توانایی بسیار خوبی در انطباق با خواص غیرخطی می باشند همچنین می توان از قابلیت یادگیری و انعطاف پذیری این شبکه ها در جهت اهداف مختلف استفاده نمود. • در بین همه انواع شبکه های عصبی , شبکه عصبی BP دارای ساختاری ساده و الگوریتم آموزش جامع و کاملی است. • از مزایای شبکه های عصبی در جهت بهبود عملکرد کنترل پیش بین استفاده می شود که در این تحقیق به دو کاربرد مهم آن پرداخته می شود.
نمونه کلی از کاربرد شبکه های عصبی در MPC اجزاء مورد نیاز : • مدل شبکه عصبی سیستم تحت کنترل • کنترل کننده شبکه عصبی • تابع عملکرد جهت ارزیابی پاسخهای سیستم • روند بهینه سازی برای انتخاب بهترین ورودی کنترل • کنترل کننده شبکه عصبی یاد می گیرد که ورودی انتخاب شده توسط فرآیند بهینه سازی را تولید کند. • وقتی آموزش کامل شود مرحله بهینه سازی می تواند کاملاً توسط کنترل کننده شبکه عصبی جایگزین شود.
بخش اول : مدل پیش بین غیرخطی براساس شبکه عصبی BP
تقسیم بندی کنترل پیش بین یک کنترل کننده پیش بین مدل از سه قسمت مهم تشکیل شده است : • الف) مدل پیش بین • ب) بهینه سازی افق لغزان • ج) تصحیح فیدبک کنترل پیش بین مدل : • کنترل پیش بین مدل خطی (LMPC) • کنترل پیش بین مدل غیرخطی (NMPC).
LMPCبرای سیستمهای غیرخطی • می توان یک سیستم کنترل ثابت را در اطراف نقطه تنظیم به گونه ای خطی سازی نمود که LMPCنتایج کنترلی خوبی داشته باشد. • اما برای یک سیستم با خواص غیرخطی قوی LMPCقابل انطباق نیست. • در این حالت باید یک مدل پیش بین غیرخطی ایجاد نماییم.
NMPC • MPCکلاسیک که بر اساس مدلهای خطی پیش بین می باشد فاقد شرایط لازم برای سیستمهای کنترل غیرخطی قوی می باشد. • در این حالتها NMPCبایستی به خدمت گرفته شود. • مدل پیش بین غیرخطی پایه و اساس NMPCاست و در ابتدا باید ایجاد شود.
مدلهای غیرخطی • تعداد زیادی از مدلهای غیرخطی جهت توصیف سیستمهای غیرخطی در حدود 40 سال گذشته ارائه شده است. • در بین این متدها مدل زیر که یک مدل ورودی-خروجی عالی است استفاده شده استکه تقریباً همه مدلهای غیرخطی دیگر را پوشش می دهد : NONLINEAR AUTOREGRESSIVE MOVING AVERAGE WITHEXOGENOUS INPUTS (NARMAX)
NARMAX • فرض کنید مدل NARMAXیک سیستم غیرخطی تک ورودی- تک خروجی SISOبه صورت زیر باشد : • u : ورودی سیستم غیرخطی e: نویز سفید گوسی با میانگین صفر • y: خروجی سیستم غیرخطی f: رابطه نگاشت ورودی –خروجی • nu: مرتبه ورودی مدل ny: مرتبه خروجی مدل
NARMAX • اگر از اثر نویز سفید گوسی صرفنظر شود. فرمول مربوطه به صورت زیر ساده می شود : • این فرمول یک مدل پیش بین یک مرحله ای سیستم غیرخطی تک ورودی- تک خروجی است.
one-step predictive model based on BP neural network اگر اطلاعات گذشته و رخ داده ورودی u(k),u(k-1),…,u(k-nu+1) و اطلاعات گذشته و رخ داده خروجی y(k),y(k-1),…,y(k- ny+1) به عنوان بردار ورودی یک شبکه عصبی BP و آخرین اطلاعات خروجی y(k+1) به عنوان بردار خروجی شبکه عصبی BP استفاده شود آنگاه یک مدل پیش بین تک گامی براساس شبکه عصبی BP می تواند تشکیل شود.
طرح اولیه مدل پیش بین گام اول براساس شبکه عصبی BP ym(k+1) خروجی پیش بین یک سیستم غیرخطی در k+1است.
one-step predictive model based on BP neural network • فرمول زیر بیان ریاضی مدل پیش بین گام اول براساس شبکه عصبی BPاست: • FNN رابطه نگاشت غیرخطی و P(k)بردار ورودی مدل پیش بین است.
تقریب سیستم غیرخطی • ثابت می شود که یک شبکه عصبی دو لایه پس انتشار که نرونهای لایه پنهانش از تابع انتقال tan-sigmoidو نرونهای لایه خروجی اش از تابع انتقال pure linearity استفاده می کنند , می تواند تقریباً برای همه سیستمهای غیرخطی مناسب باشد به شرط اینکه تعداد نرونهای لایه پنهان به اندازه کافی بالا باشند. • این در یک واقع یک شبکه عصبی پس انتشار دو لایه ای است که می تواند جهت تشکیل مدل پیش بین تک گامی غیرخطی انتخاب شود.
مشخصات شبکه طول گام پیش بینی برابر با یک می باشد پس یک شبکه عصبی پس انتشار دولایه با یک نرون خروجی می تواند به عنوان مدل پیش بین یک سیستم تک ورودی- تک خروجی استفاده شود. • : تابع انتقال نرونهای لایه پنهان که از نوع Tan-Sigmoidبوده و به فرم زیر است : • : تابع انتقال نرون خروجی است که به صورت خطی خالص می باشد :
ساختار مدل پیش بین گام اول براساس شبکه عصبی پس انتشار دو لایه
ابعاد شبکه عصبی • وقتی یک شبکه عصبی پس انتشار دو لایه به عنوان مدل پیش بین غیرخطی استفاده می شود , ابعاد بردار ورودی و بردار خروجی توسط سیستم غیرخطی مشخص می شود. • اما تعداد نرونهای لایه پنهان بایستی توسط کاربر تعیین شوند. • اگر این عدد خیلی بزرگ باشد زمان شناسایی مدل پیش بین افزایش می یابد • در طرف مقابل اگر تعداد نرونهای لایه پنهان خیلی کوچک باشد دقت مدل پیش بین را کم کرده و باعث اثر کنترلی ضعیف کنترل کننده پیش بین غیرخطی می شود. • بنابراین نحوه تعیین منطقی نرونهای لایه پنهان برای ساختار مدل پیش بین بسیار حائز اهمیت است.
نگاشت ساختاری یک شبکه عصبی پس انتشار دو لایه
وزنها و بایاسها هدف آموزش شبکه عصبی پس انتشار : تعیین و انتخاب مجموعه ای از وزنها و بایاس هاست که با حداقل نمودن متوسط مربعات خطای بین خروجیهای شبکه عصبی و خروجیهای واقعی برای چند نمونه آموزشی حاصل می شود. فرض کنیم تعداد نمونه های آموزشی ntباشد. Z : برداری که ترکیب شده از وزنها و بایاسهاست با اندازه n اصل الگوریتم پس انتشار پیدا کردن یک بردار برای حداقل کردن می باشد
(10) بسط برداری :tijنشان دهنده المانهای jام بردار خروجی در نمونه آموزشی iام : yij(z)نمایانگر مقدار خروجی نرونjام در لایه خروجی وقتی نمونه آموزشی iام روی شبکه اعمال شده است , می باشد.
پاسخ ایده الجهت یافتن تعداد مناسب نرونهای لایه پنهان • در حالت ایده ال یک بردار z*می تواند یافت شود که فرمول زیر را برآورده سازد : به طوری که بردار z* بایستی مجموعه معادلات زیر را ارضاء نماید :
حل معادلات • تعداد کل معادلات : • n<num : تعداد متغیرها کوچکتر از تعداد معادلات است. مجموعه معادلات متناقض بوده به دلیل عدم وابستگی نمونه های آموزشی , معادلات مذکور جوابی ندارند. • n=num : تعداد متغیرها مساوی تعداد معادلات است. به احتمال زیاد یک بردار یافت می شود که معادلات را برآورده سازد. سپس یک تعداد مرجع برای نرونهای لایه پنهان می توان از این شرط استنباط نمود. • n>num: تعداد متغیرها بزرگتر از تعداد معادلات است آنگاه مجموعه معادلات ممکن است دارای چند جواب باشد.
تعداد نرونهای لایه پنهان • فرمول زیر می تواند از معادله n=numاستخراج شود تا یک داده مرجع با تعداد نرونهای لایه پنهان در شبکه عصبی پس انتشار دو لایه فراهم شود : : اندازه بردار ورودی R S2 • : تعداد نرونهای لایه خروجی S1 : تعداد نرونهای لایه پنهان
مثال شبیه سازی جهت اعتبار سنجی پیش بینی مدل تک گام براساس شبکه عصبی پس انتشار دولایه یک مثال شبیه سازی را بررسی می نماییم. فرض کنیم که مدل NARMAXیک سیستم غیرخطی SISOبه صورت زیر است : تعداد نمونه های آموزشی مساوی 100 است nt=100 مرتبه ورودی سیستم غیرخطی مساوی 2 و مرتبه خروجی 1 می باشد nu=2 و ny=1. R=nu+nyپس R=3.
تشکیل مدل پیش بین تعداد نرونهای لایه پنهان طبق می تواند در 20 تنظیم شود. بنابراین مدل پیش بین تک گام سیستم غیرخطی تشکیل می شود. الگوریتم Levenberg-Marquardtمی تواند جهت آموزش شبکه عصبی استفاده شود.
الگوریتم Levenberg-Marquardtجهت آموزش شبکه عصبی
مجموعه خروجی سیستم غیرخطی مجموعه نویز سفید گوسی • مقدار تابع هدف در پایان الگوریتم آموزش :
خروجی واقعی و خروجی پیش بین سیگنال سینوسی اعمال شده به سیستم غیرخطی و مدل پیش بین نتایج شبیه سازی نشان داد که مدل پیش بین یک گامی می تواند جهت توصیف مشخصات دینامیک آینده یک سیستم غیرخطی SISO استفاده شود.
بخش دوم : جبرانسازی تاخیر زمانی در سیستم کنترل تحت شبکه براساس GPC و شبکه عصبی BP
سیستم کنترل تحت شبکه • پیشرفتهای اخیر در مخابرات و فن آوریهای شبکه سازی باعث تشکیل سیستمهای پیچیده ای شده اند که حسگرها , محرکها و کنترل کننده هایشان به وسیله یک شبکه متصل می شوند. • چنین سیستمهایی سیستمهای کنترل تحت شبکه Networked Control System (NCS) نامیده شدند. در واقع حلقه بسته از طریق شبکه ارتباطی دیجیتال به اشتراک گذاشته شده با باند محدود متصل می شود.
مشخصاتNCS • مزایا : کاهش سیم کشی , هزینه کم , سهولت نگهداری و بررسی سیستم , انعطاف پذیری بالا و همچنین به اشتراک گذاشته شدن منابع اطلاعاتی • چالشها : باند محدود , حذف بسته داده یا packet dropout, نمونه برداری و تاخیر • تاخیر زمانی از مسائل مهم NCS است که درحین عبور اطلاعات از شبکه ایجاد خواهد شد و باعث افت عملکرد سیستم و یا حتی ناپایداری آن خواهد شد. با توجه به اهمیت موضوع روشهای مختلفی جهت حل این مسئله پیشنهاد شده است. • این سیستمها در واقع فصل مشترک تئوریهای کنترل و مخابرات و ارتباطات هستند و برای آنهایک آنالیز مشترک جهت طراحی و بهینه سازی سیستم مورد نیاز است.
Networked Control System دو نوع عمده تاخیر انتقال را در این سیستم کنترل تحت شبکه نشان می دهد : تاخیرکنترل کننده- به – محرک تاخیرسنسور- به – کنترل کننده
تعاریف و مفاهیم • سنسورهای clock-driven: از خروجیهای سیستم تحت کنترل در زمانهای نمونه برداری به صورت پریودیک نمونه برداری می کنند. • کنترل کننده event-driven:می تواند توسط یک مکانیزم وقفه اتفاق خارجی انجام شود و سیگنال کنترل را به محض اینکه داده سنسور وارد می شود, محاسبه می کند. • محرکهای clock-driven:ورودیهای سیستم تحت کنترل تا لحظه نمونه برداری تغییر نمی کنند.
مدهای پاسخ : sensor & actuatortime-drivencontroller :event-driven
استراتژی صف (QS) QueuingStrategy • این استراتژی مربوط به نحوه انتخاب ورودی برای محرک و کنترل کننده در NCS می باشدکه در اینجا برای محرک توضیح داده می شود. • فرض می کنیم هیچگونه خطای استثنایی (مانند حذف بسته یا بی نظمی در ورود سیگنال کنترل) وجود ندارد. • حالت اول ) : هیچ سیگنال جدیدی وارد نمی شود. وقتی تاخیر رخ می دهد محرک با استفاده از سیگنالهای کنترل پیش بین محاسبه شده از حالت قبلی به جای سیگنال کنترل فعلی که هنوز وارد محرک نشده است با تاخیر برخورد می کند.
استراتژی صف (QS) QueuingStrategy • حالت دوم) سیگنال جدید وارد می شود. جدیدترین سیگنال کنترل بالاترین اولویت را برای اینکه ورودی سیستم تحت کنترل باشد دارد. در نتیجه المان جدیدترین سیگنال کنترل باید انتخاب شود. برای مثال زمان t را در نظر بگیرید. فرض کنید جدیدترین سیگنال کنترل Ut-2 براساس حالت در زمان t-2 است. Ut-2[2] باید به عنوان ورودی سیستم تحت کنترل داده شود.
مدهای پاسخ کنترل کننده • معایب روش clock-driven: لزوم سنکرون بودن کامل نودهای هوشمند و دشوار بودن سنکرون بودن دقیق با وجود تاخیر زمانی حتمی در شبکه • مزایایروش clock-driven : افزایش نرخ بازدهی داده فیدبک • معایب روش event-driven : امکان ناپایداری سیستم در صورت طولانی بودن نسبی تاخیر انتقال شبکه و یا ناکافی بودن اندازه کنترل • مزایای روش event-driven : کاهشتاخیر انتقال شبکه و پرهیز از نمونه برداری بی اثر و از دست رفتن داده و صرفه جویی در زمان انتظار برای نمونه برداری روش پیشنهادی برای مد پاسخ نودهای کنترل کننده : event-clock-driven
مدهای پاسخ محرک و سنسور • نودهای سنسور و محرک در یک وضعیت ویژه یکسان بوده انتقال داده بین آنها نیازی به عبور از شبکه پیچیده ندارد. • تاخیر شبکه بین نودها وجود ندارد لذا همزمانی دقیق نتیجه می شود. • بنابراین نودهای سنسور و نودهای محرک هر دو روش clock-drivenرا با پریود مطمئن اختیارمی کنند.
قوانین پایه • وقتی نودهای کنترل کننده نرمال هستند روش event-drivenاختیار می شود. • زمانی که نتیجه نمونه برداری از طریق پیغام شبکه به نودهای کنترل کننده ارسال می شود آنها فوراً محاسبات کنترل رابا ماکزیمم تاخیر انتقال Tmaxاجرا می کنند. • وقتی تاخیر انتقال بین نودهای سنسور و نودهای کنترل کننده بزرگتر از Tmaxباشد نودهای کنترل کننده به طور اتوماتیک محاسبات کنترل را در روشtime-drivenشروع می کنند و سیگنال کنترل را صادر می کنند.
اطلاعات دنباله زمانی انتقال در سیستم کنترل تحت شبکه حلقه بسته
قوانین پایه • نودهای محرک با استراتژی صف بندی پردازش می شوند. • جهت سازماندهی تاخیر زمانی بین نودهای سنسور و نودهای کنترل کننده , استراتژی صف بندی نیز در نودهای کنترل کننده مطرح می شود. • وقتی مقدار تاخیر زمانی بزرگتر از Tmaxباشد نودهای محرک به طور اتوماتیک سیگنالها را با استفاده از اطلاعات کنترل اپتیمال پردازش شده در صف ارسال می نماید .
قوانین پایه • روش اصلاح و بازبینی در کنترل کننده : • با استفاده از داده های گذشته و بررسی سیگنال انحراف و خطای پیش بینی قبلی • و براساس شبکه عصبی پس انتشار , یک مدل پیش بین خطاایجاد می شود • که از خروجی این مدل خطا برای اصلاح و بازبینی سیگنال خروجی پیش بین در GPCاستفاده می شود. • وقتی تاخیر زمانی بزرگتر از Tmaxباشد : • بااستفاده از سیگنال خروجی پیش بین که توسط سیگنال پیش بین خطا اصلاح شده است , محاسبات GPCجهت فراهم کردن قواعد کنترل اپتیمال مورد استفاده قرار می گیرد. • بنابراین تاخیر انتقال بین نودهای سنسور و نودهای کنترل کننده به خوبی رفع شده است و از اینرو مقاومت وRobustnessسیستم بهبود یافته است.