730 likes | 958 Views
سمینار درس کنترل پیشبین مبتنی بر مدل ( MPC ). کنترل پیشبین مبتنی بر مدل در سیستم های وقایع گسسته MPC on Discrete Event Systems. استاد درس: دکتر فرزاد توحید خواه. ارائه دهنده: گلناز بغدادی. فهرست مطالب. مقدمه ای بر سیستم های وقایع گسسته دلیل معرفی سیستم های وقایع گسسته
E N D
سمینار درس کنترل پیشبین مبتنی بر مدل (MPC) کنترل پیشبین مبتنی بر مدل در سیستم های وقایع گسسته MPC on Discrete Event Systems استاد درس: دکتر فرزاد توحید خواه ارائه دهنده: گلناز بغدادی
فهرست مطالب • مقدمه ای بر سیستم های وقایع گسسته • دلیل معرفی سیستم های وقایع گسسته • مثالهایی از انواع سیستم های وقایع گسسته • مدلسازی سیستم های وقایع گسسته • معرفی انواع روشهای مدلسازی سیستم های وقایع گسسته • مقایسه انواع روشهای مدلسازی • ارائه مثالهایی از مدل های پرکاربرد در مدلسازی سیستم های وقایع گسسته صنعتی و بیولوژیکی • کنترل پیشبین مبتنی بر مدل در سیستم های وقایع گسسته • بیان تفاوت مفاهیم کنترلی در سیستم های وقایع گسسته • شرح نحوه اعمال کنترل پیشبین برروی انواعی از مدلهای ارائه شده • مقایسه الگوریتم یادگیری تقویت شده با کنترل پیشبین مبتنی بر مدل • کاربرد الگوریتم یادگیری تقویت شده در سیستم های وقایع گسسته
مقدمه ای بر سیستم های وقایع گسسته
Discrete state x3 x4 Holding time x2 x5 x1 time e1 e2 e3 e4 e5 e6 • سیستم های وقایع گسسته (DEVS) در سال 1976 توسط دکتر برنارد زیگلر (B. Zeigler) معرفی شدند • لغت "گسسته" به معنای "گسسته بودن زمان" و یا به معنای "گسسته بودن حالت ها" نیست. CVDS • دینامیک چنین سیستم هایی را رویداد ها می سازند که ممکن است این رویداد ها زمانی که آغاز می شوند دارای سیر تکاملی گسسته و یا پیوسته باشند. • تمرکز اولیه، برروی شروع و پایان چنین رویداد هایی است، زیرا هر پایانی باعث یک شروع جدید می شود
مثال (یک سیستم تولید) • رویداد ها: ماشین شروع به کار می کند، خراب می شود، کارش تمام شده است، تعمیرش به اتمام رسیده است. • حالت ها: ماشین بیکار است، در حال انجام کار است، خراب شده است، در دست تعمیر است. • انتقال بین حالت ها با رویداد ها برچسب می خورند. x3 ماشین در حال انجام کار است x4 x2 ماشین در حال انجام کار است x1 ماشین بیکار است time e3 e1 e2 e4 e5 ماشین شروع به کار می کند ماشین خراب می شود تعمیر به اتمام رسید
… Temporal State, x x1 x2 xi xi+1 = fi(xi,ui,t) Switching Time
مثال های دیگر • فرایند های تجاری: ”ورود اسناد“، "پردازش یک سند” و ... کنترل زمانبندی ورود اسناد و مراحل انجام کار و استفاده از منابع جهت جلوگیری از ایجاد صف های از اسناد که نیاز به پردازش دارند. • شبکه های ارتباطی: ”تماسهای تلفنی“، ”رسیدن یک فایل برای پرینت“، ”تقاضا از سرور برای تحویل یک صفحه معین“، .... کنترل ترافیک موجود برروی لینک های ارتباطی، بهینه سازی ساختار شبکه و انتخاب طول مناسبی از صف • سیستم های کامپیوتری: درخواست استفاده از ابزارهای ورودی و خروجی همانند کنترلر شبکه ، دستورالعمل های ماشین و.... کنترل اولویت بندی و انتخاب مسیر اجرای عملیات و تخصیص منابع • سیستم های تولیدی: ورود مواد اولیه، بیکار شدن ماشین، شروع به کار ماشین، ... کنترل در جهت به اتمام رسیدن تولید مشخص در یک زمان مشخص، جلوگیری از پر شدن بافر ها • سیستم های بیولوژیکی: رسیدن اطلاعات سنسوری مختلف به مغزو اعصاب، تغییرات غلظت عناصر شیمیایی مختلف در خون یا بافت های دیگر کنترل در جهت اولویت بندی پردازش اطلاعات سنسوری، انتخاب مسیر مناسب جهت پاسخ، .... • سیستم حمل و نقل • سیستم های صف
مسائل مطرح در سیستمهای وقایع گسسته • وظایف متعددی وجود دارد که ممکن است لازم باشد بعضی از آنها حتما انجام شوند. • ممکن است لازم باشند بعضی وظایف با ترتیب خاصی انجام شوند. • ممکن است الزامی به اجرای بعضی از وظایف نباشد. • گاهی ممکن است بین اجرای دو وظیفه بالاجبار انتخابی انجام شود. • مجموعه ای از منابع وجود دارد که ممکن است بین عناصر موجود در سیستم های وقایع گسسته به اشتراک گذاشته شود. • فرایند رویداد ها که توصیف کننده یک سیستم وقایع گسسته است توسط یک برنامه کنترلی اداره و اجرا می شوند.
روشهای مدلسازی متعددی برای توصیف سیستم های وقایع گسسته ارائه شده است: • مدلهای جبری-ماکس پلاس • شبکه های پتری • مدلهای تصادفی مانند مدلهای مارکوف • ...
مثال: سیستم تولید نشان داده شده در شکل زیر را در نظر بگیرید. این سیستم متشکل از 3 واحد (ماشین) پردازشگر است. هر واحد فقط زمانی برروی یک محصول شروع به کار می کند که پردازش قبلی برروی محصول به پایان رسیده باشد. همچنین فرض می شود که هر واحد به محض اینکه تمامی قطعات حاضر شود شروع به کار می کند. t2=1 p1=1, p2=2, p3=2 t3=3 t1=1 • u(k): نشان دهنده لحظه زمانی است که در آنها بسته ای از مواد خام برای سیکل (k+1) ام به سیستم داده می شود. • xi(k): نشان دهنده لحظه زمانی است که در آن واحد i در سیکل k ام شروع به کار می کند. • y(k): نشان دهنده لحظه زمانی است که در آن محصولkام سیستم را ترک می کند.
خصوصیات جبر ماکس-پلاس • مناسب برای بررسی زمان بندی سیستم های وقایع گسسته • مناسب برای برنامه ریزی و آنالیز زمانبندی های پیچیده • متخصصین این حوزه در فرانسه، هلند و چین هستند
اجزای تشکیل دهنده یک مدل پتری کلاسیک • Places • Transitions • Direct arcs • Input places • Output places • Tokens • Consume token • Produce token • Marking p1 t1 p2 state transition of form (1, 0) (0, 1) p1 : input place p2: output place
Finite tree • Infinite tree
red1 red2 yr1 yr2 yellow1 yellow2 rg1 rg2 gy1 gy2 green1 green2
red1 red2 safe yr1 yr2 yellow1 yellow2 rg1 rg2 gy1 gy2 green1 green2 Two safe traffic lights
Two safe and fair traffic lights red1 red2 safe2 yr1 yr2 yellow1 yellow2 rg1 rg2 gy1 gy2 safe1 green1 green2
Example: life-cycle of a person child puberty marriage bachelor married divorce death dead • Current State • Reachable State • Dead State
اضافه کردن وزن به اتصالات br red black 2H2 + O2 2H2O 2 t rr bb H2 2 H2O O2
p1 t1 p2 t2 p3 مسائل مطرح در رویداد ها • Sequential Execution • Synchronization • Merging • Concurrency • Conflict • Confusion t1
شبکه های پتری زمانی FIFO
شبکه های پتری سلسله مراتبی Unfolding
یک شبکه پتری کلاسیک را می توان با 5 مولفه بیان نمود: • Sis a set of places • T is a set of transitions • F is a set of arcs s.t. • M0is an initial marking • W is the set of arc weights به این ترتیب معادلات حالت سیستم به صورت زیر قابل بیان است: M’ = M0 + WT * σ • Where is how many times each transition fires • WTstate transition matrix
p1 1 1 t1 p2 t2 p3 t3 2 1 1 1 1 p4 t4 2 1 • S={p1,p2,p3,p4} T={t1,t2,t3,t4} • F={(p1,t1) (p2,t2) (p3,t3) (p4,t4) (t1,p2)(t2,p3)(t2 p4) (t3,p1) (t4,p2)} W • M0 Initial state (1,1,2,1) • σFiring sequence (t2 t3 t1 t4) • Mn Final state (1,3,2,0)
p1 1 1 t1 p2 t2 p3 t3 2 1 1 1 1 p4 t4 2 1 تعداد تکرار دنباله رویداد ها حالت اولیه حالت نهایی
خصوصیات شبکه های پتری • امکان نمایش محدود از حالت های نامحدود حالت ماشین ها • مناسب برای مسائل با سایز کوچک • مراجع و شواهد متعددی در مورد این مدل و کاربردهای آن در مدلسازی سیستم های تولیدی و صنعتی وجود دارد.
Waiter free Customer 1 Customer 2 Take order Take order wait Order taken wait eating eating Tell kitchen Serve food Serve food Example: In a Restaurant (Scenario 1)
Waiter free Customer 1 Customer 2 Take order Take order wait Order taken wait eating eating Tell kitchen Serve food Serve food Example: In a Restaurant (Scenario 2)
مقایسه مدلهای معرفی شده • سیستم های جبر ماکس-پلاس (برنامه ریزی و زمان بندی) • شبکه های پتری (توالی و تکرار رویداد ها)
به کار گیری شبکه های پتری در مدلسازی شبکه های بیولوژیکی Wntsignaling pathway
کنترل پیشبین مبتنی بر مدل در سیستم های وقایع گسسته
PLANT EVENT-DRIVEN DYNAMICS TIME-DRIVEN DYNAMICS CONTROLLER
l m m A l m m l B l l C 2m l
کنترل پیشبین مبتنی بر مدل در سیستم های جبر خطی ماکس-پلاس
کنترل پیشبین مبتنی بر مدل در سیستم های جبر خطی ماکس-پلاس تابع هزینه در سیستم های کلاسیک که دراین روابط r سیگنال مرجع (زمان نهایی مورد انتظار برای تولید محصول)، Np افق پیش بین ، y(k+j|k) تخمین خروجی در زمان k+j بر اساس اطلاعات موجود در زمان k ، λ یک عد اسکالر که درجه اهمیت سیگنال کنترل نسبت به خطا را نشان می دهد و u(k+j-1) سیگنال کنترل است
اگر زمانی نهایی مورد نظر r برای تولید محصولات مشخص باشد و اگر برای هر مقدار تاخیر بعد از این زمان تعیین شده مجبور به پرداخت جریمه باشیم بخش Jout در تابع هزینه را می توان به صورت زیر برای سیستم های وقایع گسسته خطی ماکس –پلاس تعریف نمود: اگر علاوه بر شرایط قبلی ، برای مثال با محصولات فاسد شدنی روبرو باشیم که نتوانیم آنها را زود تر از تاریخ تعیین شده تولید کنیم آنگاه تابع هزینه را می توان به صورت زیر تعریف نمود: و یا اگر فقط بخواهیم که زمان تولید را به یک حالت تعادل برسانیم می توان از تابع هزینه زیر استفاده نمود:
در مورد بخش Jin نیز به صورت زیر عمل می شود:معیار هزینه ورودی در سیستم های کلاسیک به صورت تعریف شد، اما در مورد سیستم های وقایع گسسته خطی ماکس- پلاس مینیمم کردن این تابع منجر به کوچک کردن لحظات زمانی ورودی می شود. که ممکن است نتیجه آن سرریز بافر ورودی باشد. بنابراین به نظر می رسد که بهتر باشد تابع ورودی ماکسیمم شود. در مورد سیستم های تولیدی به این معنا است که مواد خام با حداکثر تاخیر ممکن به سیستم داده شود.که در نتیجه آن سایز بافر ورودی نیز می تواند کوچک گرفته شود. همچنین سر ریز شدن ممکن است باعث ناپایداری در سیستم شود. به این ترتیب به نظر می رسد که برای سیستمهای وقایع گسسته MPL بهتر است تابع هزینه ورودی به صورت زیر تعریف شود که دقیقا مخالف سیستم های کلاسیک زمان گسسته خطی است.
اما در مورد سیستم های وقایع گسسته MPL مولفه u(k+j) دلالت بر زمان دادن ورودی (مواد خام) به سیستم در رویداد k+j ام دارد به این ترتیب با افزایش j بدیهی است که زمان نیز افزایش می یابد و ثابت ماندن این زمان از یک رویدادی به بعد، بی معنا به نظر می رسد. بنابراین در این سیستم ها این مسئله به این صورت تغییر داده می شود که به جای زمان ورودی ، نرخ تغییرات زمان ورودی در نظر گرفته می شود، به بیان دیگر:
قیود extended linear complementarityproblem (ELCP)
تعاریف کنترلی در سیستم های وقایع گسسته پایداری: یک سیستم وقایع گسسته پایدار است اگر در سطح تمامی بافر هایش محدود باقی بماند. همچنین تاخیر بین زمان تولید محصول و زمان مورد انتظار (مطلوب) نیز محدود باشد. به این ترتیب می توان گفت در مورد یک سیستم SISO روابط زیر برقرار باشد پایداری سیستم تضمین می شود: که در این روابط Myr, Mry, Myu مقادیری ثابت محدود و y(k) زمان تولید خروجی در رویداد kام و r(k) زمان مطلوب و مورد انتظار برای تولید محصول است. یک مسئله مهم در اینجا این است که پایداری یک ویژگی ذاتی سیستم نیست و به تاریخ و زمان شروع دادن ورودی و زمان پایان تولید خروج دارد.
تعاریف کنترلی در سیستم های وقایع گسسته امکان پذیری: زمانی که هیچگونه پاسخی برای u(k) بدست نیاید می گوییم کنترل این سیستم امکان پذیر نیست. این حالت در صورت تداخل قیود اتفاق می افتد. که می توان تعدادی از قیود را با توجه به اولویتشان بازتر نمود. انتخاب دنباله زمان پایان r(k)