530 likes | 1.02k Views
کنترل پیش بین و پایداری. شکوفه جعفری 89123012 سمینار درس کنترل پیش بین استاد درس : آقای دکتر توحید خواه. فهرست معرفی کلی کنترل پیش بین غیر خطی با افق شبه بی نهایت شماتیک کنترل پیش بین غیر خطی با افق شبه بی نهایت نتایج اولیه پایداری مجانبی مثال حل شده بحث های دیگر. 1 - معرفی.
E N D
کنترل پیش بین و پایداری شکوفه جعفری 89123012 سمینار درس کنترل پیش بین استاد درس : آقای دکتر توحید خواه
فهرست • معرفی کلی • کنترل پیش بین غیر خطی با افق شبه بی نهایت • شماتیک کنترل پیش بین غیر خطی با افق شبه بی نهایت • نتایج اولیه • پایداری مجانبی • مثال حل شده • بحث های دیگر
1 - معرفی • پایداری حلقه بستهی یک سیستم امری حیاتی برای ادامهی کار آن سیستم میباشد. • حتی در حالتی که الگوریتم بهینهسازی برای مسئله یک پاسخ بهینه پیدا کند، این امر پایداری حلقه بسته سیستم را تضمین نخواهد کرد (حتی اگر مدل مورد استفاده بسیار دقیق باشد). • مثالهای متعددی نشان میدهند که الگوریتمهای کنترل پیشبین میتوانند ناپایدار شوند. • تکنیکها برای تضمین پایداری سیستم کنترل شده بر اساس پیشبینی مدل :استفاده از • جریمههای نهایی Terminal Penalty)) • قیود (Constraints ) • توابع لیاپانوف (Lyapunovfunctions) • مجموعههای نامتغیر (Invariant sets)
پیشنهادات اصلی دربرخورد با مشکل پایداری MPC: • افق بینهایت(Keerthi and Gilbert) : • افزایش افقهای پیشبینی و کنترل تا بینهایت • به علت بینهایت بودنمتغیرهای تصمیمگیری در هر زمان نمونه برداری : غیر قابل اعمال به صورت مستقیم • قیود نهایی(Keerthi and Gilbert) : • با اضافه کردن یک قید روی حالت نهایی به فرم پایداری تضمین میشود. • بااین قید در پایان افق محدود حالت صفر خواهد شد و در نتیجه ورودی کنترلی نیز صفر خواهد بودو(اگر اغتشاش وجود نداشته باشد) سیستم در مبدا میماند. • هزینهی محاسباتی اضافه میکند و باعث افزایش محدودیت ناحیهی عملکرد میگردد. • اجرای عملی آن مشکل است. • کنترل دوگانه(Michalska and Mayne) : • دراینایده یک ناحیه حول حالت نهایی تعریف میشود که سیستم میتواند با استفاده از یک کنترل کنندهی فیدبک حالت خطی حالت نهایی را داخلاین ناحیه هدایت کند و به مبدا برساند. • افق شبه بینهایت(Chen and Allg¨ower)
2- کنترل پیش بین غیر خطی با افق شبه بی نهایت • هدف : ارائه ی یک کنترل پیش بین غیر خطی با پایداری مجانبی تضمین شده • این روش می تواند هم به سیستم های پایدار و هم ناپایدار اعمال شود. • مسئله ی MPC در حلت کلی : حل روی خط مسئله ی کنترل بهینه ی حلقه باز با افق محدود و براساس دینامیک سیستم (خطی یا غیر خطی) و قیودی که شامل حالت ها و ورودی ها هستند. • این فرم کلی MPC پایداری حلقه بسته را به خودی خود تضمین نمی کند. • پایداری حلقه بسته می تواند با انتخاب مناسب پارامتر های طراحی، مانند افق پیش بینی، افق کنترل و ماتریس های وزنی حاصل گردد.
آنچه در این جا ارائه می شود : • معرفی یک MPC غیر خطی با افق شبه بی نهایت • تابعی هدف : شامل یک هزینه با افق محدود و یک هزینه ی نهایی • قیود : دینامیک سیستم، قیود روی ورودی و یک قید ناساوی برای حالت نهایی • امکان پذیری قید حالت نهایی یعنی: حالت ها در پایان افق محدود در یک ناحیه نهایی از پیش مشخص شده ای قرار می گیرند. • حالت های نهایی چنان جریمه می شوند که هزینه ی نهایی، هزینه ی افق نامحدود سیستم غیر خطی کنترل شده با یک فیدبک حالت خطی محلی مفروض را محدود می کند. کنترل کننده ی پیش بین غیر خطی پیشنهاد شده یک افق پیش بینی شبه بی نهایت دارد! اما دنباله ی ورودی کنترلی که قرار است محاسبه شود طبیعت محدود دارد.
اگر ژاکوبین خطی ساز سیستم غیر خطی ای که قرار است کنترل شود پایدار پذیر باشد، ان گاه پاسخ یکتا و مثبت معین متقارن یک معادله ی لیاپانوف مناسب می تواند به عنوان ماتریس جریمه ی نهایی در هزینه ی نهایی استفاده شود. • و یک همسایگی از مبدا می تواند به عنوان ناحیه ی نهایی به صورت خارج از خط محاسبه گردد. • پایداری مجانبی حلقه بسته : با امکان پذیری مسئله ی کنترل بهینه ی حلقه باز در زمان t=0 تضمین می شود. • به صورت معمول در MPC، کنترل حلقه بسته با حل روی خط مسئله ی کنترل بهینه در هر زمان نمونه برداری و بدون توجه به این که حالت ها داخل یا خارج از ناحیه ی نهایی قرار دارند محاسبه می شود. هیچ سوئیچی بین کنترل کننده ها لازم نیست. • فیدبک حالت خطی محلی تنها برای محاسبه ی خارج از خط ماتریس جریمه ی نهایی و ناحیه ی نهایی استفاده می شود. • به همین علت روشی که در این جا ارائه می شود در مقایسه با سایر روش ها کلی تر بوده و از لحاظ محاسباتی بسیار جالب است.
3 - شماتیک کنترل پیش بین غیر خطی با افق شبه بی نهایت • معرفی سیستم هایی که قرار با این روش کنترل شوند : • فرض های کلی : • فرض فرض محدود کنندهای نیست. زیرا اگر میتوان مبدا سیستم را به منتقل نمود. • فرض دیگر : قابل اندازهگیری بودن همهی حالتهای سیستم (چون در طراحی فیدبک حالت نیاز داریم.) بردار حالت : بردار ورودی : قیود روی ورودی : • (A1) دو بار مشتق پذیر پیوسته بود و . • یک نقطه ی تعادل سیستم با است. (A2) یک مجموعهی محدب و فشرده است و یک نقطهی داخلی از U است. (A3)سیستم (1) برای هر شرایط اولیهی و که قطعهای پیوسته و از راست پیوسته باشد یک پاسخ یکتا دارد.
هزینه ی استاندارد افق محدود برای عملکرد کنترلی مطلوب هزینه ی نهایی برای جریمه حالت ها در پایان افق محدود • مسئلهی بهینه سازی کنترل حلقه باز در زمان t و با حالت اولیهی x(t) : • : مسیر سیستم که توسط به دست میآید. • برای سادگی افق کنترل و پیشبینی یکسان در نظر گرفته میشوند. • مقدار اولیه در پیش بینی آینده : حالات واقعی سیستم در زمان واقعی t یعنی x(t) • قید ناساوی آخر حالتها را در پایان افق پیشبینی ، مجبور میکند که دریک همسایگی از مبدا (ناحیهی نهایی) قرار گیرند. Subj. to Q&P :Positive Definite Symmetric Weighted Matrix Tp : Finite Prediction Horizon Ω : Terminal Region
Ω به گونه ای انتخاب می شود که برای سیستم غیرخطی کنترل شده توسط یک فیدبک حالت خطی محلی، نامتغیر باشد. • ، هزینهی افق نامحدود سیستم غیرخطی که از Ω آغاز میشود و توسط فیدبک حالت خطی محلی کنترل میشود را محدود میکند، یعنی : • و نشان داده می شود که پایداری حلقه بسته به این صورت تضمین می شود. • ماتریس جریمه ی نهایی P همراه با ناحیه ی نهایی Ω به صورت خارج از خط به گونه ای تعیین می شود که ویژگی نامتغیر بودن Ω حفظ شده و قیود ورودی در Ω برآورده شوند.
هزینه ی افق نامحدود : • با جایگذاری داریم : • بنابراین افق پیشبینی کنترل کنندهی پیشبین پیشنهاد شده به شبه بی نهایت گسترش داده میشود. • پاسخ بهینه برای مسئلهی بهینه سازی (در صورت وجود پاسخ) : • مقدار هدف متناظر :
در چهارچوب MPC کنترل حلقه باز می تواند در دوگام در نظر گرفته شود : • روی یک افق محدود، یک دنباله ی ورودی بهینه با حل مسئله ی کنترل بهینه ی حلقه باز به دست می آید که مدل سیستم غیرخطی را به ناحیه ی نهایی می برد. • یک کنترل فیدبک خطی محلی به گونه ای در نظر گرفته می شود که سیستم را به مبدا هدایت می کند. • نکته : فیدبک حالت خطی هیچ گاه مستقیما به سیستم اعمال نمی شود بلکه دنباله ورودی حاصل از کنترل پیش بین اعمال می گردد. این فیدبک حالت تنها برای تعیین ماتریس جریمه ی نهایی P و ناحیه ی نهایی Ω ، به صورت خارج از خط استفاده می شود. • با شرط δ<Tp (زمان نمونه برداری) کنترل حلقه بسته عبارت است از :
4- نتایج اولیه • هدف : بیان نتایج اولیه در مورد ناحیه ی جذب و یک کران روی سیستم غیرخطی کنترل شده توسط فیدبک حالت خطی محلی برای تعیین ناحیه ی نهایی و ماتریس جریمه ی نهایی و اثبات پایداری مجانبی حلقه بسته • ژاکوبین خطی ساز سیستم (1) در مبدا : • اگر این ژاکوبین خطی ساز پایدار پذیر باشد آنگاه یک فیدبک حالت خطی میتواند به گونهای در نظر گرفته شود که پایدار مجانبی باشد.
لم 1 - فرض کنید ژاکوبین خطی ساز سیستم (1) در مبدا پایدار پذیر باشد. آنگاه : • معادلهی لیاپانوف ، یک پاسخ مثبت معین متقارن یکتا P به دست میدهد به طوریکه مثبت معین و متقارن است و شرط زیر را برآورده میکند : • یک ثابت چنان وجود دارد که یک همسایگی از مبدا را به فرم زیر مشخص میکند: به طوریکه : • برای همهی داریم (یعنی کنترل کنندهی فیدبک خطی قیود ورودی را در برآورده میکند). • برای سیستم غیر خطی (1) که با فیدبک حالت خطی محلی کنترل میشود نامتغیر است. • برای هر هزینهی افق بی نهایت : بر اساس سیستم غیر خطی (1) که از آغاز میشود و با فیدبک حالت خطی محلی کنترل میشود از بالا به صورت زیر کران دار است :
پایدار مجانبی است. پاسخ متقارن و P.D. یکتا دارد. a برقرار است. • اثبات : نقطه ی داخلی U است. به طوریکه ناحیه ای به فرم را به گونه ای تعیین می کند که مقادیر کنترل فیدبک خطی قیود ورودی را در برآورده می کند. قرار می دهیم و ناحیه ی را تعریف می کنیم: قیود ورودی در برآورده می شوند. i برقرار است. سیستم می تواند در بدون قید در نظر گرفته شود. با مشتق گیری از حول مسیر داریم :
داریم : چون نامساوی آخر بیان می کند که برای سیستم (1) کنترل شده با فیدبک حالت محلی نامتغیر است. و هر مسیر از که در آغاز می شود در باقی مانده و به مبدا همگرا می شود. را چنان انتخاب می کنیم که در داشته باشیم :
در واقع نتایج موجود در لم 1 همان چیزیست که به دنبالش بودیم! • با قرار دادن داریم : • پاسخ P از معادله ی و ناحیه ی می تواند به عنوان ماتریس جریمه ی نهایی و ناحیه نهایی به کار گرفته شوند.
اکنون میتوان یک روند برای تعیین P و (بزرگترین مقدار ممکن برای ) به صورت خارج از خط ارائه داد : گام 1) مسئلهی کنترل را بر اساس ژاکوبین خطی ساز برای به دست آوردن بهرهی فیدبک حالت خطی پایدار ساز K حل میکنیم. گام 2) ثابت را به گونهای انتخاب میکنیم که نامعادلهی برآورده شود و سپس معادلهی لیاپانوف را برای به دست آوردن ماتریس متقارن و مثبت معین P حل میکنیم. گام 3) برزگترین مقدار ممکن برای را به گونهای مییابیم که برای همهی داشته باشیم : گام 4) – بزرگترین مقدار را به گونهای مییابیم که نامساوی زیر در برقرار باشد :
نکات : • در گام 4 بر آوردن نامعادله برای یک ناحیه ی نهایی به اندازه ی کافی بزرگ ساده نیست . به علت مقدار کوچک برای یک سیستم این نامعادله تنها برای ناحیه ی نهایی کوچکی بر آورده گردد. از این رو برای دست یافتن به ناحیهی نهایی با محافظه کاری کمتر میتوان از رویکرد دیگری استفاده نمود. در ابتدا روند فوق را تا گام 3 ادامه میدهیم. سپس تکراری از مسئلهی بهینه سازی سادهی زیر را برای انتخاب با کاهش از تا زمانی که مقدار بهینهی مسئلهی بهینه سازی زیر نامثبت گردد انجام میدهیم: اگر مقدار مناسب از این روش پیدا شود ناحیه ی به فرم را مشخص می کند که می تواند به عنوان ناحیه ی نهایی در نظر گرفته شود.
روند فوق ناحیهی نهایی یکتایی برای یک سیستم غیر خطی به دست نمیدهد. برای کاهش بار محاسبات رو خط میخواهیم بزرگترین مقدار ناحیهی ممکن را بیابیم که کار سادهای نیست. برای این کار در ابتدا باید بهرهی فیدبک پایدار ساز خطی مناسب K انتخاب کنیم که از روشهای کنترل خطی بسیاری میتوان استفاده نمود، اما به علت «بهینه» بودن MPC تکنیک کنترل بهینهی خطی (LQR) میتواند انتخاب مناسبی باشد. مورد دوم اینکه برای یک بهرهی داده شدهی K، انتخاب مناسب برای نیاز است که بعدا بحث خواهد شد. مهمتر از همه اینکه اندازهی ناحیهی نهایی بستگی کلی به میزان غیر خطی بودن سیستم تحت کنترل دارد. هر چه یک سیستم غیر خطیتر باشد ناحیهی نهایی کوچکتر خواهد بود. برای یک سیستم خطی و یا غیر خطی ساده اندازهی ناحیهی نهایی تنها با قیود ورودی محدود میشود. • اگر هیچ کنترل کنندهی فیدبک خطی پیدا نشود که بتواند سیستم را به صورت محلی پایدار مجانبی کند، به مبدا محدود میشود. آنگاه قید نامساوی نهایی به کاهش مییابد(روش Mayne & Michalska(1990) , Rawlings & Muske (1993)).
اگر سیستم تحت کنترل خطی باشد داریم : پس کنترل پیشبین دقیقا یک افق پیشبینی بینهایت دارد اما دنبالهی ورودی به صورت روی خط در افق محدود محاسبه میشود.
5 - پایداری مجانبی • در این بخش ویژگی پایداری سیستم حلقه بسته زیر مورد بحث قرار می گیرد : که برای آن داریم : • تعریف 1) نقطهی تعادل x=0 از معادلهی (3) پایدار است اگر • تعریف 2) نقطهی تعادل از معادلهی (3) پایدار مجانبی است اگر پایدار بوده و η به گونهای بتواند انتخاب شود که نتیجه بدهد . : کنترل حلقه بسته : پاسخ مسئله ی بهینه سازی
نماد : : نشان دهنده ی مسیر پیش بینی شده از سیستم غیر خطی که از حالت واقعی x(t) آغاز شده و توسط کنترل حلقه باز هدایت می شود در زمانی که پیش بینی در زمان واقعی t انجام می شود. • امکان پذیری مسئلهی بهینه سازی • به علت تکرار مسئلهی بهینه سازی داده شده مسئله باید در زمانهای ممکن باشد. • امکان پذیری مسئلهی بهینه سازی : حداقل یک پاسخ (نه لزوما بهینه) برای دنبالهی ورودی چنان وجود دارد که تضمین میکند مسیر معادلهی قید نامساوی نهایی را بر آورده میکند همچنین مقدار تابعی هدف کراندار میشود. • در ادامه لمی روی امکان پذیری مسئلهی بهینه سازی در هر زمان ارائه میشود.
لم 2 -برای سیستم نامیکه حالتهای آن کاملا قابل اندازه گیری باشند و هیچ نامعینی در آن وجود نداشته باشد، برای یک زمان نمونه برداری به اندازه کافی کوچک ، امکان پذیری مسئلهی بهینه سازی حلقه باز (2) در زمان t=0، امکان پذیری آن برای همهی t>0 را نتیجه میدهد. • نکته:لم 2 بیان میکند که افق پیشبینی Tp (پارامتر تنظیم) باید به گونهای انتخاب شود که مسئلهی بهینه سازی (2)در زمان t=0 امکان پذیر باشد. • پایداری مجانبی • در ابتدا نشان میدهیم که مقدار بهینهی تابع هزینه غیر افزایشی است : • لم 3 - فرض کنید که مسئلهی بهینه سازی در زمان t=0 ممکن باشد. آنگاه برای سیستم نامی بدون اختلال، برای هر و مقدار بهینهی تابع هزینه شرط زیر را برآورده میکند :
چون ، لم 3 بیان میکند که مقدار بهینهی تابع هزینه غیرافزایشی است. اکنون میتوان نتایج پایداری مجانبی سیستم حلقه بستهی را بیان کرد : • قضیه 1 - فرض کنید که : • مفروضات (A1)-(A3) بر آورده میشوند. • ژاکوبین خطی ساز سیستم غیر خطی (1) پایدار پذیر است. • مسئلهی کنترل بهینهی حلقه باز (2)در زمان t=0 امکان پذیر است. آنگاه برای یک زمان نمونه برداری به اندازه کافی کوچک و در غیاب اغتشاش سیستم حلقه بسته با کنترل کنندهی پیشبین به صورت نامی پایدار مجانبی است. اگر نشان دهندهی مجموعهی همهی حالتهای اولیهای باشد که فرض (c) را بر آورده میکند آنگاه X ناحیهی جذبی برای سیستم حلقه بسته معرفی مینماید.
نکات : • شرط پایداری داده شده تنها یک شرط کافی است و لازم نیست. این واقعیت که سیستم خطی شده پایدار پذیر نیست نیز بیانگر آن نمیباشد که هیچ کنترل کنندهی فیدبک خطی وجود ندارد که بتواند سیستم غیر خطی را به صورت محلی پایدار کند. • وقتی این شماتیک کنترلی به سیستمهای عملی اعمال میشود بهینه سازی عددی که اجرا میگردد ممکن است دنبالهی بهینهی ورودی کلی را در هر گام پیدا نکند. این میتواند به علت محدودیتهای زمانی محاسبات بلادرنگ و یا گیر افتادن دریک نقطهی بهینه محلی باشد. دراین صورت اگرچه عملکرد بهینه از دست میرود ولی پایداری باز هم تضمین است. زیرا پایداری به بهینگی پاسخ وابسته نیست و صرفا به امکان پذیری وابسته میباشد. • اگر سیستم غیر خطی به صورت حلقه باز پایدار مجانبی باشد، قید نامساوی نهایی غیر خطی میتواند حذف شود بدون اینکه پایداری تحت تاثیر قرار گیرد.
6- مثال حل شده • سیستم زیر را در نظر بگیرید : همانطور که مشخص است سیستم فوق ناپایدار است. سیستم خطی شده ی آن عبارت است از : این سیستم برای هر پایدار پذیر هست اما کنترل پذیر نیست. قید روی ورودی : و ماتریس وزن ها : فرض :
برقرار برقرار • فرض های (A1-A3) را چک می کنیم : برای یافتن ماتریس جریمه ی نهایی P و ناحیه ی نهایی Ω روند گفته شده را طی می کنیم : • گام 1) مسئلهی کنترل را بر اساس ژاکوبین خطی ساز برای به دست آوردن بهرهی فیدبک حالت خطی پایدار ساز K حل میکنیم. برقرار • (A1) دو بار مشتق پذیر پیوسته بود و . • یک نقطه ی تعادل سیستم با است. (A2) یک مجموعهی محدب و فشرده است و یک نقطهی داخلی از U است. (A3)سیستم (1) برای هر شرایط اولیهی و که قطعهای پیوسته و از راست پیوسته باشد یک پاسخ یکتا دارد.
در ابتدا مقدمه ای در مورد LQR : برای سیستم خطی پیوسته زمان با تابع هزینه ی ، قانون کنترل فیدبک که مقدار تابع هزینه ی فوق را کمینه می کند به صورت است که در ان بوده و P از حل معادله ی ریکاتی زیر به دست می اید : • حال با حل معادله ی ریکاتی فوق برای مثال ارائه شده خواهیم داشت : • گام 2) ثابت را به گونهای انتخاب میکنیم که نامعادلهی برآورده شود و سپس معادلهی لیاپانوف را برای به دست آوردن ماتریس متقارن و مثبت معین P حل میکنیم. :
گام 3) برزگترین مقدار ممکن برای را به گونهای مییابیم که برای همهی داشته باشیم : داریم : • گام 4) – بزرگترین مقدار را به گونهای مییابیم که نامساوی زیر در برقرار باشد : چون مقدار کوچکی است در گام 4 خواهیم داشت که مقدار کوچکی است. از این رو برای یافتن ناحیه ی نهایی بزرگتر از روش اصلاحی گفته شده استفاده می کنیم. در این صورت خواهیم داشت :
حال با انتخاب زمان نمونه برداری و افق پیش بینی در واحد زمان به صورت خواهیم داشت : خطوط پر : مسیر های حلقه بسته خطوط خط چین : مرز ناحیه ی نهایی محاسبه شده خط چین – نقطه : مسیر پیش بینی شده با حل مسئله ی بهسنه سازی در t=0
7- بحث های دیگر • بحثی روی بار محاسباتی : • یکی از مزایای این روش با توجه مثالهای پیاده سازی شده آن است که بار محاسباتی آن نسبت به سایر روشهای طراحی کنترل کنندهی MPC که در آنها پایداری حلقه بسته نیز تضمین میگردد کمتر است! • بحثی روی ناحیهی نهایی • اگر غیر ممکن نباشد، بسیار دشوار است که بزرگترین ناحیهی نهایی را برای یک سیستم غیر خطی به دست آوریم. • از روی معادلهی لیاپانوف ، P با افزایش پیدا میکند و این افزایش با نزدیک شدن به بسیار سریع میشود. • یک P بزرگ جریمهی سنگینی برای حالتها در پایان افق محدود درنظر میگیرد اما ناحیهی نهایی بزرگی را به طور اتوماتیک به دست نمیدهد.
به نظر میرسد یک ثابت نزدیک به قدر مطلق بزرگترین مقدار ویژهی متناظر با بزرگترین ناحیهی نهایی ممکن است. • اگر چه با این مقدار P نیز بزرگ میشود. از روی ساختار تابع هزینه میتوان گفت جریمهی بزرگ روی حالت نهایی میتواند تاثیر مخرب روی عملکرد کنترلی حاصل داشته باشد. • بنابراین یک trade-off بین ناحیهی نهایی بزرگ و عملکرد کنترلی مطلوب وجود دارد. • ضعفهای روش • در روش ارائه شده امکان عدم تطابق مدل و سیستم در نظر گرفته نشده است یعنی هیچ اغتشاشی روی سیستم وجود ندارد. • فرض شده است که همهی حالتها قابل اندازه گیری هستند. • شرایط داده شده برای پایداری تنها شرایط کافی بودند و نه لازم.
مراجع • Rolf Findeisen, Frank Allgöwer, and L.T. Biegler, Assessment and Future Directions of Nonlinear Model Predictive Control. 2007. • Allgower, H.C.a.F., A Quasi-Infinite Horizon Nonlinear Model Predictive Control Scheme with Guaranteed Stability.Automatica, 1998. 34(No. 10): p. 1205-1217. • Fontes, F.A.C.C., AGeneral Framework to Design Stabilizing NonlinearModel Predictive Controllers. Systems & Control Letters, 2000.