570 likes | 789 Views
دانشگاه صنعتی امیرکبیر دانشکده مهندسی پزشکی کنترل پیش بین مبتنی بر مدل توزیع شده و کاربرد آن در آرایش بندی سیستم های چندعاملی. استاد: جناب آقای دکتر توحیدخواه. ارائه دهنده: عادله محمدی آذرماه1389. فهرست مطالب. عامل Agent.
E N D
دانشگاه صنعتی امیرکبیردانشکده مهندسی پزشکیکنترل پیشبین مبتنی بر مدل توزیع شده و کاربرد آندر آرایشبندی سیستمهای چندعاملی استاد: جناب آقای دکتر توحیدخواه ارائه دهنده: عادله محمدی آذرماه1389
عاملAgent يک وجود كه محيط را از طريق سنسورها درك كرده و به صورت خودمختار بر روي آن عمل ميكند.
خودمختاريAutonomy عامل بدون دخالت مستقيم انسان يا هر وجود ديگر، در تصميمگيري و عمل خود داراي استقلال است.
عامل ها خودمختارند : • احساس محیط خود و سایر عامل ها • رد و بدل اطلاعات با سایر عامل ها • محاسبه و اجرای اعمال کنترلی لازم برای رسیدن به سهم خود در تابع هدف
سیستم های چندعاملیMulti-agent Systems وقتي تعدادي عامل با درک مفهوم خودمختاري در کنار هم قرار گرفته تا در كنار اهداف فردي، هدف جمعي عمدتاً والاتري در همان راستا را دنبال كنند، عنوان سيستم هاي چندعاملي تجلي پيدا ميکند • تحقق هدفی در سطح سیستم 7
مفاهيم مربوط به سيستم هاي چندعاملي 8
همکاریCooperation توافق عامل ها برای • داشتن هدفی مشترک با سایر عامل ها، که این هدف معمولا به صورت آفلاین مشخص می شود. • به اشتراک گذاشتن اطلاعات به صورت آنلاین برای تحقق هدف مشترک
Distribution ویژگی ذاتی سیستم های چندعاملی : توزیع شدگی یعنی هر عامل توسط انتقال اطلاعات محلی با سایر عامل ها باید ”مختارانه“ عمل کند.
کنترل توزیع شده طبیعت ابعاد وسیع سیستم ها • کاربردهای ابعاد وسیع • سیستم های قدرت • سیستم های توزیع آب • سیستم ترافیک • سیستم های تولید • سیستم های اقتصادی
DMPC vs. CMPC ورودی کنترلی کل دینامیک تک تک عامل ها دینامیک کل سیستم ورودی های کنترلی محلی حل چند مسئله بهینه سازی حل یک مسئله بهینه سازی
کنترل بهینه غیرمتمرکزOptimal Decentralized Control • Optimalcontrol problem subject to decentralized information structure constraints • هر فیدبک محلی فقط به حالت های محلی که اطلاعات آنها کامل است دسترسی دارد
Optimal Decentralized Controllers • حالت های هر زیرسیستم و همسایه های آن با اندازه گیری یا انتقال اطلاعات در دسترس است • با اهداف هماهنگ بین عامل ها همخوانی دارد • محاسبات موازی و توزیع شده
MPC توزیع شده • هر عامل : متغیرها، تابع هزینه و قیود محلی • مسائل بهینه سازی محلی کوچکتر از مساله بهینه سازی متمرکز • درجه ای از هماهنگی بین عامل ها نیاز است • تامین اطلاعات مورد نیاز
آرایش بندی در سیستم های چندعاملی • ايجاد تعاملي مناسب بين تعدادي از عاملها در يک فضاي مشخص • یکی از مسائل مهم در سیستم های چندعاملی مسئله همكاري و هماهنگي بين تعدادي از عاملهاست كه قرار است به الگوي خاصي دست يابند. • هر گاه اين تعامل در يك فضا نمود پيدا كند، آنگاه عنوان آرايشبندي (Formation ) تعبير مناسبي براي آن است.
آرايشبندي در طبيعت آرايشبندي در طبيعت نيز قابل مشاهده است که میتوان به حركت پرندگان در آسمان و پخش شدن گونهها در محيط اشاره کرد.
آرايشبندي ثابت رسيدن به آرايش مناسب به عنوان صورت مسئله مطرح ميشود. در ابتدا عاملها در محيط پراكنده هستند و بايد ضمن تعامل با محيط، در حضور سایر عاملها به سمت آرايشي كه بر اساس خواستههاي مسئله تعيين ميشود، همگرا شوند.
آرايشبندي متحرك هدف اصلي حفظ يا تغيير مناسب آرايش حين تغييرات محيط و در حضور ساير عاملها است
انواع آرايشبندي متحرك 1. يك عامل به عنوان رهبر در محيط مدنظر قرار گرفته و ساير عاملها در تعامل با آن، تصميم مناسب را اتخاذ ميكنند. 2. رهبر مجازي بوده كه بر اساس هدف و شرايط محيط، ساير عاملها به صورت مجازی خود را با آن تنظيم ميكنند. 3. عاملها به صورت محلي خود را با عاملهاي همسايه هماهنگ کرده و سعي ميكنند ضمن حفظ آرايش، به تغييرات محيط پاسخ دهند.
آرايشبندي فضايي/ منطقی آرايشبندي فضايي صرفاً تعاملات مختصاتي هدف اصلي تعريف ميشود كه تعاملات با ساير عاملها نيز محدود به همين فرض است. آرایش عاملها در سه گوشه يك مثلث متساويالاضلاع هدف: حفظ فاصله مساوی بين همه عاملها مثال
آرايشبندي منطقي ميتوان تعمیم آرايشبندي فضايي دانست كه علاوه بر مختصات فضایی پارامترهای دیگری نیز در تعیین تصميمگيري دخیل هستند. شبكه پدافند موشكي پارامترهايي مثل فاصله امن از يكديگر، ميزان همپوشاني، ميزان اختفاء و فاصله از مراكز حساس نيز مورد توجه است. مثال
موانع هوشمند/ غيرهوشمند • حركت عاملها در محيط تحت تأثير محيط محدود ميشود. يكي از اين محدوديتها وجود موانع است. • موانع استاتيك در پارامترهاي هدف تأثيرگذار نيستند. اين موانع غير هوشمند بوده و تعامل با آنها آسان است.
در مقابل ممكن است موانعي وجود داشته باشند كه ابعاد هدف را تغيير داده و بعضاً در صورت بروز رقابت بين عاملها، ممكن است كلاً صورت مسئله را تغيير دهند.(لزوم تطبيق و يادگيري)
کاربردها • شبكه سنسورهاي بيسيم در محيطهاي تداخلي • انجام عمليات جستجو (امداد و نجات، مينيابي) • كنترل حركت ماهواره در مدار زمين • روابط بينالمللی • امنيت شبكههاي اينترنتي • مديريت بحران و منابع • سپر دفاع موشكي • محيط نبرد
واژههاي معادل يا همارز • هر يك جنبههای خاصي را دقيقتر بررسي ميكنند
ائتلاف Coalition • عاملها الزاماً اهداف يكساني را دنبال نميكنند، ولي ممكن است در ادامه انجام وظايف محوله در مقاطع زماني خاصي به يكديگر نياز داشته باشند. • ” ائتلاف در حالت كلي هدفدار و موقت بوده كه بر اساس يك هدف میانی شكل گرفته و زماني به پايان ميرسد كه هدف از بين رفته باشد يا ادامه آن با اهداف اوليه در تضاد باشد يا اينكه ادامه حضور در ائتلاف سودي براي عامل نداشته باشد“ .
حرکت گله ای Flocking behavior • يكي از انواع رفتارهاي اجتماعي • گروه بزرگي از عاملها با يك هدف يكسان با هم در تعاملاند. در اين رفتار همه عاملها در يك فاصله مشخص با سرعت يكسان حركت كرده و از برخورد با موانع و يكديگر خودداري ميكنند. • كاربردها: • پايش محيط با استفاده از گروه بزرگي از سنسورهاي متحرك • تحويل موازي بار به مقصد • انجام عمليات امداد و نجات
كنترل پوشش Coverage Control • هدف : ايجاد همپوشاني مناسب در انجام يك وظيفه همگاني است • مشابه آرايشبندي ثابت • تفاوت : هدف پوشش محيط است و تأكيدي بر روي آرايش وجود ندارد
اجماع Consensus رسيدن همه عاملها به يك حالت واحد و يكسان و ايجاد هماهنگي بين آنها
حل مساله آرایش بندی با RHC Why RHC? • Generality: generic state & control cons. • Reconfigurability: redefine functions & cons. To reflect changes Why not RHC? • Computational demand • Theoretical Conservation: proofs of stability
RHC توزیع شده راه حل غیر متمرکز مزایای زیر را دارد: • خودمختاری زیرسیستم ها حفظ می شود. • scalable خودمختاری عامل ها حفظ می شود و نتیجه قابل گسترش به تعداد زیادی عامل است. مشکل RHC توزیع شده: در تئوری فقط یک راه حل متمرکز، پایداری مجانبی را تضمین می کند.
حل مساله آرایش بندی با RHC • تابع هدف مناسبی تعریف می شود و یک مساله کنترل بهینه برای تحقق هدف نهایی یعنی آرایش بندی و هماهنگی ربات ها در قالب کنترل پیش بین مبتنی بر مدل حل می شود. • هدف این است که با استفاده از روش افق پیش بین گروهی از عامل ها را به سوی هدف مشترکی هدایت کرده و پایدار کنیم.
قیود در سیستم های چندعاملی • عامل ها هر یک دینامیک دارند. قیود ممکن است برای هر یک از عامل ها به طور فردی وجود داشته باشد مثلا ورودی کنترلی محدود برای هر عامل. • دسته دیگری از قیود وجود دارند که مربوط به ذات سیستم هستند. مثلا قید نانهولونومیک • بسته به هدفی که تعریف شده به وجود می آیند و عامل ها را با هم کوپل می کنند مثلا قیود جلوگیری از تصادم.
معرفی سیستم و شرایط مساله برای هر عامل حالت ها و کنترل دینامیک هر یک به صورت زیر است دینامیک خطی و همسان برای عامل ها
معرفی سیستم و شرایط مساله هر عامل تحت قیود ورودی و حالت زیر قرار دارد هدف کنترلیاین است که تمامی عامل ها به طور مجانبی و با همکاری یکدیگر به که یک نقطه تعادل معادله دینامیک سیستم است برسند
RHC متمرکز • همکاری عامل ها با مینیمم کردن تابع هزینه زیر تحقق می یابد وزن های ثابت و مثبت هزینه Tracking
RHC متمرکز در این مرحله لازم است فرضیاتی در نظر گرفته شوند. مثلا اینکه تمام حالت ها قابل اندازه گیری هستند. زمان انجام محاسبات در برابر پیشروی دینامیک حلقه بسته قابل صرفنظر کردن است. می توان تابع هزینه جمعی را به صورت معادل زیر نیز بنویسیم
RHC متمرکز مسئله کنترل بهینه مورد نظر را در زمان مقدار دهی اولیه می کنیم دوره زمانی به روز شدن افق غلطکی سیستم حلقه بسته قانون کنترل افق پیش بین متمرکز به صورت زیر است
RHC توزیع شده هر دو عاملی که با هم همکاری می کنند همسایه نامیده می شوند. G گراف تعامل بین عامل هاست برای هر عامل i
RHC توزیع شده • هر عامل با دردست داشتن حالت کنونی خود و همسایه هایش مساله کنترل بهینه حلقه باز خود را حل می کند. • قبل از هر آپدیت، هر عامل i ، کنترل مفروض برای هر کدام از همسایه های خود را دریافت می کند.
Local compatibility constraint • این قید تضمین می کند که هیچ عاملی در مساله بهینه سازی از آنچه که همسایه هایش از آن انتظار دارند، خیلی فراتر نمی رود. • Degree of consistency between what a vehicleplans to do and what neighbors believe that vehicle will planto do • متناظر با توان دوم پریود آپدیت است.
پایداری • هدف رساندن حالت ها به مبدا • Optimal Cost Function as Lyapunov function • Terminal Constraints Terminal inequality constraint Terminal cost function