تعداد نشریات | 38 |
تعداد شمارهها | 1,258 |
تعداد مقالات | 9,115 |
تعداد مشاهده مقاله | 8,325,675 |
تعداد دریافت فایل اصل مقاله | 5,040,736 |
برنامهریزی پویای تقریبی مبتنی بر بهینهسازی مجموع مربعات برای سیستمهای متغیر با زمان و کاربرد آن در طراحی قانون هدایت زیربهینه | ||
مکانیک هوافضا | ||
مقاله 7، دوره 18، شماره 4 - شماره پیاپی 70، دی 1401، صفحه 89-103 اصل مقاله (1.6 M) | ||
نوع مقاله: گرایش دینامیک، ارتعاشات و کنترل | ||
نویسندگان | ||
سجاد پاک خصال1؛ سعید شمقدری* 2 | ||
1دانشجوی دکتری، گروه کنترل، دانشکده مهندسی برق، دانشگاه علم و صنعت ایران، تهران، ایران | ||
2نویسنده مسئول: دانشیار، گروه کنترل، دانشکده مهندسی برق، دانشگاه علم و صنعت ایران، تهران، ایران | ||
تاریخ دریافت: 19 تیر 1401، تاریخ بازنگری: 18 مرداد 1401، تاریخ پذیرش: 02 شهریور 1401 | ||
چکیده | ||
در این مقاله، روشی برای کنترل زیربهینه سیستمهای چندجملهای متغیر با زمان ارائه و از آن برای طراحی قانون هدایت رهگیرها استفاده میشود. ازآنجاییکه معادلات برخورد رهگیر و هدف به فاصله بین آنها وابسته هستند و این فاصله در طول پرواز تغییر میکند، طراح قانون هدایت با یک سیستم متغیر با زمان مواجه است. روشهای توسعه دادهشده برای کنترل سیستمهای نامتغیر با زمان، بهطور مستقیم قابلاستفاده برای سیستمهای متغیر با زمان نیستند. یکی از رویکردهای کنترلی مرسوم برای طراحی قانون هدایت رهگیرها، کنترل بهینه میباشد. برنامهریزی پویای تقریبی یک روش شناختهشده برای حل مسئله کنترل بهینه است. یکی از چالشهای کاربرد این روش برای کنترل سیستمهای غیرخطی متغیر با زمان، سخت بودن حل معادله بلمن است. در روش پیشنهادی این مقاله، حل معادله بلمن با حل یک مسئله بهینهسازی مجموع مربعات جایگزین شده است. ثابت میشود که سیاست کنترلی طراحیشده با این روش، پایدارساز نمایی فراگیر و زیربهینه خواهد بود. درنهایت، کارایی روش پیشنهادی برای هدایت رهگیرها، از طریق شبیهسازیهای عددی نشان داده میشود. | ||
کلیدواژهها | ||
قانون هدایت زیربهینه؛ برنامهریزی پویای تقریبی؛ سیستم متغیر با زمان؛ بهینهسازی مجموع مربعات؛ الگوریتم تکرار سیاست | ||
عنوان مقاله [English] | ||
Sum-of-Squares Optimization Based Approximate Dynamic Programming for Time-Varying Systems and Its Application in Suboptimal Guidance Law Design | ||
نویسندگان [English] | ||
Sajjad Pakkhesal1؛ Saeed Shamaghdari2 | ||
1Ph.D. Student, Department of Control, Faculty of Electrical Engineering, Iran University of Science and Technology, Tehran, Iran | ||
2Corresponding author: Associate Professor, Department of Control, Faculty of Electrical Engineering, Iran University of Science and Technology, Tehran, Iran | ||
چکیده [English] | ||
In this paper, we propose a method for sub-optimal control of time-varying polynomial systems and use it for pursuits guidance law design. Since, engagement equations between pursuit and target are depend on the range between them and this range is varying during the flight, guidance law designer is faced with a time-varying system. The developed methods for control of time-invariant systems are not directly applicable for time-varying systems. One of the conventional approaches for pursuits guidance law design is the optimal control. Approximate dynamic programming is a well-known method for solving the optimal control problem. One of the challenges of using this method for control of nonlinear time-varying systems is the difficulty of solving the Bellman equation. In the proposed method of this paper, solving the Bellman equation has been relaxed with solving a sum-of-squares optimization problem. It will be proved that the designed control policy with this method is globally exponentially stabilizing. Finally, performance of the proposed method for pursuits guidance will be illustrated with numerical simulations. | ||
کلیدواژهها [English] | ||
Sub-optimal guidance law, Approximate dynamic programming, Time-varying systems, Sum-of-squares optimization, Policy iteration algorithm | ||
مراجع | ||
[1] Shneydor NA. Missile guidance and pursuit: kinematics, dynamics and control: Elsevier; 1998.## [2] Shaferman V, Shima T. Linear quadratic guidance laws for imposing a terminal intercept angle. Journal of Guidance, Control, and Dynamics. 2008;31(5):1400-12.## [3] Nasrollahi S, Khooshehmehri A. A model of predictive terminal guidance based on whale optimization algorithm considering the aerodynamic model of the pursuer. Journal of Aerospace Mechanics. 2021;17(1):37-50.## [4] Mohammadzaman I, Momeni H. PI Guidance Law Design with Finite Time Convergence. Journal of Aerospace Mechanics. 2011;7(1).## [5] Golestani M, Mohammadzaman I, Yazdanpanah MJ, Vali AR. Application of finite-time integral sliding mode to guidance law design. Journal of Dynamic Systems, Measurement, and Control. 2015;137(11):114501.## [6] Yang C-D, Chen H-Y. Nonlinear H robust guidance law for homing missiles. Journal of Guidance, Control, and Dynamics. 1998;21(6):882-90.## [7] Kirk DE. Optimal control theory: an introduction: Courier Corporation; 2004.## [8] Bellman R. Dynamic programming. Science. 1966;153(3731):34-7.## [9] Bellman R, Dreyfus S. Functional approximations and dynamic programming. Mathematical Tables and Other Aids to Computation. 1959:247-51.## [10] Howard RA. Dynamic programming and markov processes. 1960.## [11] Werbos P. Advanced forecasting methods for global crisis warning and models of intelligence. General System Yearbook. 1977:25-38.## [12] Kiumarsi B, Vamvoudakis KG, Modares H, Lewis FL. Optimal and autonomous control using reinforcement learning: A survey. IEEE transactions on neural networks and learning systems. 2017;29(6):2042-62.## [13] Sun J, Liu C, Ye Q. Robust differential game guidance laws design for uncertain interceptor-target engagement via adaptive dynamic programming. International Journal of Control. 2017;90(5):990-1004.## [14] Pakkhesal S, Shamaghdari S. Sum‐of‐squares‐based policy iteration for suboptimal control of polynomial time‐varying systems. Asian Journal of Control. 2021.## [15] Parrilo PA. Structured semidefinite programs and semialgebraic geometry methods in robustness and optimization: California Institute of Technology; 2000.## [16] Jiang Y, Jiang Z-P. Global adaptive dynamic programming for continuous-time nonlinear systems. IEEE Transactions on Automatic Control. 2015;60(11):2917-29.## [17] Zhu Y, Zhao D, He H. Invariant adaptive dynamic programming for discrete-time optimal control. IEEE Transactions on Systems, Man, and Cybernetics: Systems. 2019;50(11):3959-71.## [18] Yazdani NM, Moghaddam RK, Kiumarsi B, Modares H. A Safety-Certified Policy Iteration Algorithm for Control of Constrained Nonlinear Systems. IEEE Control Systems Letters. 2020;4(3):686-91.## [19] Vandenberghe L, Boyd S. Semidefinite programming. SIAM review. 1996;38(1):49-95.## [20] Prajna S, Papachristodoulou A, Parrilo PA. SOSTOOLS: sum of squares optimization toolbox for MATLAB–user’s guide. Control and Dynamical Systems, California Institute of Technology, Pasadena, CA. 2004;91125.## [21] ApS M. Mosek optimization toolbox for MATLAB. User’s Guide and Reference Manual, Version. 2019;4.## [22] Khalil HK. Nonlinear systems third edition. Patience Hall. 2002;115.## | ||
آمار تعداد مشاهده مقاله: 213 تعداد دریافت فایل اصل مقاله: 218 |