天天看點

推薦論文|航天器追蹤-逃逸-防禦三方博弈均衡解

推薦論文|航天器追蹤-逃逸-防禦三方博弈均衡解

本文内容轉載自微信公衆号:中國空間科學技術,來源:《中國空間科學技術(中英文)》2024年第4期。版權歸原作者及刊載媒體所有,所刊載内容僅供交流參考使用,不代表本刊立場。

引用格式

李振瑜,林鲲鵬,侯育卓,等.航天器追蹤-逃逸-防禦三方博弈均衡解[J].中國空間科學技術(中英文),2024,44(4):90-101.

LI Z Y,LIN K P,HOU Y Z,et al.Equilibrium of orbital pursuit-evasion-defense three-sided game[J].Chinese Space Science and Technology,2024,44(4):90-101(in Chinese).

文章導讀

1.研究背景

随着空間交會與抵近技術(rendezvous and proximity operation,RPO)的發展,針對非合作目标的在軌接近試驗也越來越多。2018年,英國首次在太空開展了利用繩系和飛網清除空間碎片的技術試驗。2019~2020年,美國“地球同步空間态勢感覺計劃”衛星(geosynchronous space situational awareness program,GSSAP)多次近距離監視各國地球靜止軌道衛星。2022年,美國SpaceX公司的星鍊衛星兩次接近中國空間站,空間站進行了緊急的規避機動。這些太空活動對于空間環境的安全構成了潛在的威脅。由于在軌的各類導航/偵察/通信/遙感衛星在衆多領域中發揮着至關重要的作用,航天器的在軌防禦問題也成為關系國家重大利益的安全問題。在此背景下,航天器軌道追逃博弈問題正逐漸成為學術理論研究的熱點。

近年來,三人追逃博弈問題的研究主要集中在空戰領域。例如:地面發射飛彈攔截空中的飛機,飛機同時發射空對空飛彈,通過主動攔截進攻彈來保護自己,形成了目标器-攻擊器-防禦器(target-attacker-defender,TAD)三人博弈問題。針對該問題,很多學者從不同的角度開展了研究。Shaferman和Shima從逃逸方和防禦方的角度提出了一種合作制導律,該制導律中采用一種多模型自适應濾波器來估計來襲飛彈使用的制導參數,通過雙方的合作來減小防禦彈的機動量。Ratnoo等從追蹤方的角度對TAD問題進行了分析,推導了追蹤器成功躲避防禦器所需發射條件的解析表達式。而Perelman和Shima同時設計了三方的最優制導律,并對極限導航增益情況下的博弈結果進行了仿真分析。在此基礎上,Prokopov和Shima進一步将目标器和防禦器之間潛在的合作方式分為三種類型:由目标器主導的單向合作、由防禦器主導的單向合作和雙方共同主導的雙向合作。仿真結果表明,當目标器和防禦器雙向合作時的博弈結果最佳。而後Weiss等以能量消耗為最優化目标,得到了在允許脫靶量下實作攔截和逃逸所需的最小能量。此外,還有很多研究從不同的方面改進了上述政策,包括:優化開關函數、提高對遠距離追逃适用性等。

盡管已經有不少文獻對飛彈追逃的三人博弈問題進行了深入研究,但對于航天器在軌道上的三人追蹤-逃逸-防禦(pursuit-evasion-defender,PED)博弈的研究工作卻相對較少,而飛彈追逃問題和軌道追逃有較大的差别:首先是動力學模型的差異,航天器間的引力差通常不能像飛彈一樣忽略;其次,軌道追逃問題中沒有飛彈的線性碰撞三角模型來确定剩餘攔截時間;此外,軌道上的防禦器可以不由逃逸器發射,而是提前在逃逸器的周圍繞飛或潛伏。近幾年,陸續有學者開展了航天器三人博弈問題的研究。Liu等研究了該三人博弈問題,結合粒子群算法和牛頓插值法求解三航天器在脈沖推力下的博弈最優軌迹。趙琳等采用模糊綜合評估方法設計了追蹤器的目标函數,将問題轉化為兩點邊值問題,采用多重打靶法求解了最優的追蹤控制政策。陳木生考慮了三人博弈中的二對一和追蹤逃逸防禦等情況,基于協同進化算法優化得到了追蹤器、逃逸器和防禦器三方各自的博弈政策。但這些研究得到的均是開環最優軌迹,不能反映三航天器之間實時的博弈沖突。Liang等圍繞此空間主動防禦問題建立了航天器二對二博弈模型,包括攔截者、保護者、目标器和防禦器四個對象,得到了實時的閉環制導律,但其采用的博弈制導模型仍然忽略了航天器間的引力差。王淳寶等從追蹤方的角度設計了一種博弈模型切換的實時閉環制導政策,根據時間将三人博弈問題轉化為分段二人博弈問題。第一階段追蹤器規避防禦器,第二階段追蹤器追擊逃逸器,最終可使追蹤器在躲避防禦器的基礎上實作對目标器的快速攔截。但是該模型的本質仍然是一種二人博弈模型,且僅能求解追蹤器的制導政策。

為發展一種考慮三人博弈模型下的閉環實時制導政策,本文研究了航天器的追蹤-逃逸-防禦三人博弈問題,旨在求解三方博弈的納什均衡,得到最優的追蹤制導律和最優的逃逸防禦合作制導律。相較于以往的研究,主要的創新和優勢如下:1)控制決策模型是一種三人博弈模型,即在政策設計時,每個航天器均同時考慮其他兩個航天器;2)博弈政策計算效率高,可用于實時制導。此外,該方法可拓展至多個防禦器存在的情況。需要說明的是,研究中假設所有航天器均采用連續推力機動并擁有完全資訊條件。

2.文章梗概

為提高航天器在軌防禦能力,對航天器追蹤-逃逸-防禦三方博弈場景進行了研究。博弈中,追蹤航天器(追蹤器)旨在攔截逃逸航天器(逃逸器),逃逸器旨在躲避追蹤器,而防禦航天器(防禦器)通過主動攔截追蹤器來保護逃逸器。由于防禦器的存在,追蹤器在接近目标時不得不規避防禦器,而逃逸器和防禦器之間也可以開展合作。對于這樣的場景,綜合能量和距離名額,建立了線性二次型微分對策模型,推導了三方博弈的納什均衡條件,求解了追蹤器的最優追蹤制導律和逃逸器與防禦器的最優合作逃逸-防禦制導律。進一步考慮多防禦器的場景,求解了三方多人博弈的納什均衡解。仿真結果表明,防禦器的存在提高了逃逸器的生存能力,二者可以在機動加速度劣勢情況下共同抵禦一個機動能力強的追蹤器。處在繞飛護衛下的防禦器的初始位置并非離追蹤器或逃逸器越近越好,而是存在優勢位置。

3.總結與展望

本文研究了航天器在軌道上的追蹤-逃逸-防禦三方博弈問題,推導了博弈的納什均衡解,對最優軌迹進行了仿真分析,得到主要結論如下:

1)防禦器的存在可以提高逃逸器的生存能力,當防禦器的能量權重系數低于某臨界點時,防禦器和逃逸器在博弈中占優勢,追蹤器在博弈中占劣勢;反之,則防禦器和逃逸器在博弈中占劣勢,追蹤器在博弈中占優勢。

2)逃逸器和防禦器的合作可以使得二者在機動加速度都較小的情況下,依然可能共同抵禦一個機動能力強的追蹤器。

3)處在繞飛護衛狀态下的防禦器的初始位置并非離追蹤器或逃逸器越近越好,而是存在優勢位置。

作者簡介

李振瑜,北京跟蹤與通信技術研究所助理研究員,研究方向為航天器軌道博弈技術。

羅亞中,國防科技大學空天科學學院教授,研究方向為航天動力學、載人航天任務規劃技術。

點選文末“閱讀原文”

登入官網下載下傳原文

初審:張 琳複審:宋啟凡

終審:金 君

資訊