0 前言
隨著科學技術的發(fā)展,無人機、無人坦克和無人潛艇等各種無人駕駛武器系統(tǒng)開始出現(xiàn)在戰(zhàn)場上,其作戰(zhàn)任務也從深入敵后進行偵查發(fā)展到發(fā)射導彈炸彈直接進行攻擊。與其他武器系統(tǒng)相比,這些武器系統(tǒng)具有自己的特點,如需要實時傳送高清視頻信號,需要對其進行遠程操作控制。傳送回來的高清視頻圖像一方面作為偵查的結果提供給有關作戰(zhàn)人員使用,另一方面作為遙控人員操作控制的依據(jù)。
這兩個特點,正好涉及到控制中心顯示控制系統(tǒng)的工作,本文從顯示控制系統(tǒng)的角度提出并研究用于無人駕駛系統(tǒng)(以下簡稱無人系統(tǒng))的顯示控制群自組織問題。
1 問題的起因
從一個簡單的例子談起:設有N (N>2)個無人機系統(tǒng)對某一地區(qū)進行掃描偵察,在任務規(guī)劃時,可以規(guī)劃出一個執(zhí)行任務的最佳方案,例如覆蓋更大的區(qū)域,避免活動目標被遺漏等[1]。在執(zhí)行任務時,如果其中一架無人機被擊落,剩余的無人機的行動就需要進行調(diào)整,執(zhí)行新的方案。被擊落的無人機位置不同,調(diào)整的方案可能就不同,應對的行動變化也就不同。如果又有一架無人機被擊落,剩余的無人機的行動需要再次調(diào)整。現(xiàn)在如果有新的無人機發(fā)射升空,又需要調(diào)整各個無人機的行動方案。
這實際上就是需要N個無人機組成的系統(tǒng)群在執(zhí)行任務時能夠自動組織起來,相互配合,調(diào)整各自的行動,適應變化的環(huán)境,隨時形成優(yōu)化的方案,以達到更好的執(zhí)行效果。不僅是無人系統(tǒng)群構成變化、環(huán)境變化,如果任務發(fā)生變化,這個無人機組成的系統(tǒng)群也要及時相應地做出改變。事實上,在控制中心顯示控制系統(tǒng)建設中,已經(jīng)遇到類似的問題。在控制中心有數(shù)千臺設備在工作。為了完成某些任務、在實現(xiàn)某些功能時,通常需要許多不同類型的設備協(xié)調(diào)動作。不僅在控制中心內(nèi),控制中心之間也有設備協(xié)調(diào)控制問題。為了解決顯示控制系統(tǒng)的控制問題,采用數(shù)學中群論的方法,形成了顯示控制群的自組織方法。這個方法可以應用于N個無人系統(tǒng)組成系統(tǒng)的自組織、自適應問題。
一般地,當有N個設備(可以是無人系統(tǒng),也可能是不同種類、不同功能、不同型號的設備)需要協(xié)調(diào)工作、完成多目標任務時,根據(jù)顯示控制群論的方法,需要進行如下工作。
(1)設備的形式化:通過定義虛擬設備的概念,使控制系統(tǒng)能夠統(tǒng)一地組織、控制各種各樣不同種類、不同功能、不同性能、不同操作動作和不同狀態(tài)表示的顯控系統(tǒng)中的設備(或武器系統(tǒng))。
(2)組成顯示控制群:虛擬設備組成被稱為顯示控制群(簡稱顯控群)的系統(tǒng)。從而形成把對全域的虛擬設備協(xié)調(diào)統(tǒng)一控制分為多層次的對各子顯控群的控制,通過對子顯控群的控制實現(xiàn)對全域設備的控制,而且這種控制可以分布式通過虛實設備轉(zhuǎn)換實現(xiàn)。
(3)設備的形式接口:包括(a)提供一個命令集,用于接受顯控群發(fā)來的命令。通過執(zhí)行這些命令,設備(或武器系統(tǒng))能進行顯控群所需的全部操作,實現(xiàn)其功能。(b)提供一個狀態(tài)集,用于向顯控群報告設備(或武器系統(tǒng))的狀態(tài),使顯控群能了解它對命令的執(zhí)行情況,對功能的實現(xiàn)情況。
(4)顯控群的自組織:虛擬設備命令集中的命令在執(zhí)行時對先后順序的要求形成了一種時間的前提關系,可以用于自動形成命令的執(zhí)行序列和并發(fā)執(zhí)行。命令集在執(zhí)行時對設備的需求形成了一種空間的前提關系,可以用于自動組織起一組設備的空間組合。通過虛擬命令,顯控群可以自動組織起一個實現(xiàn)某種功能的子顯控群。而一個顯控群最大的子群就是它自身,即顯控群可以實現(xiàn)自組織。
(5)顯控群的自適應:一個顯控群,不論把它斷成幾段,每一段都還是顯控群,會重構適應改變了的情況,完成預定任務;如果重新連接,又會自動恢復成一個顯控群。這就是建設打不垮的指揮控制系統(tǒng)的一個重要理論基礎。
(6)演化硬件方法用于自組織:演化硬件是指一種能動態(tài)自主重新配置自身結構的硬件,一種具有在線適應性的硬件。顯控群采用這種方法,實現(xiàn)在遺傳算法控制下的可優(yōu)化的自組織,使顯控群能夠通過對環(huán)境的感知和與環(huán)境的交互來動態(tài)適應變化的環(huán)境。
2系統(tǒng)的控制結構
當把顯示控制理論用于無人系統(tǒng)的自組織時,首先要討論系統(tǒng)群的控制結構??梢杂腥N形式的控制結構。
(1)通過控制中心,進行集中規(guī)劃、集中控制如圖1所示。這是傳統(tǒng)的直接由控制中心實施控制的方式。
(2)沒有固定的控制中心,而是由各無人系統(tǒng)分布式輪流擔任控制中心,進行集中規(guī)劃、集中控制如圖2所示。這是一種令牌環(huán)控制方式。由獲得控制權的無人系統(tǒng)成為控制中心,并實施控制。經(jīng)過一段時間,把控制權轉(zhuǎn)交給下一個無人系統(tǒng),使之成為控制中心進行控制。只要把任務注入系統(tǒng),這些無人駕駛系統(tǒng)就自動組織起來,始終存在一個控制中心,組織各系統(tǒng)完成任務。如果擔任控制中心的無人駕駛系統(tǒng)被擊毀,剩余的系統(tǒng)會由于超時而產(chǎn)生新的控制中心,繼續(xù)進行工作。如果某一作為控制中心的系統(tǒng)發(fā)現(xiàn)有其他控制中心存在,就比較系統(tǒng)編號,編號小的自動停止運行。這就保證了只有一個控制中心在工作。
圖2只是表示了控制權的輪循,實際還有各無人系統(tǒng)之間的通信問題,也可采用無線令牌的方式,此時會形成兩層令牌的傳遞如圖3所示。圖中底層是通信網(wǎng)絡的令牌在傳遞,上層是控制權的傳遞,各自傳遞各自的,互不影響。這說明控制權的傳遞與通信網(wǎng)絡中令牌的傳遞不是一回事。通信網(wǎng)絡中令牌的傳遞要比控制權的傳遞快得多,且傳遞的方向也可能不同。
(3)沒有控制中心,各設備(或武器系統(tǒng))分布式規(guī)劃行動,進行民主集中式的行動方案選擇,實現(xiàn)分布式的控制如圖4所示。此時雖然沒有控制中心,但還需要各無人系統(tǒng)之間的通信,例如可采用無線令牌方式進行通信。
控制結構(1)和(2)的區(qū)別是一個有固定的控制中心,另一個是由無人系統(tǒng)輪流擔任控制中心,其控制方法基本相同。顯然,系統(tǒng)進行自重構、自組織是指控制結構(2)和(3)這兩種控制形式。在這兩種情況下,當某一無人系統(tǒng)被毀,剩余的無人系統(tǒng)能自動重新組成群如圖5(a)所示。反之,如果有新的無人系統(tǒng)加入,也能進行重構如圖5(b) 所示。這種重構能力是令牌傳遞方式所支持的,新加入的無人系統(tǒng)可根據(jù)編號順序自動加入群。
三種結構雖有不同,但控制方法是相同的,即根據(jù)各系統(tǒng)的當前狀態(tài),找出群下一步的行動方案,使各系統(tǒng)協(xié)調(diào)動作??刂平Y構(1)和(2)都是由控制中心計算出群的行動方案,然后注入其他無人系統(tǒng),使其執(zhí)行。控制結構(3)是由各無人系統(tǒng)各自計算出群的行動方案,然后對這些方案進行一次方案評價分數(shù)的排序,分別都取得分最高的方案來行動,得分相同的按無人系統(tǒng)的編號排序。于是各無人系統(tǒng)雖然分別計算,卻都取到同一個方案,因此稱為民主集中式的方案選擇與控制。
3 自組織的控制方法
根據(jù)顯示控制群論的方法,各種設備、各個無人駕駛系統(tǒng),都可以形式地表示為接收命令、返回狀態(tài)的虛擬設備,c是此設備接受命令的集合,s是這個設備狀態(tài)的集合。
由N個設備組成的系統(tǒng),可以定義為一個顯示控制群(簡稱顯控群)。這個群可以根據(jù)要完成的任務,自行組織虛擬設備工作,并且在情況發(fā)生變化時重新組織設備。
設有N個無人系統(tǒng)作為N個個體,也可視為N個虛擬設備。每個個體有自己的當前狀態(tài),有行動的可選方案如圖6所示。這就構成了一個群的行動方案空間,于是確定各無人系統(tǒng)下一步的行動,就成為在此空間的一種搜索。
于是采用遺傳算法在方案空間中進行搜索,形成系統(tǒng)群的下一步行動方案。這是顯示控制群自組織的演化硬件方法的一種應用。當無人系統(tǒng);(1≤i≤N)被擊毀,空間中該系統(tǒng)的狀態(tài)不再有效,作為系統(tǒng)群將重新在方案空間中找出嚎新曲線,成為其余的各無人系統(tǒng)的行動依據(jù)。
軟件仿真是用MATLAB編程進行的,群體的規(guī)模設為16,交叉概率設為0.6,變異概率設為0 001。運行的結果如圖7所示:16個無人系統(tǒng)選擇行動方案的滿意度計算曲線。從曲線可以看出當評價函數(shù)值達到1.9時的迭代次數(shù)。仿真程序中迭代1000次,以便觀察評價函數(shù)值形成的曲線。
有時需要得到不止下一步,而是多步甚至是全部行動方案時,可進行連續(xù)計算如圖8所示。前述的評價函數(shù)稱為橫向評價函數(shù)。多步計算的評價函數(shù)稱為縱向評價函數(shù)。此時不存在硬約束的情況,需規(guī)定每步的滿意度最低分值,并計算總分.得到評價分。
在結構(1)和(2)的情況下.控制中心將各無人系統(tǒng)的方案分發(fā)各系統(tǒng)。
在結構(3)的情況下,每個無人系統(tǒng)分別各自計算出行動方案,并分發(fā)給其他無人系統(tǒng)。各系統(tǒng)分別對這~種方案進行排序,取得評價分最高的,若得分相同則取編號靠前的。這樣各自分別自動找到一個相同的方案,并寅施行動。當無人系統(tǒng)增加或減少,則重新計算方案,以適應變化的情況。
4 結語
本文將顯示控制群的設備自組織方法用于無人系統(tǒng)群的自動控制技術研究。采用顯控群理論和方法,使無人系統(tǒng)組成的系統(tǒng)群形成自組織自適應的作戰(zhàn)能力。這個方法可以用于未來戰(zhàn)爭中夫規(guī)模的機器人群的自組織作戰(zhàn)。即使失去人工操作,這個群將繼續(xù)上作、能自行組織,形成優(yōu)化的作戰(zhàn)方案,并盡最大可能來自動執(zhí)行預定的作戰(zhàn)任務。