《電子技術應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 基于模仿學習和強化學習的啟發式多智能體路徑規劃
基于模仿學習和強化學習的啟發式多智能體路徑規劃
網絡安全與數據治理
郭傳友,劉志飛,田景志,劉先忠
中國人民解放軍61150部隊
摘要: 多智能體路徑規劃(Multi-Agent Path Finding, MAPF)擴展到大型動態環境中是一個越來越有挑戰的問題?,F實世界中,環境動態變化往往需要實時重新規劃路徑。在部分可觀察環境中,使用強化學習方法學習分散的策略解決MAPF問題表現出較大潛力。針對智能體之間如何學會合作和環境獎勵稀疏問題,提出基于模仿學習和強化學習的啟發式多智能體路徑規劃算法。實驗表明,該方法在高密度障礙環境中具有較好的性能和擴展性。
中圖分類號:TP181文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2024.09.006
引用格式:郭傳友,劉志飛,田景志,等.基于模仿學習和強化學習的啟發式多智能體路徑規劃[J].網絡安全與數據治理,2024,43(9):33-40.
Heuristic multi-agent path finding VIA imitation learning and reinforcement learning
Guo Chuanyou,Liu Zhifei,Tian Jingzhi,Liu Xianzhong
Chinese People′s Liberation Army 61150 Unit
Abstract: The extension of multi-agent path finding(MAPF) to large-scale dynamic environment is an increasingly challenging problem. In the real world, dynamic changes in the environment often require real-time re planning. Using reinforcement learning method to learn decentralized strategies in some observable environments shows great potential to solve MAPF problems. A heuristic multi-agent path planning algorithm based on imitation learning and reinforcement learning is proposed to address the problems of how intelligent agents learn to cooperate and sparse environmental rewards. Experiments show that this method has good performance and scalability in high-density obstacle environment.
Key words : multi-agent path finding; reinforcement learning; imitation learning; heuristic

引言

MAPF是對不同起始位置的多個智能體到他們各自目標位置的路徑規劃問題,關鍵約束是在保證智能體之間互相不碰撞的前提下到達目標位置,并保證路徑規劃的速度和質量。MAPF在實際場景中有許多應用,如大型倉庫管理[1-2]、數字游戲[3]、火車調度[4]、城市道路網絡[5]、多機器人系統[6]等,更多實際應用可參考文獻[7]。近年來,越來越多的團隊對MAPF展開研究[8-11],MAPF取得了突破性進展,尤其是基于強化學習(Reinforcement Learning, RL)方法應用到MAPF問題中取得了較好效果,國內對MAPF問題的研究也越來越濃厚。

求解MAPF的最優解已經被證明是NPHard問題[12]。傳統方法將MAPF規約為其他已解決的問題如SAT[13],或使用基于搜索的算法來解決,經典方法有增強的搜索[14]、基于沖突的搜索[15]以及改進的變體[16]等。然而,隨著環境的動態變化和智能體數量的增加,搜索空間巨大對傳統MAPF算法構成挑戰。基于搜索的MAPF算法通過引入優先規劃、大領域搜索和復雜的啟發式函數來優化改進MAPF算法,前沿的算法有EECBS[17]、CCBS[18]、MOA*[19]、MAPFMLLNS[20]。這些算法能解決3 000多個智能體規模的MAPF問題,而且規劃效率和質量較高,但這些集中式規劃算法不能實時規劃路徑,可擴展性差。最近,分散式執行的強化學習方法應用于解決MAPF問題表現出較大的潛力,每個智能體根據局部觀察分散執行策略。

RL智能體在大型環境中和環境互動時,只有達到目標才可以獲取獎勵,而到達目標的過程中獎勵稀疏,學習效率不高,訓練時間長,智能體還可能陷入死胡同。PRIMAL(Pathfinding via Reinforcement and Imitation MultiAgent Learning)[21]采取集中式MAPF規劃器生成專家演示路徑,訓練過程中結合了模仿學習和強化學習,加速了學習過程,但計算比較耗時,求解質量還需提高。G2RL(Globally Guided RL)[22]給予每個智能體額外的獎勵遵循單智能體最短路徑,但這可能會誤導智能體,因為到達目標位置的路徑不是唯一的,這會影響智能體和其他智能體之間的協調合作。DHC(Distributed Heuristic multiagent path finding with Communication)[23]使用多條潛在路徑作為智能體路徑的啟發式輸入,并采用圖卷積網絡來加強智能體之間的通信,促進智能體之間的顯式協調,但學習速度較慢。為了解決上述問題,本文提出了基于強化學習和模仿學習的啟發式多智能體路徑規劃算法(Heuristic multi-agent path planning via Imitation and Reinforcement Learning, HIRL),在智能體的觀察中加入額外的目標向量,并嵌入從目標源到智能體的多條潛在最短路徑作為神經網絡的輸入,使用模仿學習來促進智能體之間的隱式協調,引入目標牽引的獎勵函數來鼓勵智能體進行有效的探索,當智能體向目標方向移動時給予正獎勵。智能體依據自己的局部觀察來做出決策,不需要學習聯合動作值,因此具有很好的可擴展性。本文采用的主要方法如下:

(1)采用模仿學習框架加速智能體學習,促進智能體之間的隱式協調,而不需要智能體之間的顯式通信。

(2)采用智能體到目標位置的方向向量作為智能體觀察的額外信息。

(3)引入目標牽引的獎勵函數,鼓勵智能體朝著目標方向進行有效的探索。

(4)嵌入了從目標源到智能體多條最短路徑作為神經網絡的輸入,能更有效地避免智能體之間的沖突和死鎖情況發生。

(5)使用部分可觀察的環境,智能體根據有限視野的觀察決策行動,更加符合現實世界的環境。


本文詳細內容請下載:

http://www.cowatch.cn/resource/share/2000006161


作者信息:

郭傳友,劉志飛,田景志,劉先忠

(中國人民解放軍61150部隊,陜西榆林719000)


Magazine.Subscription.jpg

此內容為AET網站原創,未經授權禁止轉載。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          日韩一级黄色片| 国产精品裸体一区二区三区| 一区二区三欧美| 在线不卡中文字幕| 亚洲欧美成人| 亚洲精品乱码久久久久久日本蜜臀| 乱人伦精品视频在线观看| 在线观看日韩av| 两个人的视频www国产精品| 一区二区欧美激情| 一区二区三区成人精品| 欧美午夜不卡视频| 国产精品一区久久久久| 欧美激情精品久久久久久大尺度| 一区福利视频| 午夜国产精品视频免费体验区| 国产精品日韩在线播放| 狠狠v欧美v日韩v亚洲ⅴ| 欧美亚洲第一区| 狠狠综合久久av一区二区老牛| 欧美色图麻豆| 99精品国产在热久久下载| 欧美日韩午夜精品| 久热精品视频在线免费观看| 亚洲欧美激情四射在线日| 精品成人国产| 在线观看成人av电影| 欧美精品一区二区高清在线观看| 久久精品五月| 亚洲精品欧美专区| 999在线观看精品免费不卡网站| 久久精品国产在热久久| 欧美日韩视频在线第一区| 国产一区二区精品在线观看| 欧美伊人久久久久久久久影院| 91久久国产综合久久91精品网站| 久久精品国产一区二区三区免费看| 久久精品在线观看| 欧美成人免费播放| 欧美日韩一卡二卡| 亚洲成色999久久网站| 欧美中文字幕第一页| 国产亚洲欧美日韩日本| 久热爱精品视频线路一| 欧美日韩不卡| 欧美高清日韩| 久久婷婷色综合| 亚洲最新中文字幕| 国产精品乱人伦中文| 国产精品美女久久久浪潮软件| 国产人妖伪娘一区91| 激情亚洲一区二区三区四区| 欧美日韩一区二区在线观看| 一区二区欧美日韩视频| 亚洲欧洲日韩综合二区| 欧美一区二区三区成人| 国产午夜精品一区二区三区欧美| 欧美成人精品| 亚洲欧洲日产国码二区| 在线一区二区三区四区| 欧美国产成人在线| 久久综合婷婷| 91久久午夜| 亚洲精品国产精品国自产在线| 在线看片成人| 国产丝袜一区二区三区| 国产精品免费网站| 欧美日韩一区二区在线播放| 好吊视频一区二区三区四区| 噜噜噜在线观看免费视频日韩| 9i看片成人免费高清| 欧美日韩精品综合在线| 亚洲一区在线播放| 亚洲动漫精品| 亚洲在线一区二区| 欧美激情一区在线| 国产精品99久久不卡二区| 国产一区二区三区在线观看免费| 国产亚洲精品一区二区| 欧美精品手机在线| 国产精品一区三区| 一区精品在线| 一区二区免费在线播放| 国产一区999| 欧美婷婷在线| 亚洲国产va精品久久久不卡综合| 亚洲一区二区三区四区中文| 99精品视频免费全部在线| 国产精品一区二区三区久久久| 亚洲高清免费视频| 欧美性猛交xxxx免费看久久久| 欧美激情精品久久久久久变态| 国产精品午夜国产小视频| 国产一区二区精品久久99| 国产日韩一区二区三区在线播放| 好看不卡的中文字幕| 欧美日韩国产精品一区二区亚洲| 欧美午夜免费电影| 欧美日韩成人在线播放| 欧美麻豆久久久久久中文| 欧美日韩免费在线| 国产一区二区欧美日韩| 国产精品theporn88| 国产色爱av资源综合区| 亚洲欧美中文字幕| 亚洲美女在线看| 性色av一区二区三区红粉影视| 国内伊人久久久久久网站视频| 91久久一区二区| 亚洲人久久久| 激情视频一区二区| 亚洲国产精品99久久久久久久久| 欧美日韩视频| 亚洲精品久久久久久下一站| 欧美日韩一区二区三区四区五区| 欧美日韩一区二区视频在线| 欧美自拍偷拍午夜视频| 国产欧美一区二区精品婷婷| 美女诱惑黄网站一区| 久久国产精品久久久| 国产精品激情电影| 国产精品一区二区男女羞羞无遮挡| 久久影视精品| 国产亚洲一区二区三区在线观看| 欧美日韩国产一区二区三区地区| 国产亚洲成年网址在线观看| 亚洲精品综合久久中文字幕| 亚洲高清三级视频| 久久精品视频在线| 国产精品欧美日韩一区| 新狼窝色av性久久久久久| 国产精品免费区二区三区观看| 亚洲深夜福利网站| 精品成人久久| 亚洲一区在线观看视频| 红桃视频一区| 国产精品久久亚洲7777| 久久免费视频网站| 国产视频在线观看一区二区三区| 久久久久久国产精品一区| 欧美激情一区二区三区| 国产亚洲欧美一级| 亚洲国产欧美一区二区三区同亚洲| 午夜国产不卡在线观看视频| 久久久久国产精品www| 亚洲一二三区在线观看| 欧美精品一线| 国产精品久久久久久久久久久久久| 欧美三区美女| 一本久道久久综合婷婷鲸鱼| 91久久精品久久国产性色也91| 亚洲男人的天堂在线| 欧美激情精品久久久六区热门| 美女视频网站黄色亚洲| 国产日韩欧美| 欧美精品在线一区二区| 亚洲国产精品99久久久久久久久| 99成人免费视频| 欧美14一18处毛片| 亚洲精品久久久久久久久久久久| 一区二区三区精品国产| 欧美天天影院| 最新国产精品拍自在线播放| 一本久久a久久免费精品不卡| 久久久久九九九| 欧美精品在线免费| 欧美久久视频| 在线免费日韩片| 亚洲欧美一级二级三级| 1000部国产精品成人观看| 亚洲看片免费| 久久久91精品国产一区二区精品| 国产午夜精品一区二区三区欧美| 99re6这里只有精品| 欧美日韩精品一区二区| 亚洲国产欧洲综合997久久| 一区二区av| 亚洲欧美日本精品| 香蕉成人伊视频在线观看| 欧美系列一区| 国产日韩欧美视频在线| 亚洲欧美日韩在线综合| 国产九色精品成人porny| 在线成人黄色| 日韩视频在线观看| 男同欧美伦乱| 亚洲欧洲日韩在线| 久久阴道视频| 亚洲欧美日韩一区二区三区在线| 亚洲网站在线| 欧美午夜寂寞影院| 亚洲综合日韩中文字幕v在线| 国内不卡一区二区三区| 一本色道综合亚洲| 欧美日韩免费视频| 国产精品久久夜| 欧美精彩视频一区二区三区| 午夜精品一区二区三区在线视| 99国产精品私拍| 精品96久久久久久中文字幕无| 亚洲国产精品成人综合| 欧美激情亚洲精品| 亚洲欧美成aⅴ人在线观看| 欧美屁股在线| 久久成人一区| 欧美视频在线观看免费网址| 国产精品一二三视频| 国产精品大全| 一区二区三区三区在线| 亚洲免费成人av| 国产一区二区日韩精品| 国产视频一区二区三区在线观看| 久久国产精品久久久久久电车| 欧美人与性动交cc0o| 在线国产欧美| 国产日韩精品综合网站| 午夜精品久久久久久久99樱桃| 亚洲国产日韩欧美综合久久| 国产精品伦理| 一区二区三区高清| 欧美成人亚洲成人日韩成人| 99精品热视频只有精品10| 免费看的黄色欧美网站| 在线成人国产| 国产精品久久久久久户外露出| 最新国产精品拍自在线播放| 欧美aⅴ一区二区三区视频| 国产一区二区三区高清| 欧美国产在线观看| 久久综合色婷婷| 一区二区国产精品| 久久久国产成人精品| 欧美极品aⅴ影院| 欧美亚洲一区二区在线| 国产真实乱子伦精品视频| 一区二区精品在线| 国产一区二区三区在线观看免费| 美女尤物久久精品| 国产在线精品成人一区二区三区| 国产婷婷色一区二区三区在线| 国产日韩欧美在线视频观看| 欧美日韩午夜在线| 91久久国产精品91久久性色| 欧美国产欧美亚洲国产日韩mv天天看完整| 欧美精品18+| 国产精品免费aⅴ片在线观看| 狠狠入ady亚洲精品| 国产精品国产三级国产aⅴ无密码| 欧美日韩中文字幕日韩欧美| 国产九色精品成人porny| 欧美一区二区三区四区视频| 欧美日韩中文字幕在线| 亚洲欧美综合一区| 欧美一区二区三区精品电影| 欧美视频在线观看免费| 欧美午夜激情在线| 久久青青草综合| 欧美日韩无遮挡| 国产综合欧美| 国产午夜亚洲精品羞羞网站| 国产日韩欧美一区二区三区在线观看| 欧美极品欧美精品欧美视频| 国内精品久久久久国产盗摄免费观看完整版| 91久久久久久国产精品| 制服丝袜激情欧洲亚洲| 国产精品盗摄久久久| 亚洲欧美日韩国产中文在线| 国产精品毛片高清在线完整版| 久久精品视频在线播放| 欧美亚洲三区| 国语自产精品视频在线看抢先版结局| 亚洲欧美另类在线| 欧美 日韩 国产一区二区在线视频| 久久国产加勒比精品无码| 国产精品毛片大码女人| 影音先锋久久精品| 久久亚洲精品中文字幕冲田杏梨| 亚洲风情在线资源站| 欧美gay视频| 欧美激情中文不卡| 国产精品一区毛片| 国产精品福利片| 每日更新成人在线视频| 欧美日本国产在线| 一本久久综合亚洲鲁鲁五月天| 国产精品乱码一区二三区小蝌蚪| 香蕉国产精品偷在线观看不卡| 久久aⅴ国产紧身牛仔裤| 亚洲一二三区视频在线观看| 激情视频一区二区| 在线免费高清一区二区三区| 久久久久国产一区二区| 久热精品视频| 欧美一区二区私人影院日本| 欧美福利一区| 欧美激情精品久久久六区热门| 亚洲黑丝在线| 99re66热这里只有精品4| 亚洲三级性片| 欧美激情一区| 亚洲精选在线观看| 亚洲精品久久久久久久久久久| 欧美多人爱爱视频网站| 国产精品欧美久久| 国产精品国产成人国产三级| 国内精品免费在线观看| 亚洲人www| 欧美激情免费观看| 91久久夜色精品国产九色| 99视频精品全部免费在线| 狼人天天伊人久久| 久久国产免费看| 亚洲欧洲日本专区| 亚洲欧美视频在线观看视频| 玖玖玖免费嫩草在线影院一区| 欧美国产一区二区在线观看| 欧美日韩国产成人在线观看| 欧美日韩在线播放一区| 亚洲精品视频一区| 亚洲综合999| 久久久午夜精品| 一本一本久久a久久精品综合妖精| 激情丁香综合| 美女爽到呻吟久久久久| 亚洲精品久久久久久一区二区| 欧美高清视频在线播放| 在线亚洲激情| 欧美国产欧美亚洲国产日韩mv天天看完整|