書(shū)馨卡幫你省薪 2024個(gè)人購(gòu)書(shū)報(bào)告 2024中圖網(wǎng)年度報(bào)告
歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)
>
基于強(qiáng)化學(xué)習(xí)的無(wú)人系統(tǒng)智能決策

基于強(qiáng)化學(xué)習(xí)的無(wú)人系統(tǒng)智能決策

出版社:國(guó)防工業(yè)出版社出版時(shí)間:2024-09-01
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 276
中 圖 價(jià):¥72.4(6.7折) 定價(jià)  ¥108.0 登錄后可看到會(huì)員價(jià)
加入購(gòu)物車 收藏
運(yùn)費(fèi)6元,滿39元免運(yùn)費(fèi)
?新疆、西藏除外
本類五星書(shū)更多>

基于強(qiáng)化學(xué)習(xí)的無(wú)人系統(tǒng)智能決策 版權(quán)信息

  • ISBN:9787118134957
  • 條形碼:9787118134957 ; 978-7-118-13495-7
  • 裝幀:一般膠版紙
  • 冊(cè)數(shù):暫無(wú)
  • 重量:暫無(wú)
  • 所屬分類:

基于強(qiáng)化學(xué)習(xí)的無(wú)人系統(tǒng)智能決策 本書(shū)特色

聚焦無(wú)人系統(tǒng)代表無(wú)人機(jī)與強(qiáng)化學(xué)習(xí)理論結(jié)合,精準(zhǔn)定位關(guān)鍵技術(shù)融合應(yīng)用領(lǐng)域,具有前沿性與創(chuàng)新性。 全面覆蓋多類任務(wù)背景下自主決策問(wèn)題研究,從路徑規(guī)劃到集群任務(wù)協(xié)同,為無(wú)人系統(tǒng)在復(fù)雜場(chǎng)景應(yīng)用提供全面解決方案。 深度探索強(qiáng)化學(xué)習(xí)各主要細(xì)分方向在無(wú)人系統(tǒng)具體任務(wù)場(chǎng)景的應(yīng)用,無(wú)論是模糊、深度、分層還是多智能體強(qiáng)化學(xué)習(xí),均有涉及,為相關(guān)領(lǐng)域研究與實(shí)踐提供豐富且深入的參考依據(jù)與技術(shù)指導(dǎo)。

基于強(qiáng)化學(xué)習(xí)的無(wú)人系統(tǒng)智能決策 內(nèi)容簡(jiǎn)介

無(wú)人系統(tǒng)正逐漸成為現(xiàn)代社會(huì)各領(lǐng)域中的重要組成部分。自主決策能力是無(wú)人系統(tǒng)智能化的重要體現(xiàn),也是無(wú)人系統(tǒng)智能化執(zhí)行任務(wù)的關(guān)鍵技術(shù)。強(qiáng)化學(xué)習(xí)是當(dāng)前人工智能技術(shù)中無(wú)人系統(tǒng)實(shí)現(xiàn)從環(huán)境中自主學(xué)習(xí)行為策略的有效途徑,經(jīng)過(guò)近些年的研究,強(qiáng)化學(xué)習(xí)的算法研究取得了豐富的成果,涵蓋從單智能體到多智能體,從離散狀態(tài)到連續(xù)空間,從低維到高維的決策建模,能夠適應(yīng)無(wú)人系統(tǒng)的各種任務(wù)決策的建模。本書(shū)從工程應(yīng)用的視角出發(fā),分析了強(qiáng)化學(xué)習(xí)進(jìn)行無(wú)人系統(tǒng)自主決策的一般性方法,主要研究基于強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)無(wú)人系統(tǒng)執(zhí)行空戰(zhàn)決策和集群協(xié)同等各類任務(wù)環(huán)節(jié)的智能決策,實(shí)現(xiàn)從任務(wù)背景到仿真驗(yàn)證。本書(shū)內(nèi)容盡可能結(jié)合工程應(yīng)用背景,以期對(duì)該領(lǐng)域的工程實(shí)踐具有較好的參考性。本書(shū)不僅適用于強(qiáng)化學(xué)習(xí)應(yīng)用建模的初學(xué)者閱讀,也可作為從事無(wú)人系統(tǒng)工作的科研人員及高校師生的教材和主要參考書(shū)籍使用。

基于強(qiáng)化學(xué)習(xí)的無(wú)人系統(tǒng)智能決策 目錄

前言3目錄4第1章緒論91.1引言91.2無(wú)人系統(tǒng)91.3強(qiáng)化學(xué)習(xí)與無(wú)人系統(tǒng)9參考文獻(xiàn)9第2章強(qiáng)化學(xué)習(xí)理論112.1強(qiáng)化學(xué)習(xí)的概念112.1.1基本概念112.1.2強(qiáng)化學(xué)習(xí)的要素122.2馬爾科夫決策過(guò)程132.2.1定義132.2.2離散模型的求解方法172.2.3連續(xù)模型的求解方法212.3部分可觀測(cè)的馬爾科夫決策過(guò)程322.3.1定義322.3.2求解方法33參考文獻(xiàn)37第3章基于POMDP的自主跟蹤路徑規(guī)劃433.1引言433.2基于POMDP 的無(wú)人機(jī)自主跟蹤路徑規(guī)劃建模453.2.1問(wèn)題背景453.2.2簡(jiǎn)單機(jī)動(dòng)目標(biāo)的自主跟蹤路徑規(guī)劃模型463.2.3復(fù)雜機(jī)動(dòng)目標(biāo)的自主跟蹤路徑規(guī)劃模型523.3自主跟蹤路徑規(guī)劃模型的有限行動(dòng)集算法563.3.1近似求解的思路573.3.2算法流程573.4仿真分析593.4.1目標(biāo)簡(jiǎn)單機(jī)動(dòng)的仿真分析593.4.2目標(biāo)復(fù)雜機(jī)動(dòng)的仿真分析64參考文獻(xiàn)66第4章基于DQN的實(shí)時(shí)避障路徑規(guī)劃694.1引言694.2無(wú)人機(jī)路徑規(guī)劃問(wèn)題建模704.2.1無(wú)人機(jī)運(yùn)動(dòng)模型704.2.2實(shí)時(shí)路徑規(guī)劃約束734.3無(wú)人機(jī)實(shí)時(shí)路徑規(guī)劃決策模型744.3.1馬爾科夫決策過(guò)程744.3.2DQN764.3.3LSTM網(wǎng)絡(luò)794.4仿真驗(yàn)證824.4.1典型場(chǎng)景設(shè)計(jì)824.4.2仿真實(shí)驗(yàn)834.4.3實(shí)驗(yàn)分析87參考文獻(xiàn)88第5章單無(wú)人機(jī)智能空戰(zhàn)機(jī)動(dòng)決策935.1引言935.2單無(wú)人機(jī)智能空戰(zhàn)機(jī)動(dòng)決策框架955.2.1空戰(zhàn)模型955.2.2基于強(qiáng)化學(xué)習(xí)的空戰(zhàn)機(jī)動(dòng)決策模型框架975.2.3關(guān)鍵技術(shù)問(wèn)題1005.3基于FQL 的智能空戰(zhàn)機(jī)動(dòng)決策方法1025.3.1FQL算法1035.3.2基于優(yōu)勢(shì)函數(shù)的態(tài)勢(shì)評(píng)估模型1075.3.3空戰(zhàn)機(jī)動(dòng)決策的動(dòng)態(tài)模糊Q學(xué)習(xí)建模1095.3.4仿真訓(xùn)練與分析1155.4基于DQN 的智能空戰(zhàn)機(jī)動(dòng)決策方法1185.4.1DQN算法1185.4.2基于武器攻擊區(qū)的態(tài)勢(shì)評(píng)估模型1205.4.3空戰(zhàn)機(jī)動(dòng)決策的DQN模型的設(shè)計(jì)1225.4.4機(jī)動(dòng)決策DQN模型的訓(xùn)練方法1275.4.5仿真分析1315.5基于DDPG 的智能空戰(zhàn)機(jī)動(dòng)決策方法1425.5.1DDPG算法1435.5.2空戰(zhàn)機(jī)動(dòng)決策的DDPG模型的設(shè)計(jì)1465.5.3空戰(zhàn)機(jī)動(dòng)決策DDPG模型的訓(xùn)練方法1475.5.4仿真分析1515.6空戰(zhàn)機(jī)動(dòng)決策仿真驗(yàn)證系統(tǒng)15
展開(kāi)全部

基于強(qiáng)化學(xué)習(xí)的無(wú)人系統(tǒng)智能決策 作者簡(jiǎn)介

張建東,西北工業(yè)大學(xué)電子信息學(xué)院副教授。西北工業(yè)大學(xué)航空火力控制專業(yè)本科畢業(yè),西北工業(yè)大學(xué)系統(tǒng)工程專業(yè)碩士、博士研究生畢業(yè)。西北工業(yè)大學(xué)電子信息學(xué)院博士后。美國(guó)喬治梅森大學(xué)C4I中心訪問(wèn)學(xué)者。目前任西北工業(yè)大學(xué)電子信息學(xué)院副教授。

商品評(píng)論(0條)
暫無(wú)評(píng)論……
書(shū)友推薦
編輯推薦
返回頂部
中圖網(wǎng)
在線客服