歡迎光臨中圖網(wǎng) 請 | 注冊

強(qiáng)化學(xué)習(xí)算法入門

出版社:中國水利水電出版社出版時(shí)間:2024-01-01
開本: 32開 頁數(shù): 184
中 圖 價(jià):¥43.3(6.2折) 定價(jià)  ¥69.8 登錄后可看到會(huì)員價(jià)
加入購物車 收藏
運(yùn)費(fèi)6元,滿39元免運(yùn)費(fèi)
?新疆、西藏除外
本類五星書更多>

強(qiáng)化學(xué)習(xí)算法入門 版權(quán)信息

強(qiáng)化學(xué)習(xí)算法入門 本書特色

本書讀者對象:大中專院校計(jì)算機(jī)、人工智能相關(guān)專業(yè)學(xué)生,對機(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)算法感興趣的程序員。 ● 本書從初高中學(xué)生都熟悉的“平均值計(jì)算”的角度出發(fā),簡單易懂地解釋復(fù)雜的強(qiáng)化學(xué)習(xí)原理。
● 使用常見的例子(多臂老虎機(jī)問題和網(wǎng)格世界問題)對各種算法進(jìn)行比較,使它們的特點(diǎn)更易理解。
● 對于強(qiáng)化學(xué)習(xí)的核心算法,提供了Python 3和MATLAB兩種類型的代碼。執(zhí)行代碼,可直觀理解“原理 → 公式 → 程序”這一系列流程。

強(qiáng)化學(xué)習(xí)算法入門 內(nèi)容簡介

作為**個(gè)戰(zhàn)勝圍棋世界冠軍的人工智能機(jī)器人AlphaGo,我們知道其主要工作原理是深度學(xué)習(xí)。隨著AlphaGo Zero和Alpha Zero的相繼發(fā)布,作為機(jī)器學(xué)習(xí)經(jīng)典算法之一的強(qiáng)化學(xué)習(xí),在人工智能領(lǐng)域受到了更多的關(guān)注。
《強(qiáng)化學(xué)習(xí)算法入門》使用通俗易懂的語言,按照“原理-公式-程序”的方式,對強(qiáng)化學(xué)習(xí)的基礎(chǔ)知識進(jìn)行了詳細(xì)講解。書中先讓大家從熟悉的“平均值計(jì)算”作為切入點(diǎn),學(xué)習(xí)強(qiáng)化學(xué)習(xí)的基本概念,然后結(jié)合實(shí)例學(xué)習(xí)了函數(shù)近似方法、深度強(qiáng)化學(xué)習(xí)的原理和方法等,比較了各算法的特點(diǎn)和應(yīng)用,并用Python和MATLAB兩種語言進(jìn)行了編程實(shí)現(xiàn)。
《強(qiáng)化學(xué)習(xí)算法入門》內(nèi)容豐富,實(shí)踐性強(qiáng),特別適合高校人工智能相關(guān)專業(yè)學(xué)生,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)工程師等學(xué)習(xí)強(qiáng)化學(xué)習(xí)算法。

強(qiáng)化學(xué)習(xí)算法入門 目錄

第1章基于“平均”的強(qiáng)化學(xué)習(xí)的基本概念 1.0簡介 1.1平均值與期望值 1.1.1平均值 1.1.2期望值 1.1.3期望值與平均值的關(guān)系 1.2平均值和價(jià)值 總結(jié) 1.3平均值和馬爾可夫性 1.3.1平均值的計(jì)算公式及其變形 1.3.2逐次平均值表達(dá)和MP 1.4用平均值推導(dǎo)貝爾曼方程 1.4.1平均值表達(dá)和價(jià)值函數(shù)的引入 1.4.2決策型貝爾曼方程式的推導(dǎo) 1.4.3概率型貝爾曼方程式的推導(dǎo) ……
展開全部

強(qiáng)化學(xué)習(xí)算法入門 作者簡介

[日] 曾我部東馬
理學(xué)博士(物理學(xué)專業(yè))。曾任馬克斯·普朗克研究所(德國)博士研究員、劍橋大學(xué)(英國)研究員。2009年回到日本,參與創(chuàng)立了Grid公司,擔(dān)任董事兼首席技術(shù)官。2011年起先后擔(dān)任東京大學(xué)尖端科學(xué)技術(shù)研究中心特聘助理教授、特聘副教授。2016年3月起任電氣通信大學(xué)副教授,同時(shí)兼任Grid公司首席技術(shù)顧問、東京大學(xué)尖端科學(xué)技術(shù)研究中心客座研究員至今。
他以開發(fā)具有“深度學(xué)習(xí)—深度強(qiáng)化學(xué)習(xí)—回歸預(yù)測—優(yōu)化”功能的跨功能機(jī)器學(xué)習(xí)框架∞ReNom而聞名,目前在開發(fā)以量子機(jī)器學(xué)習(xí)為代表的最先進(jìn)量子算法∞ReNomQ的同時(shí),還致力于使用深度強(qiáng)化學(xué)習(xí)的“在線優(yōu)化問題”的研究。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服