關(guān)于我們
書單推薦
新書推薦

強化學(xué)習(xí)

強化學(xué)習(xí)

定  價:128 元

        

  • 作者:(英)菲爾·溫德爾(Phil Winder)著
  • 出版時間:2023/3/1
  • ISBN:9787519869618
  • 出 版 社:中國電力出版社
  • 中圖法分類:TP181 
  • 頁碼:427頁
  • 紙張:膠版紙
  • 版次:1
  • 開本:16開
9
7
8
8
6
7
9
5
6
1
1
9
8

讀者對象:機器學(xué)習(xí)研究人員

本書的主要內(nèi)容有:學(xué)習(xí)強化學(xué)習(xí)是什么,以及算法如何解決具體問題。掌握強化學(xué)習(xí)的基礎(chǔ)知識,包括馬爾可夫決策過程、動態(tài)規(guī)劃和時間差分算法。深入研究系列基于值函數(shù)和政策梯度的算法。應(yīng)用先進的強化學(xué)習(xí)解決方案,如元學(xué)習(xí)、分層學(xué)習(xí)、多智能體、模仿學(xué)習(xí)等。了解最前沿的深度強化學(xué)習(xí)算法,包括Rainbow、PPO、TD3、SAC等。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容