關(guān)于我們
書單推薦
新書推薦
|
強化學(xué)習(xí) 讀者對象:機器學(xué)習(xí)研究人員
本書的主要內(nèi)容有:學(xué)習(xí)強化學(xué)習(xí)是什么,以及算法如何解決具體問題。掌握強化學(xué)習(xí)的基礎(chǔ)知識,包括馬爾可夫決策過程、動態(tài)規(guī)劃和時間差分算法。深入研究系列基于值函數(shù)和政策梯度的算法。應(yīng)用先進的強化學(xué)習(xí)解決方案,如元學(xué)習(xí)、分層學(xué)習(xí)、多智能體、模仿學(xué)習(xí)等。了解最前沿的深度強化學(xué)習(xí)算法,包括Rainbow、PPO、TD3、SAC等。
你還可能感興趣
我要評論
|