91免费精品国自产拍网站,欧美交性一级视频免费播放,国产在线无码不卡播孜

強(qiáng)化學(xué)習(xí)

定　　價(jià)：128 元

當(dāng)前圖書已被 18 所學(xué)校薦購過！

查看明細(xì)

作者：(英)菲爾·溫德爾(Phil Winder)著
出版時(shí)間：2023/3/1
ISBN：9787519869618
出版社：中國電力出版社

中圖法分類：TP181
頁碼：427頁
紙張：膠版紙
版次：1
開本：16開

本書的主要內(nèi)容有：學(xué)習(xí)強(qiáng)化學(xué)習(xí)是什么，以及算法如何解決具體問題。掌握強(qiáng)化學(xué)習(xí)的基礎(chǔ)知識(shí)，包括馬爾可夫決策過程、動(dòng)態(tài)規(guī)劃和時(shí)間差分算法。深入研究系列基于值函數(shù)和政策梯度的算法。應(yīng)用先進(jìn)的強(qiáng)化學(xué)習(xí)解決方案，如元學(xué)習(xí)、分層學(xué)習(xí)、多智能體、模仿學(xué)習(xí)等。了解最前沿的深度強(qiáng)化學(xué)習(xí)算法，包括Rainbow、PPO、TD3、SAC等。

你還可能感興趣

我要評(píng)論