av人妻精品一区,无码潮喷中文字幕在线,在线观看国产亚洲视频免费

本書從現(xiàn)代機(jī)器學(xué)習(xí)的視角介紹了統(tǒng)計強(qiáng)化學(xué)習(xí)的基本概念和實(shí)用算法。它涵蓋了各種類型的強(qiáng)化學(xué)習(xí)方法，包括基于模型的方法和與模型無關(guān)的方法，策略迭代和策略搜索方法。

在即將到來的大數(shù)據(jù)時代，統(tǒng)計學(xué)與機(jī)器學(xué)習(xí)正成為數(shù)據(jù)挖掘不可或缺的工具。根據(jù)數(shù)據(jù)分析的類型，機(jī)器學(xué)習(xí)方法分為三類：
●監(jiān)督學(xué)習(xí)：給定輸入和輸出的數(shù)據(jù)，監(jiān)督學(xué)習(xí)的目標(biāo)是分析輸入、輸出數(shù)據(jù)之間的關(guān)系。監(jiān)督學(xué)習(xí)典型的任務(wù)包括回歸（預(yù)測真實(shí)取值）、分類（預(yù)測類別）以及排序（預(yù)測順序）。監(jiān)督學(xué)習(xí)是最常用的數(shù)據(jù)分析工具，并且已經(jīng)在統(tǒng)計學(xué)領(lǐng)域被研究了很長時間。監(jiān)督學(xué)習(xí)在機(jī)器學(xué)習(xí)中近期的趨勢是利用輸入、輸出數(shù)據(jù)的輔助信息來進(jìn)一步改善預(yù)測的精度。例如，半監(jiān)督學(xué)習(xí)利用額外的輸入數(shù)據(jù)，遷移學(xué)習(xí)借用來自其他相似學(xué)習(xí)任務(wù)的數(shù)據(jù)，多任務(wù)學(xué)習(xí)同時解決多個相關(guān)學(xué)習(xí)任務(wù)。
●無監(jiān)督學(xué)習(xí)：僅給定輸入數(shù)據(jù)，無監(jiān)督學(xué)習(xí)的目標(biāo)是在數(shù)據(jù)中找到有用的東西。由于這種模糊的定義，無監(jiān)督學(xué)習(xí)研究往往比監(jiān)督學(xué)習(xí)更具特色。然而，由于其自動化以及廉價的特性，無監(jiān)督學(xué)習(xí)被認(rèn)為是數(shù)據(jù)挖掘中最重要的工具之一。無監(jiān)督學(xué)習(xí)典型的任務(wù)包括聚類（根據(jù)數(shù)據(jù)的相似性進(jìn)行數(shù)據(jù)分組）、密度估計（估計數(shù)據(jù)背后的概率分布）、異常檢測（從數(shù)據(jù)中刪除異常值）、數(shù)據(jù)可視化（將數(shù)據(jù)的維度降到1~3維）和盲源分離（從混合數(shù)據(jù)中提取原始源信號）。此外，無監(jiān)督學(xué)習(xí)方法有時被用作監(jiān)督學(xué)習(xí)中數(shù)據(jù)預(yù)處理的工具。
●強(qiáng)化學(xué)習(xí)：監(jiān)督學(xué)習(xí)是一種合理的方法，但收集輸入、輸出數(shù)據(jù)通常過于昂貴。無監(jiān)督學(xué)習(xí)的執(zhí)行成本低廉，但往往是臨時性的。強(qiáng)化學(xué)習(xí)介于監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)之間——沒有提供明確的監(jiān)督（輸出數(shù)據(jù)），但我們?nèi)匀幌雽W(xué)習(xí)數(shù)據(jù)背后的輸入、輸出關(guān)系。強(qiáng)化學(xué)習(xí)不是輸出數(shù)據(jù)，而是利用獎賞來評估所預(yù)測的輸出的有效性。提供諸如獎賞之類的隱性監(jiān)督通常比提供明確監(jiān)督更容易，成本更低，因此強(qiáng)化學(xué)習(xí)可以成為現(xiàn)代數(shù)據(jù)分析的重要方法。在強(qiáng)化學(xué)習(xí)的框架中也使用各種監(jiān)督和無監(jiān)督學(xué)習(xí)技術(shù)。
本書致力于從現(xiàn)代機(jī)器學(xué)習(xí)的角度介紹統(tǒng)計強(qiáng)化學(xué)習(xí)的基本概念和實(shí)用算法。還提供了各種圖解說明示例——這些示例主要來自機(jī)器人領(lǐng)域，幫助讀者理解強(qiáng)化學(xué)習(xí)技術(shù)的直觀性和實(shí)用性。目標(biāo)讀者是計算機(jī)科學(xué)和應(yīng)用統(tǒng)計學(xué)的研究生以及相關(guān)領(lǐng)域的研究人員和工程師。假設(shè)讀者具備概率和統(tǒng)計學(xué)、線性代數(shù)以及初等微積分的基礎(chǔ)知識。
機(jī)器學(xué)習(xí)是一個快速發(fā)展的科學(xué)領(lǐng)域，希望本書能夠幫助讀者了解強(qiáng)化學(xué)習(xí)中的各種激動人心的話題，激發(fā)讀者對機(jī)器學(xué)習(xí)的興趣。請瀏覽我們的網(wǎng)站：http://www.ms.k.u-tokyo.ac.jp。
致謝
感謝合作者Hirotaka Hachiya、Sethu Vijayakumar、Jan Peters、Jun Morimoto、Zhao Tingting、Ning Xie、Voot Tangkaratt、Tetsuro Morimura和Norikazu Sugimoto激動人心的創(chuàng)意討論。感謝MEXT KAKENHI (17700142、18300057、20680007、23120004、23300069、25700022和26280054)、大川基金會、歐盟Erasmus Mundus獎學(xué)金、AOARD、SCAT、JST PRESTO計劃以及FIRST計劃的支持。

Masashi Sugiyama
日本東京大學(xué)

你還可能感興趣

我要評論