基于張量數(shù)據(jù)的機器學(xué)習(xí)方法近年來一直是機器學(xué)習(xí)領(lǐng)域的前沿課題,在錯誤診斷、人臉識別、入侵檢測、文本分類等領(lǐng)域,我們經(jīng)常會遇到單分類問題。以單分類支持向量機為代表的傳統(tǒng)單分類算法使用向量作為輸入數(shù)據(jù),當(dāng)輸入數(shù)據(jù)為張量時有一定的局限。近年來,直接使用張量作為輸入數(shù)據(jù)的機器學(xué)習(xí)算法得到了研究者的廣泛關(guān)注。因此,《單分類支持張量機模型及算法研究》作者陳艷燕在查閱大量相關(guān)文獻(xiàn)的基礎(chǔ)上,對基于張量數(shù)據(jù)的單分類問題進(jìn)行了研究,選題具有重要的理論意義和實用價值。
在錯誤診斷、人臉識別、入侵檢測、文本分類等領(lǐng)域,我們經(jīng)常會遇到單分類問題。以單分類支持向量機為代表的傳統(tǒng)單分類算法使用向量作為輸入數(shù)據(jù),當(dāng)輸入數(shù)據(jù)為張量時有一定的局限性。近年來,直接使用張量作為輸入數(shù)據(jù)的機器學(xué)習(xí)算法得到了研究者的廣泛關(guān)注,并取得了一定的成果,直接使用張量作為輸入數(shù)據(jù),能夠有效地保持?jǐn)?shù)據(jù)的結(jié)構(gòu)信息,從而能夠充分利用數(shù)據(jù)所蘊含的信息以提高識別效果;同時,以張量為輸入數(shù)據(jù)的相關(guān)模型和算法,可以有效地降低優(yōu)化問題中待求解的決策變量個數(shù),從而可以避免傳統(tǒng)的向量模型在學(xué)習(xí)過程中容易出現(xiàn)的過擬合等問題,這使得張量算法尤其適合高維小樣本問題。因此,本書主要研究基于張量理論的單分類模型和算法,研究工作包括以下幾部分內(nèi)容:
1.線性單分類支持張量機模型。本書第2章從2階張量入手,給出基于2階張量的線性單分類支持張量機模型和算法,并在公開的向量數(shù)據(jù)集上進(jìn)行了實驗。實驗的結(jié)果說明了所提算法能夠有效地提高對目標(biāo)類的識別,并討論了參數(shù)v對張量分類器的作用。第2章還討論了將2階張量模型推廣至高階張量模型和算法,并討論了算法的計算復(fù)雜度。在向量數(shù)據(jù)集和張量數(shù)據(jù)集的實驗中,所提算法在保證分類器性能的情況下,均能大幅提高分類器對目標(biāo)類的識別。
2.線性支持張量數(shù)據(jù)描述模型,作為單分類問題的另一經(jīng)典向量模型:支持向量數(shù)據(jù)描述模型,本書第3章將探討如何將向量模型推廣至張量空間模型。首先,從2階張量的線性數(shù)據(jù)描述模型入手,將支持向量數(shù)據(jù)描述模型推廣至2階張量空間,并最終推廣至高階張量模型。模型的求解依然基于交替投影思想,并給出了計算復(fù)雜度分析和收斂性證明,數(shù)據(jù)實驗采取高維小樣本的向量數(shù)據(jù)集,來展示張量算法對于高維小樣本數(shù)據(jù)的分類性能以及參數(shù)分析;并以人臉數(shù)據(jù)集和步態(tài)數(shù)據(jù)集來驗證所提算法在張量數(shù)據(jù)集的分類性能。
3.對于非線性可分問題,與傳統(tǒng)向量分類算法類似,核方法是一個很好的選擇,關(guān)于張量核方法的研究是近年來的一個熱點問題,也出現(xiàn)了一些張量空間的核函數(shù),并取得了一定的理論和應(yīng)用的突破,本書在第4章探討利用2階張量核矩陣簡單、易于計算的優(yōu)勢,將上述兩個線性單分類張量模型,推廣至非線性分類問題。為了驗證兩個新的非線性張量算法的分類性能,并重點關(guān)注張量模型在高維小樣本問題的分類性能、張量算法和向量算法在過擬合問題的表現(xiàn),并最終給出將向量數(shù)據(jù)轉(zhuǎn)化為張量數(shù)據(jù)的基本原則,第4章最后還分析了兩種單分類張量算法的等價條件,數(shù)值實驗結(jié)果也驗證了在高斯核矩陣下,兩種算法的分類結(jié)果是一樣的。
第1章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 單分類支持向量機的研究進(jìn)展
1.2.2 支持張量機的研究進(jìn)展
1.3 預(yù)備知識
1.3.1 支持向量機理論
1.3.2 單分類支持向量機
1.3.3 張量理論
第2章 基于超平面的線性單分類支持張量機
2.1 基于2階張量的LOCSTM模型及其算法
2.1.1 基于2階張量的LOCSTM模型
2.1.2 算法實現(xiàn)
2.1.3 數(shù)值實驗
2.2 基于高階張量的LOCSTM模型及其算法
2.2.1 基于高階張量的LOCSTM模型
2.2.2 算法實現(xiàn)
2.2.3 數(shù)據(jù)實驗
第3章 基于超球的單分類支持張量機
3.1 基于2階張量的LSTDD模型及算法
3.1.1 基于2階張量的LSTDD模型
3.1.2 算法實現(xiàn)
3.2 高階張量的LSTDD模型及其算法
3.2.1 高階張量的LSTDD模型
3.2.2 算法實現(xiàn)
3.3 數(shù)值實驗
3.3.1 向量數(shù)據(jù)實驗
3.3.2 張量數(shù)據(jù)實驗
第4章 非線性單分類支持張量機
4.1 2階張量核矩陣
4.2 基于超平面的非線性單分類支持張量機
4.2.1 基于超平面的非線性單分類支持張量機模型
4.2.2 算法實現(xiàn)
4.3 基于超球的非線性單分類支持張量機
4.3.1 基于超球的非線性單分類支持張量機模型
4.3.2 算法實現(xiàn)
4.4 OCSTM與STDD模型的等價條件分析
4.5 OCSTM數(shù)值實驗
4.5.1 向量數(shù)據(jù)實驗
4.5.2 張量數(shù)據(jù)實驗
4.6 STDD數(shù)值實驗
4.6.1 向量數(shù)據(jù)實驗
4.6.2 張量數(shù)據(jù)實驗
參考文獻(xiàn)
后記