關(guān)于我們
書單推薦
新書推薦
|
機(jī)器學(xué)習(xí)中的監(jiān)督與無監(jiān)督學(xué)習(xí)--模型、算法與應(yīng)用
近年來隨著計算機(jī)技術(shù)的快速發(fā)展,機(jī)器學(xué)習(xí)被廣泛應(yīng)用于信息檢索、自然語言處理、計算機(jī)視覺及自動化控制等方面。由于機(jī)器學(xué)習(xí)在實際應(yīng)用中對不同問題所提供的條件各不相同,如含有標(biāo)簽信息的數(shù)據(jù)、不含標(biāo)簽信息的數(shù)據(jù)等,針對不同的數(shù)據(jù)類型有多種解決方法:監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)。本書針對監(jiān)督和無監(jiān)督學(xué)習(xí)方法進(jìn)行理論的概述、模型的改進(jìn)和應(yīng)用領(lǐng)域的探究。
針對監(jiān)督概率主題模型的研究,本書將文本分析作為研究的重點,文本分析起源于20世紀(jì)50年代,然而其取得突破性進(jìn)展則是在1990年后隨著機(jī)器學(xué)習(xí)及其它相關(guān)技術(shù)的發(fā)展而獲得的。文本分析是指通過擴(kuò)展和應(yīng)用數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)的相關(guān)方法,從各種文本數(shù)據(jù)中提取、挖掘有用信息的過程。通常人工撰寫的各種文本語料都是將各種文本語義進(jìn)行復(fù)雜的抽象概念轉(zhuǎn)換的結(jié)果。其中包含的各種抽象概念被定義為“主題”,文檔的寫作過程即根據(jù)這些主題對文檔進(jìn)行相應(yīng)的文字描述、加工的過程。而文本分析的主要任務(wù)是對文檔中的文字進(jìn)行有效的分析,與文章寫作相反的過程對文檔中包含的各種主題信息進(jìn)行識別,從而獲得計算機(jī)可以解釋的文檔主題,為基于文檔分析的信息檢索、信息提取、自然語言處理等任務(wù)提供可靠的依據(jù)。 針對無監(jiān)督聚類模型的研究,本書主要涉及并行優(yōu)化、行人重識別、圖像識別領(lǐng)域的應(yīng)用。
你還可能感興趣
我要評論
|