關(guān)于我們
書單推薦
新書推薦

數(shù)字文獻(xiàn)資源高維聚合模型研究

數(shù)字文獻(xiàn)資源高維聚合模型研究

定  價(jià):69 元

叢書名:2016國家職業(yè)資格培訓(xùn)教程

        

  • 作者:牛奉高 著
  • 出版時(shí)間:2017/8/1
  • ISBN:9787520307826
  • 出 版 社:中國社會科學(xué)出版社
  • 中圖法分類:G250.73 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:1
  • 開本:16
9
7
3
8
0
7
7
5
8
2
2
0
6

針對文本挖掘和信息檢索中的文本或文獻(xiàn)聚類與分類等問題,學(xué)術(shù)界基于VSM(向量空間模型)主要有兩方面的研究,一者是文獻(xiàn)表示模型的改進(jìn),二者是算法的改進(jìn)。然而傳統(tǒng)的算法對高維稀疏的向量聚類存在不足,一些新的算法也不盡完美,更主要的是聚類算法的效果與數(shù)據(jù)本身的特征以及信息提取和表示密切相關(guān),特別是在信息有限的情況下,聚類算法的優(yōu)勢也不能得到完美發(fā)揮,相比之下,信息的挖掘、提取和文獻(xiàn)向量表示就尤為重要。在本文僅限于元數(shù)據(jù)甚至只有關(guān)鍵詞的前提下,文獻(xiàn)的表示向量相比一般文本表示就表現(xiàn)得非常稀疏,面對這種情形聚類算法即使是“巧婦”也“難為無米之炊”,因此,本書的重點(diǎn)突破是文獻(xiàn)主題語義信息的提取、度量和文獻(xiàn)高維向量的新表示方法;谝陨蠁栴}和現(xiàn)象,本書以數(shù)字文獻(xiàn)資源為對象,本著在信息資源聚合中減少對背景知識的依賴,便于推廣應(yīng)用的宗旨,提出了基于文獻(xiàn)集本身或者相關(guān)領(lǐng)域的共現(xiàn)信息而實(shí)現(xiàn)文獻(xiàn)聚合的共現(xiàn)潛在語義向量空間模型(CLSVSM)。而且通過實(shí)驗(yàn)證實(shí)基于CLSVSM的文獻(xiàn)聚類表現(xiàn)比基于VSM和GVSM(廣義向量空間模型)顯著地好。

 你還可能感興趣
 我要評論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容