《術語相似度計算方法研究》對術語相似度計算方法的 研究,為多種知識發(fā)現(xiàn)和自然語言處理任務的開展創(chuàng)造了條件。盡管術語 相似度計算相關研究已經(jīng)或正在探索基于各種特征或知識資源開展術語相 似關系挖掘任務的思路和技術方法,但是在相似度指標的計算以及高效集 成多種術語相似度指標方面仍存在較多問題。本書在全面介紹當前各種典 型術語相似度計算思路的基礎上,針對應用中實際存在的問題,提出或改 進了基于語詞、基于語境以及基于網(wǎng)絡資源的術語相似度指標計算方法,設計和實現(xiàn)了多種相似度指標高效集成計算模型,有效地提高了術語相似 度計算的綜合性能!缎g語相似度計算方法研究》可作為自然語言處理、知識發(fā)現(xiàn)等相關 方向的教學、科研人員研究的參考資料。
《術語相似度計算方法研究》在全面介紹當前各種典型術語相似度計算思路的基礎上,針對應用中實際存在的問題,提出或改進了基于語詞、基于語境以及基于網(wǎng)絡資源的術語相似度指標計算方法,設計和實現(xiàn)了多種相似度指標高效集成計算模型,有效地提高了術語相似度計算的綜合性能,可作為自然語言處理、知識發(fā)現(xiàn)等相關方向的教學、科研人員研究的參考資料。
徐。1977一),男,中山大學資訊管理學院講師,情報學博士。2000年在西安交通大學獲學士學位,2003年在中山大學獲碩士學位,2010年在中國科學院獲情報學博士學位。2003年7月在中山大學碩士畢業(yè)后留校任教至今。主要研究方向為:①智能信息處理;②網(wǎng)絡信息挖掘;③術語相似度計算及應用技術。已發(fā)表研究論文30篇。目前主持1項教育部人文社會科學研究項目“從科技文獻中挖掘術語相似性及其在知識發(fā)現(xiàn)中的應用”,1項國家社會科學基金項目“用戶評論情感分析及其在競爭情報服務中的應用研究”,并參與多項國家、省部級科研項目工作。
第1章 緒論
1.1 術語相似度計算研究緣起
1.2 研究的目的及意義
1.2.1 研究目的
1.2.2 研究意義
1.3 相關概念界定
1.3.1 術語
1.3.2 術語語義相似度
1.4 研究思路與方法
1.4.1 研究思路
1.4.2 研究方法
1.5 本書內(nèi)容組織結構
第2章 術語相似度計算研究概述
2.1 術語相似度計算相關研究
2.1.1 術語相似性測度研究
2.1.2 基于語詞構成特征的術語相似度算法研究
2.1.3 基于句法特征的術語相似度算法研究
2.1.4 基于語境特征的術語相似度算法研究
2.1.5 基于語詞知識體系的術語相似度算法研究
2.1.6 基于網(wǎng)絡知識資源的術語相似度算法研究
2.1.7 術語相似度指標集成算法研究
2.1.8 術語語義相似度計算應用研究
2.2 術語相似度計算技術路線評述
2.2.1 典型算法計算思路的特點
2.2.2 典型算法計算思路的不足
2.3 術語相似度計算改進思路
2.3.1 計算方法的改進
2.3.2 集成模型的改進
2.4 小結
第3章 術語主詞軟匹配相似度算法研究
3.1 SSHW算法的提出
3.2 SSHW算法思想及算法設計
3.2.1 SSHW算法思想
3.2.2 SSHW算法設計
3.3 SSHW算法實現(xiàn)
3.4 SSHW算法評測
3.4.1 實驗目的
3.4.2 實驗數(shù)據(jù)
3.4.3 實驗過程
3.4.4 數(shù)據(jù)分析
3.4.5 實驗結論
3.5 小結
第4章 Hea t句法模板相似度改進算法研究
4.1 Hea t句法模板相似度算法改進思路
4.2 算法設計
4.2.1 算法設計思路
4.2.2 算法表達
4.3 算法實現(xiàn)
4.3.1 句法模板構建
4.3.2 計算過程
4.4 算法評測
4.4.1 實驗目的
4.4.2 實驗數(shù)據(jù)
4.4.3 實驗過程
4.4.4 數(shù)據(jù)分析
4.4.5 實驗結論
4.5 小結
第5章 語境依賴關系模式相似度算法研究
5.1 DRCP算法的提出
5.2 DRCP算法思想及算法設計
5.2.1 DRCP算法思想
5.2.2 DRCP算法設計
5.3 DRCP算法實現(xiàn)
5.4 DRCP算法評測
5.4.1 實驗目的
5.4.2 實驗數(shù)據(jù)
5.4.3 實驗過程
5.4.4 數(shù)據(jù)分析
5.4.5 實驗結論
5.5 小結
第6章 領域限定網(wǎng)絡檢索相似度算法研究
6.1 Web-PMI算法的改進思路
6.2 算法改進設計
6.2.1 基于領域特征的檢索式構造
6.2.2 基于命中數(shù)的術語相似度計算
6.3 算法實現(xiàn)
6.3.1 算法結構
6.3.2 搜索引擎的選擇
6.4 算法評測
6.4.1 實驗目的
6.4.2 實驗數(shù)據(jù)
6.4.3 實驗過程
6.4.4 數(shù)據(jù)分析
6.4.5 實驗結論
6.5 小結
第7章 基于機器學習的術語相似度集成計算模型
7.1 集成計算模型的提出
7.2 集成計算設計
7.2.1 學習階段模型設計
7.2.2 計算階段框架設計
7.3 集成計算實現(xiàn)
7.3.1 相似度網(wǎng)絡初始化
7.3.2 相似度網(wǎng)絡的檢索和推導機制
7.3.3 語詞相似度計算
7.3.4 句法相似度計算
7.3.5 語境相似度計算
7.3.6 搜索引擎相似度計算
7.3.7 相似度指標的SVM集成
7.4 集成計算評測
7.4.1 實驗目的
7.4.2 實驗數(shù)據(jù)
7.4.3 實驗過程
7.4.4 數(shù)據(jù)分析
7.4.5 實驗結論
7.5 小結
第8章 結束語
參考文獻