《領域本體構建方法及實證研究:以測繪學領域為例》從本體的定義、類型、基本元素、描述語言、構建方法和構建工具分析了本體的基本內涵和構建本體的基本方法,把本體構建方法劃分成概念獲取、關系獲取和形式化三個部分;運用組詞規(guī)則、N-gram、互信息、信息熵、加權等算法研究了領域本體的等級關系和非等級關系的提取方法;運用Jena工具研究了領域本體的形式化方法。作者通過對現(xiàn)有方法的反復實驗,針對領域本體構建過程中存在的問題,對現(xiàn)有的方法進行了綜合用用,并對部分方法進行了改進,最終提出了一套構建本體的通用方法。最后,本書以測繪學領域的數(shù)據(jù)為例,對該方法進行了實用檢驗,實驗結果證明了該方法的可行性。本書結構嚴謹、布局合理、重點突出、邏輯清晰、實例豐富,是一本系統(tǒng)講述領域本體構建方法的專著。
余凡,講師,武漢大學質量發(fā)展戰(zhàn)略研究院研究員,研究方向為宏觀質量管理、質量大數(shù)據(jù)等。先后主持中國博士后基金項目、武漢大學自主科研項目,參與國家社會科學基金重大項目、“十二五”科技支撐計劃項目等國家級、省部級項目7項,在Electronic Library、《宏觀質量研究》等國內外期刊上發(fā)表學術論文16篇。
0 引言
0.1 選題背景與研究意義
O.1.1 選題背景
0.1.2 研究意義
0.2 國內外研究綜述
0.2.1 基于不同數(shù)據(jù)源的本體半自動構建方法研究
0.2.2 本體概念獲取方法研究
O.2.3 本體關系獲取方法研究
O.2.4 本體形式化方法研究
0.2.5 國內外研究述評
0.3 研究目標與思路
0.3.1 研究目標
0.3.2 研究思路
0.4 研究方法與工具
0.4.1 研究方法
0.4.2 研究工具
0.5 創(chuàng)新之處
1 本體相關理論研究
1.1 本體的定義
1.2 本體的類型
1.3 本體的基本元素
1.4 本體描述語言
1.4.1 可擴展標記語言XMI
1.4.2 資源描述框架RDF
1.4.3 網絡本體語言OWL
1.5 本體構建方法
1.5.1 本體構建抽象方法
1.5.2 本體構建具體方法
1.6 本體構建工具
1.6.1 Prot6g6
1.6.2 Jena
2 領域本體的概念提取方法研究
2.1 基于敘詞表的領域本體概念提取方法
2.1.1 敘詞表的分類及存在的問題
2.1.2 文本存儲方式的轉換
2.1.3 關系二維表的數(shù)據(jù)結構
2.1.4 敘詞表編碼映射
2.1.5 實驗分析
2.2 基于文本的領域本體概念提取方法
2.2.1 領域本體概念提取流程
2.2.2 PDF文獻的下栽和轉換
2.2.3 文本切分方法
2.2.4 領域詞匯提取方法
2.2.5 領域詞匯的篩選方法
3 領域本體的關系提取方法研究
3.1 領域本體的等級關系提取方法
3.1.1 基于敘詞表的等級關系提取方法
3.1.2 基于文本的等級關系提取方法
3.2 領域本體的非等級關系提取方法
3.2.1 基于敘詞表的非等級關系提取方法
3.2.2 基于文本的非等級關系提取方法
4 領域本體形式化方法研究
4.1 本體、0WL和語義
4.2 形式化語言選擇
4.3 本體的形式化
4.3.1 本體形式化目標
4.3.2 本體形式化方法
4.3.3 測繪學領域本體形式化
5 測繪學領域本體構建系統(tǒng)的實現(xiàn)
5.1 領域本體構建流程
5.2 需求分析
5.3 系統(tǒng)總體設計
5.4 系統(tǒng)詳細設計
5.4.1 概念提取模塊
5.4.2 概念篩選模塊
5.4.3 等級關系提取模塊
5.4.4 非等級關系提取模塊
5.4.5 領域本體形式化模塊
5.5 測繪學領域本體可視化展示
5.6 測繪學領域本體的應用領域
5.7 領域本體構建方法性能測試
6 結論與展望
6.1 結論
6.2 不足與展望
參考文獻
附錄:測繪學領域本體代碼
后記
《領域本體構建方法及實證研究:以測繪學領域為例》:
。1)研究本體以及本體構建方法的相關理論(第1章實現(xiàn))。具體研究本體在信息科學領域的定義是什么;本體具備哪些特征;本體有哪些不同的類型;本體由哪些基本元素組成:描述本體的語言包括哪幾種,它們之間存在什么聯(lián)系;本體包括哪些抽象和具體的構建方法;本體構建的工具有哪些。
(2)研究本體概念提取方法(第2章實現(xiàn))。具體研究如何從敘詞表和文本中提取領域概念:如何利用關系二維表的數(shù)據(jù)結果存儲敘詞表概念;如何實現(xiàn)不同編碼的敘詞表之間的映射;如何利用敘詞表組詞規(guī)則和N—gram算法提取文本概念;如何利用擴展互信息、信息熵過濾概念;如何利用擴展信息熵和加權算法篩選領域核心概念。
。3)研究本體關系提取方法(第3章實現(xiàn))。具體研究如何提取敘詞表和文本中的等級和非等級關系;如何利用基于字和詞的鄰近詞匯相似度算法形成等級關系以及兩種算法結果的比較分析;如何利用擴展的關聯(lián)規(guī)則算法提取本體三元組中的主語和賓語:如何利用規(guī)則統(tǒng)計的方法提取本體三元組中的謂語。
(4)研究本體形式化方法(第4章實現(xiàn))。具體研究如何選擇本體形式化語言;本體形式化的目標和具體方法有哪些;如何實現(xiàn)本體的形式化處理。
。5)對本體構建方法進行系統(tǒng)實現(xiàn)(第5章實現(xiàn))。描述領域本體構建的總體流程,并以測繪學為例,對上文研究的本體構建方法予以系統(tǒng)實現(xiàn)。通過需求分析、總體設計和詳細設計,將系統(tǒng)細分為概念提取模塊、概念篩選模塊、等級關系提取模塊、非等級關系提取模塊和形式化模塊。系統(tǒng)分別實現(xiàn)每個模塊的具體功能。
0.3.2研究思路
本書首先提出問題,然后分析并解決問題,最后輔以實證研究,以保證本研究的理論和實踐緊密結合。本書采用總一分一總的研究思路,在總結本體構建理論方法的基礎上,分章節(jié)對本體構建的具體步驟進行探究,最后在實證中分別使用這些構建方法,從而檢驗構建方法的適用性。具體而言,本書既分別對本體構建步驟進行研究分析,又對這些方法進行比較分析。既有理論方法的研究,也有對這些方法的應用研究。既有單個方法的研究,也有多個方法的綜合研究。既有對現(xiàn)有方法的研究,也有對現(xiàn)有方法改進的研究。本書采用理論與實踐緊密結合的方法,針對目前構建方法的不足,對現(xiàn)有的方法進行適當?shù)木C合和改進,以促進本體構建方法的發(fā)展,從而擴大本體應用的廣度和深度。
……