面向“三農(nóng)”問(wèn)答系統(tǒng)的關(guān)鍵技術(shù)研究
本書以三農(nóng)信息資源服務(wù)為目的,研究了三農(nóng)信息資源服務(wù)的理論和實(shí)現(xiàn)技術(shù);分別研究了三農(nóng)概念簇的知識(shí)表示、基于混合策略的三農(nóng)FAQ系統(tǒng)、面向三農(nóng)問(wèn)句分類,以及面向三農(nóng)的答案抽取等關(guān)鍵技術(shù);構(gòu)建出面向三農(nóng)問(wèn)答系統(tǒng)。本書將問(wèn)答系統(tǒng)融合到三農(nóng)信息資源服務(wù)中,為我國(guó)三農(nóng)信息資源服務(wù)提供一種新的服務(wù)模式,對(duì)拓展信息資源服務(wù)理論具有積極意義。
序
以數(shù)字化、網(wǎng)絡(luò)化、智能化為特征的信息化浪潮為三農(nóng)信息化發(fā)展?fàn)I造了強(qiáng)大勢(shì)能。政府和研究機(jī)構(gòu)針對(duì)農(nóng)業(yè)生產(chǎn)、農(nóng)民生活以及農(nóng)村建設(shè)方面的事務(wù)提供了大量的信息資源,對(duì)促進(jìn)農(nóng)村社會(huì)經(jīng)濟(jì)發(fā)展、提高農(nóng)民的生產(chǎn)能力和生活水平都產(chǎn)生了十分重要的幫助作用。問(wèn)答系統(tǒng)(Question
Answering System,
QA)是信息檢索系統(tǒng)的一種形式,它能用準(zhǔn)確、簡(jiǎn)潔的自然語(yǔ)言回答用戶提出的問(wèn)題,是目前人工智能和自然語(yǔ)言處理領(lǐng)域中一個(gè)具有廣泛發(fā)展前景的研究方向。針對(duì)我國(guó)三農(nóng)領(lǐng)域信息資源服務(wù)中尚未全面、深入的引入問(wèn)答系統(tǒng)的相關(guān)理論和方法的現(xiàn)狀,本書較為系統(tǒng)地闡述了問(wèn)答系統(tǒng)的技術(shù)原理和中文信息處理的相關(guān)知識(shí),將FAQ系統(tǒng)和Web自動(dòng)問(wèn)答技術(shù)應(yīng)用到當(dāng)前的三農(nóng)信息資源服務(wù)中,研究滿足問(wèn)答系統(tǒng)的三農(nóng)知識(shí)表示方式;研究融合HowNet以及三農(nóng)概念簇等計(jì)算FAQ問(wèn)句匹配算法;研究綜合利用自然語(yǔ)言處理、機(jī)器學(xué)習(xí)等方法實(shí)現(xiàn)三農(nóng)問(wèn)句分類和答案抽取的理論和方法;構(gòu)建了面向三農(nóng)FAQ和Web自動(dòng)問(wèn)答系統(tǒng)模型。
本書是作者在參與國(guó)家社科基金重點(diǎn)項(xiàng)目過(guò)程中的研究成果,相關(guān)的方法研究和技術(shù)研究頗具新意。該書將問(wèn)答系統(tǒng)的理念和技術(shù)應(yīng)用于三農(nóng)信息服務(wù)中,特別是三農(nóng)問(wèn)答系統(tǒng)的構(gòu)建,三農(nóng)概念簇知識(shí)表示、FAQ檢索匹配,以及自動(dòng)問(wèn)答系統(tǒng)的三農(nóng)問(wèn)句分類和答案抽取等關(guān)鍵技術(shù),拓展了信息服務(wù)的理論方法;對(duì)三農(nóng)信息資源充分利用能產(chǎn)生積極的推動(dòng)作用,從而能進(jìn)一步促進(jìn)現(xiàn)代信息技術(shù)在農(nóng)村發(fā)展中的應(yīng)用,有利于縮小我國(guó)城鄉(xiāng)間的信息鴻溝。
本書的主要貢獻(xiàn)是從三農(nóng)信息需求出發(fā),將問(wèn)答系統(tǒng)融合到三農(nóng)信息資源服務(wù)中,為我國(guó)三農(nóng)信息資源服務(wù)提供一種新的服務(wù)模式的理論和實(shí)踐,對(duì)其他領(lǐng)域開(kāi)展類似研究也具有較好的參考價(jià)值和借鑒意義。希望本書的出版,有助于促進(jìn)問(wèn)答系統(tǒng)在三農(nóng)信息服務(wù)廣泛、深入應(yīng)用,也希望有更多的領(lǐng)域、機(jī)構(gòu)參與到三農(nóng)問(wèn)答系統(tǒng)的理論和實(shí)踐研究中來(lái)。
朱學(xué)芳
南京大學(xué)信息管理學(xué)院教授,博士生導(dǎo)師
張軍亮,1983年生,河南省林州市人,南京大學(xué)情報(bào)學(xué)博士,新鄉(xiāng)醫(yī)學(xué)院副教授,研究方向?yàn)樾畔①Y源管理。代表作有《基于任務(wù)驅(qū)動(dòng)的個(gè)性化<醫(yī)學(xué)信息檢索>教學(xué)模式》《生物和醫(yī)藥技術(shù)領(lǐng)域知識(shí)生產(chǎn)分析基于863計(jì)劃科技報(bào)告》等。
第1章 緒論
1.1 研究背景
1.1.1 社會(huì)環(huán)境
1.1.2 技術(shù)環(huán)境
1.1.3 三農(nóng)信息服務(wù)需求
1.2 問(wèn)答系統(tǒng)發(fā)展現(xiàn)狀
1.2.1 問(wèn)答系統(tǒng)的歷史
1.2.2 問(wèn)答系統(tǒng)概念及分類
1.2.3 問(wèn)答系統(tǒng)體系結(jié)構(gòu)
1.2.4 三農(nóng)問(wèn)答系統(tǒng)研究
1.3 研究?jī)?nèi)容
1.3.1 三農(nóng)知識(shí)表示
1.3.2 面向三農(nóng)FAQ技術(shù)研究
1.3.3 三農(nóng)問(wèn)題問(wèn)句分類技術(shù)研究
1.3.4 三農(nóng)問(wèn)題答案抽取技術(shù)研究
1.4 研究方法及意義
1.4.1 研究方法
1.4.2 研究意義
1.5 本書的組織結(jié)構(gòu)
第2章 中文信息處理基礎(chǔ)
2.1 引言
2.2 分詞
2.2.1 分詞概述
2.2.2 分詞方法
2.2.3 中科院分詞
2.3 句法分析
2.3.1 句法分析概述
2.3.2 句法分析理論及方法
2.4 知網(wǎng)(HowNet)
2.5 本章小結(jié)
第3章 三農(nóng)概念簇表示研究
3.1 引言
3.2 文本分類相關(guān)研究
3.3 基于規(guī)則的三農(nóng)詞表的構(gòu)建
3.3.1 三農(nóng)詞表數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)
3.3.2 基于DOM樹(shù)的網(wǎng)頁(yè)抽取
3.3.3 基于正則表達(dá)式的信息抽取
3.4 基于KNN的三農(nóng)概念簇表示
3.4.1 特征抽取
3.4.2 基于KNN的三農(nóng)概念簇形成
3.5 實(shí)驗(yàn)及結(jié)果分析
3.5.1 實(shí)驗(yàn)設(shè)計(jì)
3.5.2 評(píng)價(jià)標(biāo)準(zhǔn)
3.5.3 實(shí)驗(yàn)結(jié)果分析
3.6 本章小結(jié)
第4章 基于混合策略的三農(nóng)FAQ系統(tǒng)研究
4.1 引言
4.2 FAQ系統(tǒng)相關(guān)研究
4.3 三農(nóng)FAQ中問(wèn)題相似度算法
4.3.1 基于句子詞的表層相似度
4.3.2 基于句法分析的語(yǔ)義相似度
4.3.3 基于LSA的問(wèn)句與答案相似度
4.3.4 三農(nóng)FAQ的綜合相似度
4.4 實(shí)驗(yàn)結(jié)果及分析
4.4.1 實(shí)驗(yàn)設(shè)計(jì)
4.4.2 實(shí)驗(yàn)結(jié)果分析
4.5 本章小結(jié)
第5章 三農(nóng)問(wèn)句分類研究
5.1 引言
5.2 問(wèn)句分類相關(guān)研究
5.3 三農(nóng)問(wèn)句的分類體系
5.4 三農(nóng)問(wèn)句分類的特征選擇
5.5 基于規(guī)則模板的三農(nóng)問(wèn)句粗分類
5.5.1 基于規(guī)則問(wèn)句分類算法
5.5.2 問(wèn)句規(guī)則模板的抽取算法
5.6 基于SVM三農(nóng)問(wèn)句精細(xì)分類研究
5.6.1 SVM分類器
5.6.2 三農(nóng)問(wèn)句特征向量
5.7 實(shí)驗(yàn)結(jié)果及分析
5.7.1 實(shí)驗(yàn)設(shè)計(jì)
5.7.2 問(wèn)句類別統(tǒng)計(jì)
5.7.3 實(shí)驗(yàn)結(jié)果分析
5.8 本章小結(jié)
第6章 三農(nóng)問(wèn)答系統(tǒng)答案抽取研究
6.1 引言
6.2 相關(guān)研究
6.3 基于農(nóng)業(yè)知識(shí)庫(kù)的答案抽取
6.3.1 AGROVOC知識(shí)庫(kù)
6.3.2 基于關(guān)系組的答案抽取
6.4 基于線索詞的原因性問(wèn)句答案抽取
6.4.1 原因性問(wèn)句的候選答案
6.4.2 基于模板的答案抽取
6.5 基于語(yǔ)義摘要的方式性問(wèn)句答案抽取
6.5.1 自動(dòng)文摘概述
6.5.2 基于主題詞的文摘自動(dòng)抽取
6.6 實(shí)驗(yàn)結(jié)果及分析
6.6.1 評(píng)價(jià)標(biāo)準(zhǔn)
6.6.2 實(shí)驗(yàn)結(jié)果評(píng)價(jià)
6.7 本章小結(jié)
第7章 面向三農(nóng)問(wèn)答系統(tǒng)構(gòu)建實(shí)現(xiàn)
7.1 系統(tǒng)運(yùn)行環(huán)境
7.1.1 服務(wù)器環(huán)境
7.1.2 客戶端環(huán)境
7.2 系統(tǒng)技術(shù)
7.2.1 Java
7.2.2 Ajax
7.2.3 Google
Ajax Search
API
7.2.4 HtmlParser
7.3 系統(tǒng)的設(shè)計(jì)構(gòu)建與實(shí)現(xiàn)
7.3.1 系統(tǒng)邏輯結(jié)構(gòu)設(shè)計(jì)
7.3.2 系統(tǒng)實(shí)現(xiàn)
7.4 本章小結(jié)
第8章 結(jié)束語(yǔ)
8.1 本書工作和創(chuàng)新之處
8.2 研究不足及后續(xù)研究展望
8.3 本章小結(jié)
參考文獻(xiàn)
后 記