定 價:61.9 元
叢書名:大數(shù)據(jù)視野下的外語與外語學習研究系列叢書
- 作者:于濤
- 出版時間:2017/12/1
- ISBN:9787513596596
- 出 版 社:外語教學與研究出版社
- 中圖法分類:H314.2
- 頁碼:264
- 紙張:膠版紙
- 版次:1
- 開本:32開
《基于索引行聚類的英語動詞型式自動識別與提取研究》關注概括和提取語言型式。本書中采用相似度分析方法,在索引行自動聚類的基礎上實現(xiàn)英語動詞型式的自動識別與提取,圍繞索引行聚類的影響因素及分組數(shù)量的選擇,型式自動識別的準確率及其影響因素進行探究,建構了英語動詞型式自動提取模型,該模型以后可能廣泛應用于語言教學、語言研究及自動語法檢查中。
于濤,文學博士,江蘇師范大學外國語學院副教授,副院長,碩士生導師。研究方向為:應用語言學與語料庫語言學。曾主持江蘇省社科基金項目一項(已結題),現(xiàn)主持國家社科基金項目 "基于型式語法及索引行聚類的動詞型式自動識別與提取研究"一項。迄今發(fā)表論文數(shù)十篇。
緒論 1
0.1 研究背景 1
0.2 本研究的理論及實踐意義 4
0.2.1 理論意義 4
0.2.2 實踐意義 6
0.3 本研究概述 9
0.3.1 研究目的 9
0.3.2 研究問題及研究對象 9
0.3.3 研究步驟 10
0.3.3.1 語料及預處理 11
0.3.3.2 特征集的建立及其轉換 11
0.3.3.3 權重計算 13
0.3.3.4 索引行聚類 14
0.3.3.5 型式提取 15
0.4 本書結構 15
0.5 小結 16
第一章 型式與型式語法 17
1.1 型式 17
1.1.1 型式研究的緣起與發(fā)展 17
1.1.2 型式的定義 20
1.1.3 型式實例 21
1.1.4 型式元素及其編碼 23
1.1.5 本研究中判別型式的六個標準 26
1.2 型式語法 26
1.2.1 短語學思想與習語原則 27
1.2.2 詞匯與語法關系及各自地位 28
1.2.2.1 詞匯語法不可分 28
1.2.2.2 詞匯為中心的研究 30
1.2.3 型式與意義的關系 32
1.3 型式語法的優(yōu)缺點 35
1.3.1 型式語法與傳統(tǒng)語法的差異 35
1.3.2 型式語法的優(yōu)點 36
1.3.3 型式語法的不足 37
1.4 以型式語法為理論基礎的相關研究 40
1.5 小結 41
第二章 型式識別方法與相關應用研究 42
2.1 型式識別標準 42
2.2 型式總結的必要性 43
2.3 型式的識別 44
2.3.1 型式的人工識別 45
2.3.2 型式人工識別輔助工具的開發(fā) 48
2.3.3 型式的自動識別 48
2.3.3.1 型式自動識別的理據(jù) 48
2.3.3.2 型式的自動識別研究 51
2.4 現(xiàn)有的語言型式網(wǎng)絡平臺數(shù)據(jù)庫 52
2.4.1 基于機器處理的網(wǎng)絡數(shù)據(jù)庫 53
2.4.2 基于人工處理的網(wǎng)絡數(shù)據(jù)庫 54
2.5 小結 56
第三章 聚類分析 57
3.1 文本表示 58
3.2 特征選擇及其權重 59
3.2.1 特征選擇 59
3.2.2 權重計算 60
3.3 相似度計算 61
3.3.1 相似度計算的源起及理據(jù) 61
3.3.2 相似度計算方法 61
3.3.3 相似度分析在語言研究中的應用 63
3.4 聚類算法 64
3.4.1 劃分聚類 65
3.4.2 層次聚類 66
3.5 聚類質量評價指標 67
3.6 聚類在本研究的應用理據(jù) 68
3.7 小結 69
第四章 文本預處理與特征集的建立及轉換 70
4.1 研究概述 70
4.2 語料選取 70
4.3 研究工具 72
4.3.1 語料預處理工具 72
4.3.2 自主開發(fā)的模塊及腳本 72
4.4 語料預處理流程 73
4.5 動詞型式中的必要元素及其轉換方法 75
4.5.1 型式列表中元素的總體特征 75
4.5.2 具體詞形的處理方法 77
4.5.2.1 右側搭配詞處理方法 77
4.5.2.2 左側搭配詞處理方法 90
4.5.2.3 兩側搭配詞處理方法 90
4.5.3 相鄰單詞組合的處理方法 90
4.5.4 詞類標簽及語義類標簽的轉換方法 98
4.5.4.1 詞類標簽的轉換方法 98
4.5.4.2 語義類標簽轉換方法 102
4.5.5 轉換順序及步驟 104
4.6 小結 105
第五章 索引行聚類及型式自動提取方法 106
5.1 特征表示方法、特征權重與位置權重的計算 106
5.1.1 特征及特征權重 106
5.1.1.1 功能詞處理方法 107
5.1.1.2 特征標記方法 107
5.1.1.3 型式邊界的界定 108
5.1.1.4 索引行跨距的設定 110
5.1.1.5 特征權重計算方法 112
5.1.2 位置權重 112
5.1.3 特征索引行矩陣的生成 113
5.2 聚類算法 114
5.2.1 相似度計算 114
5.2.2 K均值算法 115
5.2.2.1 K均值聚類 115
5.2.2.2 K值的選擇標準 115
5.3 型式自動提取 116
5.4 小結 117