《計(jì)量文體學(xué)導(dǎo)論》通俗而且詳細(xì)介紹了開(kāi)展文體計(jì)量研究所需統(tǒng)計(jì)學(xué)的基礎(chǔ)知識(shí),并且利用統(tǒng)計(jì)學(xué)方法以及基于現(xiàn)代統(tǒng)計(jì)學(xué)理論的計(jì)算機(jī)文本挖掘技術(shù)(文本聚類(lèi)和分類(lèi)技術(shù))開(kāi)展了以下幾方面的研究:中國(guó)古代和現(xiàn)代文學(xué)作品的文體特征的抽取、作者鑒定方法、特定作品的文體分析、作家語(yǔ)言使用的變異、以及計(jì)算機(jī)文體計(jì)量相關(guān)軟件工具使用等諸多方面的研究。用計(jì)量方法研究了一些歷來(lái)受到社會(huì)廣泛關(guān)注的文體學(xué)問(wèn)題。語(yǔ)言通俗易懂,對(duì)所涉及的數(shù)學(xué)和計(jì)算機(jī)方面的知識(shí)盡量使用比較簡(jiǎn)單方法進(jìn)行描述,具有高中知識(shí)水平的讀者既可以閱讀理解。
計(jì)量文體學(xué)的理論和方法是精確考察作品文體風(fēng)格、鑒定作品作者的有力武器,可以為司法工作提供科學(xué)的鑒定線(xiàn)索,可以為中國(guó)古典文獻(xiàn)的整理研究提供更為科學(xué)的手段,使國(guó)學(xué)研究進(jìn)一步科學(xué)化。
計(jì)量文體學(xué)研究在國(guó)外具有很長(zhǎng)的歷史,也積累了豐碩的科研成果。但是總體來(lái)講和歐美、日本的這方面研究相比還存在著很大的差距,處于落后的局面。本書(shū)嘗試從日本相關(guān)技術(shù)及研究方法中借鑒,希望可以起到拋磚引玉的作用。
《計(jì)量文體學(xué)導(dǎo)論》通俗而且詳細(xì)介紹了開(kāi)展文體計(jì)量研究所需的統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí),并且利用統(tǒng)計(jì)學(xué)方法以及基于現(xiàn)代統(tǒng)計(jì)學(xué)理論的計(jì)算機(jī)文本挖掘技術(shù)(文本聚類(lèi)和分類(lèi)技術(shù))開(kāi)展了以下幾方面的計(jì)量文體學(xué)研究:中國(guó)古代和現(xiàn)代文學(xué)作品的文體特征抽取、作者鑒定方法、特定作品的文體分析、作家語(yǔ)言使用的變異、以及計(jì)算機(jī)文體計(jì)量相關(guān)軟件工具使用等等。用計(jì)量方法研究了一些歷來(lái)受到社會(huì)廣泛關(guān)注的文體學(xué)問(wèn)題,如作者不同文體風(fēng)格相似作品的作者區(qū)分、作者相同風(fēng)格不同的作品分析、古典名著作者的計(jì)量文體學(xué)分析等等。
施建軍,北京外國(guó)語(yǔ)大學(xué)教授,主要從事日文信息計(jì)算機(jī)智能處理、日語(yǔ)語(yǔ)言學(xué)、文學(xué)作品作者鑒別、漢字文化圈國(guó)家語(yǔ)言文字、計(jì)算機(jī)輔助外語(yǔ)教學(xué)等領(lǐng)域的研究。主持或承擔(dān)國(guó)家重大項(xiàng)目2項(xiàng)、國(guó)家社科項(xiàng)目3項(xiàng)以及多項(xiàng)省部級(jí)項(xiàng)目和國(guó)內(nèi)外橫向項(xiàng)目。
第一章 緒論
第一節(jié) 什么是計(jì)量文體學(xué) 1
第二節(jié) 國(guó)內(nèi)外計(jì)量文體學(xué)發(fā)展的歷史和現(xiàn)狀 2
第三節(jié) 文體的計(jì)量特征 5
第二章 計(jì)量文體學(xué)相關(guān)重要統(tǒng)計(jì)學(xué)概念
第一節(jié) 文體特征的頻率、概率、條件概率 31
第二節(jié) 文體特征的平均值、中位數(shù)、眾數(shù) 37
第三節(jié) 文體特征的方差、標(biāo)準(zhǔn)差 46
第四節(jié) 文體特征的相關(guān)系數(shù) 52
第五節(jié) 特征和文體的相互信息 69
第三章 文體計(jì)量研究相關(guān)重要概率分布和定理
第一節(jié) 文體特征隨機(jī)變量的分布 82
第二節(jié) 文體計(jì)量研究相關(guān)的幾個(gè)重要概率分布 88
第三節(jié) 文體分析中的大數(shù)定律和中心極限定理 99
第四章 文體計(jì)量分析中的抽樣和抽樣分布
第一節(jié) 文章的抽樣調(diào)查和抽樣方法 106
第二節(jié) 文體的統(tǒng)計(jì)量和抽樣分布 116
第五章 文體計(jì)量分析中的參數(shù)估計(jì)問(wèn)題
第一節(jié) 文體特征參數(shù)的點(diǎn)估計(jì) 126
第二節(jié) 文體特征參數(shù)范圍的估計(jì) 131
第三節(jié) 文體特征平均值范圍的估計(jì) 135
第四節(jié) 文體特征參數(shù)范圍估計(jì)與作家風(fēng)格比較 152
第六章 文體特征差異的假設(shè)檢驗(yàn)
第一節(jié) 何為假設(shè)檢驗(yàn) 165
第二節(jié) 文體特征假設(shè)檢驗(yàn)的一般步驟 171
第三節(jié) Z檢驗(yàn)在文體分析中的應(yīng)用 175
第四節(jié) T檢驗(yàn)在文體分析中的應(yīng)用 180
第五節(jié) 虛詞使用習(xí)慣的假設(shè)檢驗(yàn) 190
第六節(jié) x2檢驗(yàn)在文體分析中的應(yīng)用 195
第七章 文體風(fēng)格個(gè)體性差異的方差分析
第一節(jié) 文體方差分析的基本原理 202
第二節(jié) 不同作家文體特征的方差分析 209
第三節(jié) 相同作家不同作品文體特征的方差分析 220
第八章 文體特征的多變量分析
第一節(jié) 文本的聚類(lèi)分析 226
第二節(jié) 文體研究中文本聚類(lèi)分析的有效性 230
第三節(jié) 聚類(lèi)分析和古典文學(xué)作品的作者研究 234
第四節(jié) 文體研究中文本聚類(lèi)分析的局限性 241
第九章 支持向量機(jī)技術(shù)和文學(xué)作品作者鑒別
第一節(jié) 支持向量機(jī)的基本原理 248
第二節(jié) 支持向量機(jī)技術(shù)研究古典文學(xué)作品作者的有效性 249
第三節(jié) 支持向量機(jī)技術(shù)和《紅樓夢(mèng)》作者研究 252
參考文獻(xiàn) 261
查看全部↓