定 價(jià):39 元
叢書名:普通高等教育人工智能與大數(shù)據(jù)系列教材
- 作者:李文平
- 出版時(shí)間:2021/2/1
- ISBN:9787111672371
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP311.561
- 頁(yè)碼:156
- 紙張:
- 版次:1
- 開本:16K
本書是一本為人文社會(huì)科學(xué)方向的老師和學(xué)生量身打造的Python入門書。大數(shù)據(jù)時(shí)代人文社會(huì)科學(xué)的研究者應(yīng)該充分利用數(shù)據(jù)資源,分析數(shù)據(jù)背后隱藏的一般規(guī)律和特征。
本書以解決語(yǔ)言研究中常見的問題為主線,涉及中、英、日三種語(yǔ)言。以具體的問題為導(dǎo)向,講解快速、高效處理這些問題的方法,對(duì)每種方法都配有全部代碼及其詳細(xì)說(shuō)明。將這些代碼與第10章的批處理方法相結(jié)合,可以大大提高工作效率及準(zhǔn)確性。本書每章都配有習(xí)題,便于加深理解和應(yīng)用拓展。
本書適合作為自學(xué)Python的參考書,亦可作為語(yǔ)料庫(kù)語(yǔ)言學(xué)、計(jì)量語(yǔ)言學(xué)、計(jì)量風(fēng)格學(xué)等課程的教材。
目 錄
前 言
第1篇 準(zhǔn)備工作與文本
第1章 語(yǔ)言研究與編程3
1.1 學(xué)習(xí)編程的理由3
1.1.1 大數(shù)據(jù)語(yǔ)言研究3
1.1.2 新增功能4
1.1.3 注意事項(xiàng)5
1.2 編程難點(diǎn)6
1.3 本書構(gòu)成6
1.3.1 內(nèi)容構(gòu)成6
1.3.2 樣本文件和相關(guān)軟件6
1.4 本章小結(jié)6
習(xí)題6
第2章 文本數(shù)據(jù)7
2.1 文本文件的優(yōu)點(diǎn)7
2.2 文本文件的使用8
2.2.1 文本編輯器8
2.2.2 文本編輯器的安裝8
2.2.3 單文本檢索9
2.2.4 多文本檢索11
2.2.5 文本編輯器替換實(shí)例12
2.3 字符編碼與換行編碼13
2.3.1 字符編碼13
2.3.2 字符編碼的判斷13
2.3.3 字符編碼的轉(zhuǎn)換15
2.3.4 換行編碼15
2.4 本章小結(jié)16
習(xí)題16
第3章 正則表達(dá)式17
3.1 正則表達(dá)式的定義17
3.2 文本查找17
3.2.1 符號(hào)“?”的用法18
3.2.2 符號(hào)“.”的用法18
3.2.3 符號(hào)“+”的用法20
3.2.4 符號(hào)“*”的用法20
3.2.5 符號(hào)“[ ]”的用法20
3.2.6 符號(hào)“|”的用法22
3.2.7 符號(hào)“^”與“$”的用法23
3.2.8 后方引用23
3.2.9 元字符組合24
3.3 文本替換25
3.4 本章小結(jié)28
習(xí)題28
第2篇 Python的基礎(chǔ)知識(shí)
第4章 Python入門31
4.1 選擇Python的理由31
4.2 Python的安裝31
4.3 Python的運(yùn)行33
4.4 Python的計(jì)算34
4.4.1 Python的計(jì)算器功能34
4.4.2 變量34
4.5 字符串35
4.5.1 字符串顯示36
4.5.2 字符串長(zhǎng)度:len( )函數(shù)37
4.5.3 數(shù)值與字符串37
4.5.4 數(shù)值轉(zhuǎn)字符串:str( )函數(shù)38
4.5.5 字符串轉(zhuǎn)數(shù)值:int( )函數(shù)38
4.6 本章小結(jié)39
習(xí)題39
第5章 使用Python讀取文件40
5.1 保存并運(yùn)行Python程序40
5.1.1 程序編寫41
5.1.2 準(zhǔn)備工作41
5.1.3 程序運(yùn)行43
5.1.4 錯(cuò)誤處理43
5.2 添加注釋45
5.3 結(jié)果保存46
5.4 程序分析46
5.5 本章小結(jié)47
習(xí)題48
第6章 Python的檢索49
6.1 if語(yǔ)句49
6.2 字符串語(yǔ)句51
6.2.1 運(yùn)算符in51
6.2.2 startswith( )函數(shù)與endswith( )
函數(shù)51
6.3 not,and,or52
6.3.1 否定:not52
6.3.2 與關(guān)系:and52
6.3.3 或關(guān)系:or53
6.4 else與elif53
6.5 if實(shí)例54
6.5.1 特定行輸出54
6.5.2 字母大小寫55
6.5.3 刪除空行56
6.6 本章小結(jié)56
習(xí)題56
第7章 for循環(huán)58
7.1 循環(huán)的基礎(chǔ)知識(shí)58
7.2 循環(huán)控制語(yǔ)句60
7.2.1 跳過當(dāng)前循環(huán):continue60
7.2.2 循環(huán)中止:break61
7.3 循環(huán)應(yīng)用62
7.3.1 添加行號(hào)62
7.3.2 部分文件的輸出63
7.3.3 關(guān)鍵詞標(biāo)記64
7.3.4 空標(biāo)記65
7.4 本章小結(jié)66
習(xí)題66
第8章 單詞一覽表:列表68
8.1 列表68
8.1.1 列表的索引與切片69
8.1.2 列表元素的添加70
8.1.3 列表排序71
8.2 列表與循環(huán)72
8.3 文件排序73
8.4 單詞一覽表74
8.4.1 字符串與列表轉(zhuǎn)換:split( )和
join( )74
8.4.2 單詞一覽表程序75
8.4.3 符號(hào)處理77
8.5 表格數(shù)據(jù)處理77
8.6 本章小結(jié)80
習(xí)題80
第9章 單詞頻度表:字典81
9.1 字典的基礎(chǔ)知識(shí)81
9.2 單詞頻度表83
9.3 頻度表排序85
9.4 字典的導(dǎo)入86
9.5 本章小結(jié)88
習(xí)題88
第10章 文件操作89
10.1 文件的輸入與輸出89
10.1.1 操作對(duì)象89
10.1.2 文件的輸出91
10.1.3 關(guān)鍵詞91
10.2 批處理92
10.2.1 文件一覽表92
10.2.2 文件內(nèi)容的輸出93
10.2.3 文件名的輸出94
10.2.4 文件檢索95
10.2.5 文件替換95
10.3 本章小結(jié)97
習(xí)題97
第11章 Python中的正則
表達(dá)式98
11.1 正則表達(dá)式檢索98
11.1.1 匹配99
11.1.2 匹配行輸出99
11.1.3 匹配單詞統(tǒng)計(jì)100
11.1.4 匹配單詞列表102
11.2 替換102
11.3 本章小結(jié)103
習(xí)題103
第3篇 Python應(yīng)用:以漢語(yǔ)文本為中心
第12章 漢語(yǔ)詞性標(biāo)注基礎(chǔ)及
常用工具107
12.1 漢語(yǔ)詞性標(biāo)注107
12.2 漢語(yǔ)詞性標(biāo)注工具108
12.2.1 NLPIR108
12.2.2 Python jieba110
12.3 本章小結(jié)112
習(xí)題112
第13章 日語(yǔ)形態(tài)素解析工具113
13.1 形態(tài)素解析113
13.2 形態(tài)素解析工具簡(jiǎn)介114
13.2.1 軟件下載114
13.2.2 軟件安裝115
13.3 形態(tài)素解析工具的使用方法118
13.3.1 數(shù)據(jù)的選擇119
13.3.2 輸出選項(xiàng)120
13.4 形態(tài)素解析的注意事項(xiàng)123
13.4.1 解析精度123
13.4.2 解析單位124
13.5 本章小結(jié)125
習(xí)題126
第14章 Python處理漢語(yǔ)文本127
14.1 文本的讀寫127
14.2 漢語(yǔ)單詞頻度表128
14.3 動(dòng)詞頻度表132
14.4 本章小結(jié)134
習(xí)題134
第15章 KWIC檢索135
15.1 KWIC135
15.2 KWIC檢索程序136
15.2.1 讀入數(shù)據(jù)136
15.2.2 range( )函數(shù)138
15.2.3 前后語(yǔ)境140
15.2.4 KWIC檢索程序代碼141
15.3 本章小結(jié)143
習(xí)題143
第16章 詞語(yǔ)搭配檢索144
16.1 詞語(yǔ)搭配檢索程序144
16.2 程序的改進(jìn)147
16.2.1 批處理148
16.2.2 復(fù)雜匹配150
16.3 程序的拓展154
16.3.1 語(yǔ)境范圍154
16.3.2 檢索條件155
16.4 本章小結(jié)155
習(xí)題155
參考文獻(xiàn)156