中文信息處理教程(普通高等教育十一五國家級(jí)規(guī)劃教材)
定 價(jià):29 元
- 作者:宋繼華 等編著
- 出版時(shí)間:2011/6/1
- ISBN:9787040318968
- 出 版 社:高等教育出版社
- 中圖法分類:TP391.1
- 頁碼:283
- 紙張:膠版紙
- 版次:1
- 開本:16開
《中文信息處理教程》是普通高等教育“十一五”國家級(jí)規(guī)劃教材,是編者依據(jù)自身的教學(xué)實(shí)踐,在學(xué)習(xí)、吸收、借鑒前輩經(jīng)驗(yàn)的基礎(chǔ)上歸納、提煉而成的中文信息處理教材。書中比較系統(tǒng)地介紹了本學(xué)科領(lǐng)域的基本原理、方法和應(yīng)用技術(shù)。本書共8章,按中文信息處理的語言單位層級(jí)——漢字、詞語、句子、篇章依次展開。內(nèi)容包括:導(dǎo)論、漢字的信息處理、詞的信息處理、句子的信息處理、句子語義表達(dá)與分析。中文信息處理的基礎(chǔ)資源、文本分析與處理、中文信息處理評(píng)測(cè)。本書的特色是簡(jiǎn)明、實(shí)用,邏輯性強(qiáng),可讀性好,注重引導(dǎo)學(xué)生動(dòng)手解決實(shí)際問題。每章都附有習(xí)題,并給出了大部分習(xí)題的參考答案。《中文信息處理教程》可作為高等學(xué)校計(jì)算機(jī)、信息管理等專業(yè)本科生和研究生的教材,也可供從事中文信息處理研究和應(yīng)用的科技工作者參考。本書由宋繼華等編著。
《中文信息處理教程》共8章,按中文信息處理的語言單位層級(jí)——漢字、詞語、句子、篇章依次展開。內(nèi)容包括:導(dǎo)論、漢字的信息處理、詞的信息處理、句子的信息處理、句子語義表達(dá)與分析。中文信息處理的基礎(chǔ)資源、文本分析與處理、中文信息處理評(píng)測(cè)。本書的特色是簡(jiǎn)明、實(shí)用,邏輯性強(qiáng),可讀性好,注重引導(dǎo)學(xué)生動(dòng)手解決實(shí)際問題。每章都附有習(xí)題,并給出了大部分習(xí)題的參考答案。本書由宋繼華等編著。
第1章 導(dǎo)論 本章概覽 知識(shí)結(jié)構(gòu)圖 1.1 基本概念 1.1.1 學(xué)科由來 1.1.2 學(xué)科定位 1.2 研究?jī)?nèi)容 1.3 難點(diǎn)分析 1.3.1 歧義 1.3.2 語 第1章 導(dǎo)論 本章概覽 知識(shí)結(jié)構(gòu)圖 1.1 基本概念 1.1.1 學(xué)科由來 1.1.2 學(xué)科定位 1.2 研究?jī)?nèi)容 1.3 難點(diǎn)分析 1.3.1 歧義 1.3.2 語法 1.4 研究路線 1.5 習(xí)題第2章 漢字的信息處理 本章概覽 知識(shí)結(jié)構(gòu)圖 2.1 基礎(chǔ)知識(shí) 2.1.1 漢字的形、音、義 2.1.2 漢字的字頻和字量 2.1.3 漢字的編碼 2.2 交換碼和內(nèi)碼 2.2.1 ASCⅡ 2.2.2 編碼框架:ISO/IEC2022 2.2.3 GB2312 2.2.4 BIG5 2.2.5 ISO/IECl0646和Unicode 2.2.6 GBK 2.2.7 GBL8030 2.2.8 編程務(wù)實(shí) 2.3 漢字的輸入 2.3.1 鍵盤輸入 2.3.2 字形識(shí)別 2.3.3 語音識(shí)別 2.4 漢字的輸出 2.5 中文編碼的前沿課題 2.5.1 古籍?dāng)?shù)字化 2.5.2 《通用規(guī)范漢字表》 2.5.3 少數(shù)民族文字 2.6 習(xí)題第3章 詞的信息處理 本章概覽 知識(shí)結(jié)構(gòu)圖 3.1 基礎(chǔ)知識(shí) 3.1.1 概率論基礎(chǔ) 3.1.2 信息論基礎(chǔ) 3.1.3 n元語法模型 3.1.4 語法模型的性能評(píng)價(jià) 3.2 自動(dòng)分詞 3.2.1 漢語詞的界定 3.2.2 自動(dòng)分詞方法 3.2.3 未登錄詞的識(shí)別 3.3 詞性標(biāo)注 3.3.1 詞性標(biāo)注概述 3.3.2 基于統(tǒng)計(jì)的詞性標(biāo)注方法 3.3.3 基于規(guī)則的詞性標(biāo)注方法 3.4 命名實(shí)體識(shí)別 3.4.1 命名實(shí)體識(shí)別介紹 3.4.2 中文命名實(shí)體的定義和標(biāo)準(zhǔn) 3.4.3 中文命名實(shí)體識(shí)別方法 3.5 習(xí)題第4章 句子的信息處理 本章概覽 知識(shí)結(jié)構(gòu)圖 4.1 形式語言基礎(chǔ) 4.1.1 形式語言理論 4.1.2 自動(dòng)機(jī)理論 4.2 短語結(jié)構(gòu)語法 4.2.1 漢語短語結(jié)構(gòu)語法 4.2.2 分析算法 4.2.3 實(shí)用策略 4.3 依存語法 4.3.1 依存句法理論 4.3.2 分析算法 4.4 句法理論探索 4.4.1 Chomsky語法理論 4.4.2 廣義短語結(jié)構(gòu)語法 4.4.3 鏈語法 4.4.4 范疇語法 4.5 習(xí)題第5章 句子語義表達(dá)與分析 本章概覽 知識(shí)結(jié)構(gòu)圖 5.1 格語法 5.1.1 基本思想 5.1.2 格的分類 5.1.3 格的判斷 5.1.4 用格語法生成句子 5.1.5 漢語格語法 5.2 概念依存理論 5.2.1 基本模型 5.2.2 語義推理 5.2.3 腳本法 5.3 概念層次網(wǎng)絡(luò)(HNC) 5.4 語義本體 5.5 習(xí)題第6章 中文信息處理的基礎(chǔ)資源 本章概覽 知識(shí)結(jié)構(gòu)圖 6.1 語料庫概述 6.1.1 語料庫發(fā)展歷史 6.1.2 語料庫屬性 6.2 典型中文語科庫介紹 6.2.1 北京大學(xué)計(jì)算語言學(xué)研究所《人民日?qǐng)?bào)》標(biāo)注語料庫 6.2.2 清華大學(xué)漢語樹庫 6.2.3 哈爾濱工業(yè)大學(xué)漢語依存樹庫 6.2.4 中國臺(tái)灣“中央研究院”語料庫 6.2.5 國家語言文字工作委員會(huì)語料庫 6.2.6 山西大學(xué)語料庫 6.3 典型中文語言知識(shí)庫資源介紹 6.3.1 北京大學(xué)計(jì)算語言學(xué)研究所綜合型語言知識(shí)庫 6.3.2 知網(wǎng) 6.3.3 中國臺(tái)灣“中央研究院”中文詞匯網(wǎng)絡(luò) 6.3.4 概念層次網(wǎng)絡(luò) 6.3.5 漢語框架網(wǎng)知識(shí)庫 6.4 中文語言資源聯(lián)盟 6.5 習(xí)題第7章 文本分析與處理 本章概覽 知識(shí)結(jié)構(gòu)圖 7.1 文本分類 7.1.1 文本表示 7.1.2 文本分類算法 7.2 信息檢索 7.2.1 常用的檢索模型 7.2.2 搜索引擎 7.3 問答系統(tǒng) 7.3.1 問答系統(tǒng)概述 7.3.2 系統(tǒng)構(gòu)成 7.3.3 典型問答系統(tǒng)介紹 7.4 信息抽取 7.4.1 信息抽取概述 7.4.2 系統(tǒng)的基本構(gòu)成及關(guān)鍵技術(shù) 7.5 自動(dòng)文摘 7.5.1 自動(dòng)文摘概述 7.5.2 基于統(tǒng)計(jì)的機(jī)械文摘 7.5.3 基于意義的理解文摘 7.6 習(xí)題第8章 中文信息處理評(píng)測(cè) 本章概覽 知識(shí)結(jié)構(gòu)圖 8.1 評(píng)測(cè)概述 8.1.1 評(píng)測(cè)的意義 8.1.2 評(píng)測(cè)的過程 8.2 系列評(píng)測(cè)介紹 8.2.1 NIST系列評(píng)測(cè) 8.2.2 ACL-SIGHAN系列評(píng)測(cè) 8.2.3 863技術(shù)測(cè)評(píng) 8.2.4 中文信息學(xué)會(huì)評(píng)測(cè) 8.3 各領(lǐng)域技術(shù)評(píng)測(cè)介紹 8.3.1 中文分詞和詞性標(biāo)注評(píng)測(cè) 8.3.2 詞義消歧評(píng)測(cè) 8.3.3 句法分析評(píng)測(cè) 8.3.4 文本分類器性能評(píng)估 8.3.5 信息檢索系統(tǒng)的評(píng)測(cè) 8.3.6 問答系統(tǒng)評(píng)測(cè) 8.3.7 信息抽取評(píng)測(cè) 8.3.8 自動(dòng)文摘評(píng)測(cè) 8.4 習(xí)題 部分習(xí)題參考答案參考文獻(xiàn)