定 價(jià):198 元
叢書(shū)名:經(jīng)典譯叢·人類(lèi)語(yǔ)言技術(shù)
- 作者:Daniel Jurafsky(D. 朱夫斯凱), James H. Martin(J. H. 馬。
- 出版時(shí)間:2018/3/1
- ISBN:9787121250583
- 出 版 社:電子工業(yè)出版社
- 中圖法分類(lèi):TP391
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:2
- 開(kāi)本:16開(kāi)
從本書(shū)*版出版以來(lái),一直好評(píng)如潮,被國(guó)外許多大學(xué)選作自然語(yǔ)言處理或計(jì)算語(yǔ)言學(xué)的教材,被認(rèn)為該領(lǐng)域教材的黃金標(biāo)準(zhǔn)。本書(shū)*版綜合了自然語(yǔ)言處理、計(jì)算語(yǔ)言學(xué)和語(yǔ)音識(shí)別的內(nèi)容,全面論述計(jì)算機(jī)自然語(yǔ)言處理,深入探討計(jì)算機(jī)處理自然語(yǔ)言的詞匯、句法、語(yǔ)義、語(yǔ)用等各個(gè)方面的問(wèn)題,介紹了自然語(yǔ)言處理的各種現(xiàn)代技術(shù)。該版對(duì)于*版做了全面的改寫(xiě),增加了大量反映自然語(yǔ)言處理*成就的內(nèi)容,特別是增加了語(yǔ)音處理和統(tǒng)計(jì)技術(shù)方面的內(nèi)容,全書(shū)面貌為之一新。本書(shū)四大特色: 覆蓋全面 強(qiáng)調(diào)實(shí)用 注重評(píng)測(cè) 語(yǔ)料為本內(nèi)容簡(jiǎn)介本書(shū)全面論述了自然語(yǔ)言處理技術(shù)。本書(shū)在*版的基礎(chǔ)上增加了自然語(yǔ)言處理的*成就,特別是增加了語(yǔ)音處理和統(tǒng)計(jì)技術(shù)方面的內(nèi)容,全書(shū)面貌為之一新。本書(shū)共分五個(gè)部分。*部分詞匯的計(jì)算機(jī)處理,講述單詞的計(jì)算機(jī)處理,包括單詞切分、單詞的形態(tài)學(xué)、*小編輯距離、詞類(lèi),以及單詞計(jì)算機(jī)處理的各種算法,包括正則表達(dá)式、有限狀態(tài)自動(dòng)機(jī)、有限狀態(tài)轉(zhuǎn)錄機(jī)、N元語(yǔ)法模型、隱馬爾可夫模型、*熵模型等。第二部分語(yǔ)音的計(jì)算機(jī)處理,介紹語(yǔ)音學(xué)、語(yǔ)音合成、語(yǔ)音自動(dòng)識(shí)別以及計(jì)算音系學(xué)。第三部分句法的計(jì)算機(jī)處理,介紹英語(yǔ)的形式語(yǔ)法,講述句法剖析的主要算法,包括CKY剖析算法、Earley剖析算法、統(tǒng)計(jì)剖析,并介紹合一與類(lèi)型特征結(jié)構(gòu)、Chomsky層級(jí)分類(lèi)、抽吸引理等分析工具。第四部分語(yǔ)義和語(yǔ)用的計(jì)算機(jī)處理,介紹語(yǔ)義的各種表示方法、計(jì)算語(yǔ)義學(xué)、詞匯語(yǔ)義學(xué)、計(jì)算詞匯語(yǔ)義學(xué),并介紹同指、連貫等計(jì)算機(jī)話語(yǔ)分析問(wèn)題。第五部分應(yīng)用,講述信息抽取、問(wèn)答系統(tǒng)、自動(dòng)文摘、對(duì)話和會(huì)話智能代理、機(jī)器翻譯等自然語(yǔ)言處理的應(yīng)用技術(shù)。本書(shū)寫(xiě)作風(fēng)格深入淺出,實(shí)例豐富,引人入勝。本書(shū)可作為高等學(xué)校自然語(yǔ)言處理或計(jì)算語(yǔ)言學(xué)的本科生和研究生的教材,也可以作為從事人工智能、自然語(yǔ)言處理等領(lǐng)域的研究人員和技術(shù)人員的必備參考。
從本書(shū)*版出版以來(lái),一直好評(píng)如潮,被國(guó)外許多大學(xué)選作自然語(yǔ)言處理或計(jì)算語(yǔ)言學(xué)的教材,被認(rèn)為該領(lǐng)域教材的黃金標(biāo)準(zhǔn)。
本書(shū)*版綜合了自然語(yǔ)言處理、計(jì)算語(yǔ)言學(xué)和語(yǔ)音識(shí)別的內(nèi)容,全面論述計(jì)算機(jī)自然語(yǔ)言處理,深入探討計(jì)算機(jī)處理自然語(yǔ)言的詞匯、句法、
語(yǔ)義、語(yǔ)用等各個(gè)方面的問(wèn)題,介紹了自然語(yǔ)言處理的各種現(xiàn)代技術(shù)。該版對(duì)于*版做了全面的改寫(xiě),增加了大量反映自然語(yǔ)言處理*成就
的內(nèi)容,特別是增加了語(yǔ)音處理和統(tǒng)計(jì)技術(shù)方面的內(nèi)容,全書(shū)面貌為之一新。
本書(shū)四大特色:
覆蓋全面 強(qiáng)調(diào)實(shí)用 注重評(píng)測(cè) 語(yǔ)料為本
譯 者 簡(jiǎn) 介
馮志偉
先后在北京大學(xué)和中國(guó)科學(xué)技術(shù)大學(xué)研究生院兩次研究生畢業(yè),獲雙碩士學(xué)位。1978年至1981年,在法國(guó)格勒諾布爾理科醫(yī)科大學(xué)應(yīng)用數(shù)學(xué)研究所(IMAG)自動(dòng)翻譯中心(CETA)師從法國(guó)著名數(shù)學(xué)家、國(guó)際計(jì)算語(yǔ)言學(xué)委員會(huì)主席B.Vauquois教授,專(zhuān)門(mén)研究數(shù)理語(yǔ)言學(xué)和機(jī)器翻譯問(wèn)題;貒(guó)后,先后擔(dān)任中國(guó)科學(xué)技術(shù)信息研究所計(jì)算中心機(jī)器翻譯研究組組長(zhǎng)、教育部語(yǔ)言文字應(yīng)用研究所計(jì)算語(yǔ)言學(xué)研究室主任、杭州師范大學(xué)外國(guó)語(yǔ)學(xué)院高端特聘教授。1986年至2004年,在德國(guó)Fraunhofer研究院)(FhG)、Trier大學(xué)、Konstanz高等技術(shù)學(xué)院、韓國(guó)Korean Advanced Institute of Science and Technology (KAIST)、英國(guó)Birmingham大學(xué)擔(dān)任教授或研究員,長(zhǎng)期從事語(yǔ)言學(xué)和計(jì)算機(jī)科學(xué)的跨學(xué)科研究,是我國(guó)計(jì)算語(yǔ)言學(xué)事業(yè)的開(kāi)拓者之一。在中國(guó),他是中國(guó)語(yǔ)文現(xiàn)代化學(xué)會(huì)副會(huì)長(zhǎng)、中國(guó)應(yīng)用語(yǔ)言學(xué)學(xué)會(huì)常務(wù)理事、中國(guó)人工智能學(xué)會(huì)理事、國(guó)家語(yǔ)言文字工作委員會(huì)21世紀(jì)語(yǔ)言文字規(guī)范(標(biāo)準(zhǔn))審定委員會(huì)委員、全國(guó)科學(xué)技術(shù)名詞審定委員會(huì)委員、全國(guó)術(shù)語(yǔ)標(biāo)準(zhǔn)化技術(shù)委員會(huì)委員、中國(guó)外語(yǔ)教育研究中心學(xué)術(shù)委員會(huì)委員、《數(shù)學(xué)辭海》總編輯委員會(huì)委員、《中國(guó)大百科全書(shū)》(《語(yǔ)言文字卷》)編輯委員會(huì)成員。在國(guó)際上,他是TELRI(Trans European Language Resources Infrastructure)、LREC(Language Resources and Evaluation Conference)、COLING 2010(Computational Linguistics Conference)的顧問(wèn)委員會(huì)委員,并擔(dān)任IJCL(International Journal of Corpus Linguistics)、IJCC(International Journal of Chinese and Computing)等重要學(xué)術(shù)期刊編委以及英國(guó)Continuum出版公司系列叢書(shū)Research in Corpus and Discourse編委。承擔(dān)國(guó)家自然科學(xué)基金項(xiàng)目和國(guó)家社會(huì)科學(xué)基金項(xiàng)目多項(xiàng),出版專(zhuān)著30余部,發(fā)表論文300余篇。
孫樂(lè)
1998年5月畢業(yè)于南京理工大學(xué),獲博士學(xué)位。1998年9月至2000年10月在中國(guó)科學(xué)院軟件研究所從事博士后研究,現(xiàn)為中國(guó)科學(xué)院軟件研究所中文信息處理研究室研究員、博士生導(dǎo)師。曾先后在英國(guó)Birmingham大學(xué)、加拿大Montreal大學(xué)做訪問(wèn)學(xué)者。目前主要研究方向:自然語(yǔ)言理解、知識(shí)圖譜、信息抽取、問(wèn)答系統(tǒng)等。作為項(xiàng)目負(fù)責(zé)人承擔(dān)國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目、國(guó)家863項(xiàng)目、國(guó)際合作項(xiàng)目等30多項(xiàng),在ACL、SIGIR、EMNLP等重要國(guó)際會(huì)議和國(guó)內(nèi)核心期刊發(fā)表論文50多篇,F(xiàn)為中國(guó)中文信息學(xué)會(huì)副理事長(zhǎng)兼秘書(shū)長(zhǎng)、中文信息學(xué)報(bào)副主編、國(guó)家語(yǔ)委語(yǔ)言文字規(guī)范標(biāo)準(zhǔn)審定委員會(huì)委員、國(guó)際測(cè)評(píng)NTCIR MOAT中文簡(jiǎn)體任務(wù)的組織者、第23屆國(guó)際計(jì)算語(yǔ)言學(xué)大會(huì)(COLING 2010)組織委員會(huì)聯(lián)席主席、第13屆國(guó)際機(jī)器翻譯峰會(huì)(MT Summit 2011)組織委員會(huì)聯(lián)席主席、第53屆國(guó)際計(jì)算語(yǔ)言學(xué)年會(huì)(ACL2015)組織委員會(huì)聯(lián)席主席。
中文版序言
The goal of a textbook author is the same as the goal of any teacher: passing on our love for our field to a new generation of students, encouraging them to do innovative and creative new work, and helping them to advance the state of human knowledge. For a textbook in the interdisciplinary area of speech and language processing, there are the additional goals of enabling students from differing backgrounds (computer science, linguistics, electrical engineering) to acquire the knowledge and tools of the new interdisciplinary field, and to develop an appreciation for the beauty and complexity and variety of human language. We therefore feel extremely lucky that Professor Feng Zhiwei, aided by Dr. Sun Le, undertook the arduous job of translating this book. Prof. Feng is the perfect scholar for the job of translating such a book, because of his long experience in our field, his wide breadth of research interests throughout computational linguistics in general and Chinese computational linguistics specifically, his remarkable familiarity with the state of our field across the world, from China to France, from Korea to Germany, and of course his expertise on translation as a research area! We are also very excited that this translation into Chinese is the first translation of our book out of English. China's long history of the study of language is of course well known, and in this new century the young scientists of China are already playing a key role in the important scientific advances of our field. We look forward to even more amazing contributions from China and hope that our small book, now with the help of Prof. Feng and Dr. Sun, can provide a small aide in the great role that Chinese scientists are playing on the world scientific stage!
Daniel Jurafsky and James H. Martin
Palo Alto, California, and Boulder, Colorado
譯文
教材的作者與所有教師有著相同的目標(biāo):即把我們對(duì)于本專(zhuān)業(yè)的熱愛(ài)傳達(dá)給新一代的學(xué)生, 鼓勵(lì)他們?nèi)ミM(jìn)行創(chuàng)新性的研究和探索,幫助他們把人類(lèi)知識(shí)進(jìn)一步向前推進(jìn)。由于語(yǔ)音和語(yǔ)言的計(jì)算機(jī)處理屬于交叉學(xué)科的領(lǐng)域,所以,我們這本關(guān)于這個(gè)交叉學(xué)科領(lǐng)域的教材還有其特定的目標(biāo)。這些特定的目標(biāo)就是使來(lái)自不同知識(shí)背景(計(jì)算機(jī)科學(xué)、語(yǔ)言學(xué)和電子工程)的學(xué)生掌握這門(mén)新的交叉學(xué)科的基本知識(shí)和工具,并在學(xué)習(xí)過(guò)程中一步一步地來(lái)感受人類(lèi)語(yǔ)言的美妙性、復(fù)雜性和多樣性。因此,當(dāng)我們了解到馮志偉教授在孫樂(lè)研究員的協(xié)助下承擔(dān)了把這本教材翻譯成中文的艱辛工作的時(shí)候,我們感到無(wú)比的榮幸。我們認(rèn)為,馮志偉教授是翻譯這本教材的最理想的學(xué)者,因?yàn)樗谶@個(gè)專(zhuān)業(yè)領(lǐng)域具有多年的經(jīng)驗(yàn);他的研究興趣涉及面廣,既包括普遍的計(jì)算語(yǔ)言學(xué)研究,也包括具體的漢語(yǔ)計(jì)算語(yǔ)言學(xué)的研究;他對(duì)于這個(gè)學(xué)科在全世界的情況了如指掌,從中國(guó)到法國(guó),從韓國(guó)到德國(guó),他都親身參與了這些國(guó)家的計(jì)算語(yǔ)言學(xué)研究工作;并且,翻譯一直是馮教授長(zhǎng)期從事的一個(gè)研究領(lǐng)域,他當(dāng)然也是精研通達(dá)的翻譯內(nèi)行!這個(gè)中文譯本是英文原著的第一個(gè)外文譯本,它的出版使我們非常之激動(dòng)和振奮。眾所周知,中國(guó)在語(yǔ)言研究方面有著悠久的歷史,在新世紀(jì),中國(guó)年輕一代的科學(xué)工作者在這個(gè)領(lǐng)域的一些重要的科學(xué)進(jìn)展方面已經(jīng)起著關(guān)鍵性的作用。我們期待著中國(guó)在這個(gè)領(lǐng)域里進(jìn)一步做出更加出色的貢獻(xiàn),并且希望,在中國(guó)科學(xué)工作者為全世界的科學(xué)進(jìn)步事業(yè)所發(fā)揮的巨大作用中,由于馮志偉教授和孫樂(lè)研究員的幫助,拙著也能夠?yàn)榇吮M我們的綿薄之力!
Daniel Jurafsky
James H. Martin
譯者序
采用計(jì)算機(jī)技術(shù)來(lái)研究和處理自然語(yǔ)言是20世紀(jì)40年代末期和20世紀(jì)60年代才開(kāi)始的, 60多年來(lái),這項(xiàng)研究取得了長(zhǎng)足的進(jìn)展,成為了計(jì)算機(jī)科學(xué)中一門(mén)重要的新興學(xué)科自然語(yǔ)言處理(Natural Language Processing,NLP)。
我們認(rèn)為,計(jì)算機(jī)對(duì)自然語(yǔ)言的研究和處理,一般應(yīng)經(jīng)過(guò)如下4個(gè)方面
Daniel Jurafsky現(xiàn)任斯坦福大學(xué)語(yǔ)言學(xué)系和計(jì)算機(jī)科學(xué)系副教授。在此之前,他曾在博爾德的科羅拉多大學(xué)語(yǔ)言學(xué)系、計(jì)算機(jī)科學(xué)系和認(rèn)知科學(xué)研究所任職。他出生于紐約州的Yonkers,1983年獲語(yǔ)言學(xué)學(xué)士,1992年獲計(jì)算機(jī)科學(xué)博士,兩個(gè)學(xué)位都在伯克利加利福尼亞大學(xué)獲得。他于1998年獲得美國(guó)國(guó)家基金會(huì)CAREER獎(jiǎng),2002年獲得Mac-Arthur獎(jiǎng)。他發(fā)表過(guò)90多篇論文,內(nèi)容涉及語(yǔ)音和語(yǔ)音處理的廣泛領(lǐng)域。James H. Martin現(xiàn)任博爾德的科羅拉多大學(xué)語(yǔ)言學(xué)系、計(jì)算機(jī)科學(xué)系教授,認(rèn)知科學(xué)研究所研究員。他出生于紐約市,1981年獲可倫比亞大學(xué)計(jì)算機(jī)科學(xué)學(xué)士,1988年獲伯克利加利福尼亞大學(xué)計(jì)算機(jī)科學(xué)博士。他寫(xiě)過(guò)70多篇關(guān)于計(jì)算機(jī)科學(xué)的論著,出版過(guò)《隱喻解釋的計(jì)算機(jī)模型》(A Computational Model of Metaphor Interpretation)一書(shū)。
馮志偉:先后在北京大學(xué)和中國(guó)科學(xué)技術(shù)大學(xué)研究生院兩次研究生畢業(yè),獲雙碩士學(xué)位。任中國(guó)科學(xué)技術(shù)信息研究所計(jì)算中心機(jī)器翻譯研究組組長(zhǎng)、教育部語(yǔ)言文字應(yīng)用研究所計(jì)算語(yǔ)言學(xué)研究室主任、杭州師范大學(xué)外國(guó)語(yǔ)學(xué)院高端特聘教授。長(zhǎng)期從事語(yǔ)言學(xué)和計(jì)算機(jī)科學(xué)的跨學(xué)科研究,是我國(guó)計(jì)算語(yǔ)言學(xué)事業(yè)的開(kāi)拓者之一。在中國(guó),他是中國(guó)語(yǔ)文現(xiàn)代化學(xué)會(huì)副會(huì)長(zhǎng)、中國(guó)應(yīng)用語(yǔ)言學(xué)學(xué)會(huì)常務(wù)理事、中國(guó)人工智能學(xué)會(huì)理事、國(guó)家語(yǔ)言文字工作委員會(huì)21世紀(jì)語(yǔ)言文字規(guī)范(標(biāo)準(zhǔn))審定委員會(huì)委員、全國(guó)科學(xué)技術(shù)名詞審定委員會(huì)委員、全國(guó)術(shù)語(yǔ)標(biāo)準(zhǔn)化技術(shù)委員會(huì)委員、中國(guó)外語(yǔ)教育研究中心學(xué)術(shù)委員會(huì)委員、《數(shù)學(xué)辭!房偩庉嬑瘑T會(huì)委員、《中國(guó)大百科全書(shū)》(《語(yǔ)言文字卷》)編輯委員會(huì)成員。在國(guó)際上,他是TELRI(Trans-European Language Resources Infrastructure)、LREC(Language Resources and Evaluation Conference)、COLING-2010(Computational Linguistics Conference)的顧問(wèn)委員會(huì)委員,并擔(dān)任IJCL(International Journal of Corpus Linguistics)、IJCC(International Journal of Chinese and Computing)等重要學(xué)術(shù)期刊編委以及英國(guó)Continuum出版公司系列叢書(shū)Research in Corpus and Discourse編委。承擔(dān)國(guó)家自然科學(xué)基金項(xiàng)目和國(guó)家社會(huì)科學(xué)基金項(xiàng)目多項(xiàng),出版專(zhuān)著30余部,發(fā)表論文300余篇。孫樂(lè):1998年5月畢業(yè)于南京理工大學(xué),獲博士學(xué)位。1998年9月至2000年10月在中國(guó)科學(xué)院軟件研究所從事博士后研究,博士后出站后留研究所工作至今,現(xiàn)為中國(guó)科學(xué)院軟件研究所基礎(chǔ)軟件國(guó)家工程中心研究員,博士生導(dǎo)師。曾于2003年和2004年,先后在英國(guó)Birmingham大學(xué)、加拿大Montreal大學(xué)做訪問(wèn)學(xué)者,從事平行語(yǔ)料庫(kù)和高精度信息檢索方面的研究。目前主要研究方向:基于知識(shí)的自然語(yǔ)言理解、下一代信息檢索模型、信息抽取與問(wèn)答系統(tǒng)等。作為項(xiàng)目負(fù)責(zé)人承擔(dān)國(guó)家自然科學(xué)基金項(xiàng)目、國(guó)家863項(xiàng)目和國(guó)際合作項(xiàng)目等10余項(xiàng),在國(guó)內(nèi)外重要學(xué)術(shù)刊物和會(huì)議上發(fā)表論文80多篇。
第1章導(dǎo)論
1.1語(yǔ)音與語(yǔ)言處理中的知識(shí)
1.2歧義
1.3模型和算法
1.4語(yǔ)言、思維和理解
1.5學(xué)科現(xiàn)狀與近期發(fā)展
1.6語(yǔ)音和語(yǔ)言處理簡(jiǎn)史
1.6.1基礎(chǔ)研究:20世紀(jì)40年代和20世紀(jì)50年代
1.6.2兩個(gè)陣營(yíng):1957年至1970年
1.6.3四個(gè)范型:1970年至1983年
1.6.4經(jīng)驗(yàn)主義和有限狀態(tài)模型的復(fù)蘇:1983年至1993年
1.6.5不同領(lǐng)域的合流:1994年至1999年
1.6.6機(jī)器學(xué)習(xí)的興起:2000年至2008年
1.6.7關(guān)于多重發(fā)現(xiàn)
1.6.8心理學(xué)的簡(jiǎn)要注記
1.7小結(jié)
1.8文獻(xiàn)和歷史說(shuō)明
第一部分 詞匯的計(jì)算機(jī)處理
第2章正則表達(dá)式與自動(dòng)機(jī)
2.1正則表達(dá)式
2.1.1基本正則表達(dá)式模式
2.1.2析取、組合與優(yōu)先關(guān)系
2.1.3一個(gè)簡(jiǎn)單的例子
2.1.4一個(gè)比較復(fù)雜的例子
2.1.5高級(jí)算符
2.1.6正則表達(dá)式中的替換、存儲(chǔ)器與ELIZA
2.2有限狀態(tài)自動(dòng)機(jī)
2.2.1用FSA來(lái)識(shí)別羊的語(yǔ)言
2.2.2形式語(yǔ)言
2.2.3其他例子
2.2.4非確定FSA
2.2.5使用NFSA接收符號(hào)串
2.2.6識(shí)別就是搜索
2.2.7確定自動(dòng)機(jī)與非確定自動(dòng)機(jī)的關(guān)系
2.3正則語(yǔ)言與 FSA
2.4小結(jié)
2.5文獻(xiàn)和歷史說(shuō)明
第3章 詞與轉(zhuǎn)錄機(jī)
3.1英語(yǔ)形態(tài)學(xué)概觀
3.1.1屈折形態(tài)學(xué)
3.1.2派生形態(tài)學(xué)
3.1.3附著
3.1.4非毗連形態(tài)學(xué)
3.1.5一致關(guān)系
3.2有限狀態(tài)形態(tài)剖析
3.3有限狀態(tài)詞表的建造
3.4有限狀態(tài)轉(zhuǎn)錄機(jī)
3.4.1定序轉(zhuǎn)錄機(jī)和確定性
3.5用于形態(tài)剖析的FST
3.6轉(zhuǎn)錄機(jī)和正詞法規(guī)則
3.7把FST詞表與規(guī)則相結(jié)合
3.8與詞表無(wú)關(guān)的FST:Porter詞干處理器
3.9單詞和句子的詞例還原
3.9.1中文的自動(dòng)切詞
3.10拼寫(xiě)錯(cuò)誤的檢查與更正
3.11最小編輯距離
3.12人是怎樣進(jìn)行形態(tài)處理的
3.13小結(jié)
3.14文獻(xiàn)和歷史說(shuō)明
第4章 N元語(yǔ)法
4.1語(yǔ)料庫(kù)中單詞數(shù)目的計(jì)算
4.2簡(jiǎn)單的(非平滑的)N元語(yǔ)法
4.3訓(xùn)練集和測(cè)試集
4.3.1N元語(yǔ)法及其對(duì)訓(xùn)練語(yǔ)料庫(kù)的敏感性
4.3.2未知詞:開(kāi)放詞匯與封閉詞匯
4.4N元語(yǔ)法的評(píng)測(cè):困惑度
4.5平滑
4.5.1Laplace平滑
4.5.2Good Turing打折法
4.5.3Good Turing估計(jì)的一些高級(jí)專(zhuān)題
4.6插值法
4.7回退法
4.7.1高級(jí)專(zhuān)題:計(jì)算Katz回退的和P*
4.8實(shí)際問(wèn)題:工具包和數(shù)據(jù)格式
4.9語(yǔ)言模型建模中的高級(jí)專(zhuān)題
4.9.1高級(jí)的平滑方法:Kneser Ney平滑法
4.9.2基于類(lèi)別的N元語(yǔ)法
4.9.3語(yǔ)言模型的自適應(yīng)和網(wǎng)絡(luò)(Web)應(yīng)用
4.9.4長(zhǎng)距離信息的使用:簡(jiǎn)要的綜述
4.10信息論背景
4.10.1用于比較模型的交叉熵
4.11高級(jí)問(wèn)題:英語(yǔ)的熵和熵率均衡性
4.12小結(jié)
4.13文獻(xiàn)和歷史說(shuō)明
第5章詞類(lèi)標(biāo)注
5.1(大多數(shù))英語(yǔ)詞的分類(lèi)
5.2英語(yǔ)的標(biāo)記集
5.3詞類(lèi)標(biāo)注
5.4基于規(guī)則的詞類(lèi)標(biāo)注
5.5基于隱馬爾可夫模型的詞類(lèi)標(biāo)注
5.5.1計(jì)算最可能的標(biāo)記序列: 一個(gè)實(shí)例
5.5.2隱馬爾可夫標(biāo)注算法的形式化
5.5.3使用Viterbi算法來(lái)進(jìn)行HMM標(biāo)注
5.5.4把HMM擴(kuò)充到三元語(yǔ)法
5.6基于轉(zhuǎn)換的標(biāo)注
5.6.1怎樣應(yīng)用TBL規(guī)則
5.6.2怎樣學(xué)習(xí)TBL規(guī)則
5.7評(píng)測(cè)和錯(cuò)誤分析
5.7.1錯(cuò)誤分析
5.8詞類(lèi)標(biāo)注中的高級(jí)專(zhuān)題
5.8.1實(shí)際問(wèn)題:標(biāo)記的不確定性與詞例還原
5.8.2未知詞
5.8.3其他語(yǔ)言中的詞類(lèi)標(biāo)注
5.8.4標(biāo)注算法的結(jié)合
5.9高級(jí)專(zhuān)題:拼寫(xiě)中的噪聲信道模型
5.9.1上下文錯(cuò)拼更正
5.10小結(jié)
5.11文獻(xiàn)和歷史說(shuō)明
第6章隱馬爾可夫模型與最大熵模型
6.1馬爾可夫鏈
6.2隱馬爾可夫模型
6.3似然度的計(jì)算:向前算法
6.4解碼:Viterbi算法
6.5HMM的訓(xùn)練:向前向后算法
6.6最大熵模型:背景
6.6.1線性回歸
6.6.2邏輯回歸
6.6.3邏輯回歸:分類(lèi)
6.6.4高級(jí)專(zhuān)題:邏輯回歸的訓(xùn)練
6.7最大熵模型
6.7.1為什么稱(chēng)為最大熵
6.8最大熵馬爾可夫模型
6.8.1MEMM的解碼和訓(xùn)練
6.9小結(jié)
6.10文獻(xiàn)和歷史說(shuō)明
第二部分 語(yǔ)音的計(jì)算機(jī)處理
第7章語(yǔ)音學(xué)
7.1言語(yǔ)語(yǔ)音與語(yǔ)音標(biāo)音法
7.2發(fā)音語(yǔ)音學(xué)
7.2.1發(fā)音器官
7.2.2輔音:發(fā)音部位
7.2.3輔音:發(fā)音方法
7.2.4元音
7.2.5音節(jié)
7.3音位范疇與發(fā)音變異
7.3.1語(yǔ)音特征
7.3.2語(yǔ)音變異的預(yù)測(cè)
7.3.3影響語(yǔ)音變異的因素
7.4聲學(xué)語(yǔ)音學(xué)和信號(hào)
7.4.1波
7.4.2語(yǔ)音的聲波
7.4.3頻率與振幅:音高和響度
7.4.4從波形來(lái)解釋音子
7.4.5聲譜和頻域
7.4.6聲源濾波器模型
7.5語(yǔ)音資源
7.6高級(jí)問(wèn)題:發(fā)音音系學(xué)與姿態(tài)音系學(xué)
7.7小結(jié)
7.8文獻(xiàn)和歷史說(shuō)明
第8章 語(yǔ)音合成
8.1文本歸一化
8.1.1句子的詞例還原
8.1.2非標(biāo)準(zhǔn)詞
8.1.3同形異義詞的排歧
8.2語(yǔ)音分析
8.2.1查詞典
8.2.2名稱(chēng)
8.2.3字位-音位轉(zhuǎn)換
8.3韻律分析
8.3.1韻律的結(jié)構(gòu)
8.3.2韻律的突顯度
8.3.3音調(diào)
8.3.4更精巧的模型:ToBI
8.3.5從韻律標(biāo)記計(jì)算音延
8.3.6從韻律標(biāo)記計(jì)算F0
8.3.7文本分析的最后結(jié)果:內(nèi)部表示
8.4雙音子波形合成
8.4.1建立雙音子數(shù)據(jù)庫(kù)的步驟
8.4.2雙音子毗連和用于韻律的TD-PSOLA
8.5單元選擇(波形)合成
8.6評(píng)測(cè)
8.7文獻(xiàn)和歷史說(shuō)明
第9章語(yǔ)音自動(dòng)識(shí)別
9.1語(yǔ)音識(shí)別的總體結(jié)構(gòu)
9.2隱馬爾可夫模型應(yīng)用于語(yǔ)音識(shí)別
9.3特征抽取:MFCC矢量
9.3.1預(yù)加重
9.3.2加窗
9.3.3離散傅里葉變換
9.3.4Mel濾波器組和對(duì)數(shù)
9.3.5倒譜:逆向傅里葉變換
9.3.6Delta特征與能量
9.3.7總結(jié):MFCC
9.4 聲學(xué)似然度的計(jì)算
9.4.1矢量量化
9.4.2高斯概率密度函數(shù)
9.4.3概率、對(duì)數(shù)概率和距離函數(shù)
9.5詞典和語(yǔ)言模型
9.6搜索與解碼
9.7嵌入式訓(xùn)練
9.8評(píng)測(cè):詞錯(cuò)誤率
9.9小結(jié)
9.10文獻(xiàn)和歷史說(shuō)明
第10章語(yǔ)音識(shí)別:高級(jí)專(zhuān)題
10.1多遍解碼:N最佳表和格
10.2A*解碼算法(棧解碼算法)
10.3依賴(lài)于上下文的聲學(xué)模型:三音子
10.4分辨訓(xùn)練
10.4.1最大互信息估計(jì)
10.4.2基于后驗(yàn)分類(lèi)器的聲學(xué)模型
10.5語(yǔ)音變異的建模
10.5.1環(huán)境語(yǔ)音變異和噪聲
10.5.2說(shuō)話人變異和說(shuō)話人適應(yīng)
10.5.3發(fā)音建模:由于語(yǔ)類(lèi)的差別而產(chǎn)生的變異
10.6元數(shù)據(jù):邊界、標(biāo)點(diǎn)符號(hào)和不流利現(xiàn)象
10.7人的語(yǔ)音識(shí)別
10.8小結(jié)
10.9文獻(xiàn)和歷史說(shuō)明
第11章計(jì)算音系學(xué)
11.1有限狀態(tài)音系學(xué)
11.2高級(jí)有限狀態(tài)音系學(xué)
11.2.1元音和諧
11.2.2模板式形態(tài)學(xué)
11.3計(jì)算優(yōu)選理論
11.3.1優(yōu)選理論中的有限狀態(tài)轉(zhuǎn)錄機(jī)模型
11.3.2優(yōu)選理論的隨機(jī)模型
11.4音節(jié)切分
11.5音位規(guī)則和形態(tài)規(guī)則的機(jī)器學(xué)習(xí)
11.5.1音位規(guī)則的機(jī)器學(xué)習(xí)
11.5.2形態(tài)規(guī)則的機(jī)器學(xué)習(xí)
11.5.3優(yōu)選理論中的機(jī)器學(xué)習(xí)
11.6小結(jié)
11.7文獻(xiàn)和歷史說(shuō)明
第三部分句法的計(jì)算機(jī)處理
第12章英語(yǔ)的形式語(yǔ)法
12.1組成性
12.2上下文無(wú)關(guān)語(yǔ)法
12.2.1上下文無(wú)關(guān)語(yǔ)法的形式定義
12.3英語(yǔ)的一些語(yǔ)法規(guī)則
12.3.1句子一級(jí)的結(jié)構(gòu)
12.3.2子句與句子
12.3.3名詞短語(yǔ)
12.3.4一致關(guān)系
12.3.5動(dòng)詞短語(yǔ)和次范疇化
12.3.6助動(dòng)詞
12.3.7并列關(guān)系
12.4樹(shù)庫(kù)
12.4.1樹(shù)庫(kù)的例子:賓州樹(shù)庫(kù)課題
12.4.2作為語(yǔ)法的樹(shù)庫(kù)
12.4.3樹(shù)庫(kù)搜索
12.4.4中心詞與中心詞的發(fā)現(xiàn)
12.5語(yǔ)法等價(jià)與范式
12.6有限狀態(tài)語(yǔ)法和上下文無(wú)關(guān)語(yǔ)法
12.7依存語(yǔ)法
12.7.1依存和中心詞之間的關(guān)系
12.7.2范疇語(yǔ)法
12.8口語(yǔ)的句法
12.8.1不流暢現(xiàn)象與口語(yǔ)修正
12.8.2口語(yǔ)樹(shù)庫(kù)
12.9語(yǔ)法和人的語(yǔ)言處理
12.10小結(jié)
12.11文獻(xiàn)和歷史說(shuō)明
第13章句法剖析
13.1剖析就是搜索
13.1.1自頂向下剖析
13.1.2自底向上剖析
13.1.3自頂向下剖析與自底向上剖析比較
13.2歧義
13.3面對(duì)歧義的搜索
13.4動(dòng)態(tài)規(guī)劃剖析方法
13.4.1CKY剖析
13.4.2Earley算法
13.4.3線圖剖析
13.5局部剖析
13.5.1基于規(guī)則的有限狀態(tài)組塊分析
13.5.2基于機(jī)器學(xué)習(xí)的組塊分析方法
13.5.3組塊分析系統(tǒng)的評(píng)測(cè)
13.6小結(jié)
13.7文獻(xiàn)和歷史說(shuō)明
第14章統(tǒng)計(jì)剖析
14.1概率上下文無(wú)關(guān)語(yǔ)法
14.1.1 PCFG用于排歧
14.1.2PCFG用于語(yǔ)言建模
14.2PCFG的概率CKY剖析
14.3PCFG規(guī)則概率的學(xué)習(xí)途徑
14.4PCFG的問(wèn)題
14.4.1獨(dú)立性假設(shè)忽略了規(guī)則之間的結(jié)構(gòu)依存關(guān)系
14.4.2缺乏對(duì)詞匯依存關(guān)系的敏感性
14.5使用分離非終極符號(hào)的辦法來(lái)改進(jìn)PCFG
14.6概率詞匯化的CFG
14.6.1Collins剖析器
14.6.2高級(jí)問(wèn)題:Collins剖析器更多的細(xì)節(jié)
14.7剖析器的評(píng)測(cè)
14.8高級(jí)問(wèn)題:分辨再排序
14.9高級(jí)問(wèn)題:基于剖析器的語(yǔ)言模型
14.10人的剖析
14.11小結(jié)
14.12文獻(xiàn)和歷史說(shuō)明
第15章特征與合一
15.1特征結(jié)構(gòu)
15.2特征結(jié)構(gòu)的合一
15.3語(yǔ)法中的特征結(jié)構(gòu)
15.3.1一致關(guān)系
15.3.2中心語(yǔ)特征
15.3.3次范疇化
15.3.4長(zhǎng)距離依存關(guān)系
15.4合一的實(shí)現(xiàn)
15.4.1合一的數(shù)據(jù)結(jié)構(gòu)
15.4.2合一算法
15.5帶有合一約束的剖析
15.5.1把合一結(jié)合到Earley剖析器中
15.5.2基于合一的剖析
15.6類(lèi)型與繼承
15.6.1高級(jí)問(wèn)題:類(lèi)型的擴(kuò)充
15.6.2合一的其他擴(kuò)充
15.7小結(jié)
15.8文獻(xiàn)和歷史說(shuō)明
第16章語(yǔ)言和復(fù)雜性
16.1Chomsky 層級(jí)
16.2怎么判斷一種語(yǔ)言不是正則的
16.2.1抽吸引理
16.2.2證明各種自然語(yǔ)言不是正則語(yǔ)言
16.3自然語(yǔ)言是上下文無(wú)關(guān)的嗎
16.4計(jì)算復(fù)雜性和人的語(yǔ)言處理
16.5小結(jié)
16.6文獻(xiàn)和歷史說(shuō)明
第四部分語(yǔ)義和語(yǔ)用的計(jì)算機(jī)處理
第17章意義的表示
17.1意義表示的計(jì)算要求
17.1.1可驗(yàn)證性
17.1.2無(wú)歧義性
17.1.3規(guī)范形式
17.1.4推理與變量
17.1.5表達(dá)能力
17.2模型論語(yǔ)義學(xué)
17.3一階邏輯
17.3.1一階邏輯基礎(chǔ)
17.3.2變量和量詞
17.3.3λ表示法
17.3.4一階邏輯的語(yǔ)義
17.3.5推理
17.4事件與狀態(tài)的表示
17.4.1時(shí)間表示
17.4.2體
17.5描述邏輯