關(guān)于我們
![]() ![]() |
自然語(yǔ)言處理從入門(mén)到實(shí)戰(zhàn) ![]()
為了幫助廣大愛(ài)好自然語(yǔ)言處理(NaturalLanguageProcessing,NLP)技術(shù)的讀者朋友入門(mén)此領(lǐng)域,本書(shū)闡述了自然語(yǔ)言處理概況、領(lǐng)域應(yīng)用、相關(guān)處理工具包、相關(guān)的機(jī)器學(xué)習(xí)及深度學(xué)習(xí)模型、文本預(yù)處理及文本表征等基礎(chǔ)知識(shí),以及具體的自然語(yǔ)言處理任務(wù),包括文本分類(lèi)、關(guān)系抽取、知識(shí)圖譜、文本摘要、序列標(biāo)注、機(jī)器翻譯和聊天系統(tǒng),同時(shí)介紹了自然語(yǔ)言處理技術(shù)在學(xué)術(shù)界以及工業(yè)界的發(fā)展、應(yīng)用現(xiàn)狀,并為讀者們提供了部分面試參考題目。
本書(shū)適合有一定的編程及機(jī)器學(xué)習(xí)基礎(chǔ),想入門(mén)自然語(yǔ)言處理,以及想系統(tǒng)了解或準(zhǔn)備求職自然語(yǔ)言處理初級(jí)崗位的讀者閱讀。 本書(shū)特色 1內(nèi)容安排實(shí)用實(shí)在、詳略得當(dāng),符合初學(xué)者的認(rèn)知規(guī)律 本書(shū)內(nèi)容涵蓋了從自然語(yǔ)言數(shù)據(jù)處理、基礎(chǔ)任務(wù)(如分詞、詞性標(biāo)注、命名實(shí)體識(shí)別等)到實(shí)戰(zhàn)性任務(wù)(如文本分類(lèi)、文本摘要、聊天系統(tǒng)等)所必須掌握的知識(shí),從內(nèi)容結(jié)構(gòu)上非常注重知識(shí)的實(shí)用性和可操作性。必須掌握的細(xì)節(jié)處不吝筆墨,輔以圖表以及代碼加深讀者印象;對(duì)僅需要大致了解處簡(jiǎn)要介紹一些相關(guān)理論及前沿動(dòng)態(tài)。這樣的安排使得初學(xué)者能夠掌握必備知識(shí),了解并思考學(xué)術(shù)前沿及行業(yè)應(yīng)用,符合初學(xué)者對(duì)自然語(yǔ)言處理知識(shí)的認(rèn)知規(guī)律。 2行文簡(jiǎn)單直白,以實(shí)例引導(dǎo)理論,特別適合初學(xué)者閱讀 本書(shū)行文簡(jiǎn)單直白,全程都有相應(yīng)的實(shí)例作為引導(dǎo),對(duì)于比較難的內(nèi)容盡量以舉例的形式幫助讀者理解。在介紹這些知識(shí)時(shí),并不是教條式的,填鴨式的講解,而是盡量以平實(shí)化的語(yǔ)言講解相關(guān)理論,猶如幫助一位老朋友,一步步地成為初級(jí)自然語(yǔ)言處理工程師。 3設(shè)置思考題以及項(xiàng)目代碼,激發(fā)初學(xué)者的熱情與興趣 本書(shū)的每一章都設(shè)置有相應(yīng)的思考題,并在附錄中提供了相關(guān)參考答案;讀者可以自測(cè)對(duì)章節(jié)內(nèi)容的學(xué)習(xí)的掌握程度。此外,本書(shū)章節(jié)介紹的代碼實(shí)例,相關(guān)的電子版本會(huì)隨書(shū)贈(zèng)予,使讀者能夠進(jìn)行實(shí)踐操作,更加深入地理解知識(shí)。這些實(shí)踐內(nèi)容是學(xué)習(xí)自然語(yǔ)言處理過(guò)程中必不可少的環(huán)節(jié),通過(guò)思考題以及代碼的操作練習(xí),能夠使讀者朋友快速地入門(mén)自然語(yǔ)言處理。
雖說(shuō)自然語(yǔ)言處理(Natural Language Processing, NLP)技術(shù)的歷史并不悠久,卻有著自身成熟的理論體系,覆蓋多門(mén)學(xué)科,比如數(shù)學(xué)、計(jì)算機(jī)科學(xué)、語(yǔ)言學(xué)、認(rèn)知心理學(xué)等基礎(chǔ)知識(shí),同時(shí)它又是一門(mén)應(yīng)用性極強(qiáng)的技術(shù),在很多領(lǐng)域都具備落地性。這種理論加實(shí)際操作能力的要求對(duì)初學(xué)者形成了雙重困難。通俗地闡述基本的、必備的理論知識(shí),克服困難,使讀者能夠快速?gòu)娜莸厣鲜謱?shí)際項(xiàng)目,成為一名初級(jí)自然語(yǔ)言處理工程師,這是本書(shū)的目標(biāo)。
本書(shū)濃縮編者多年的知識(shí)積累和實(shí)務(wù)工作經(jīng)驗(yàn)奉獻(xiàn)于讀者朋友。書(shū)中采用大量的圖示與代碼案例分析,將枯燥復(fù)雜的理論知識(shí)用平實(shí)的語(yǔ)言娓娓道來(lái),讓讀者在熟悉的場(chǎng)景中能夠動(dòng)態(tài)地理解專(zhuān)業(yè)知識(shí)。在具體內(nèi)容安排上,拋開(kāi)深?yuàn)W的理論化條文,除了必備的基礎(chǔ)理論、知識(shí)介紹外,不貪多求全,強(qiáng)調(diào)實(shí)務(wù)操作、快速上手——從如何對(duì)文本數(shù)據(jù)進(jìn)行預(yù)處理、基礎(chǔ)分析到實(shí)用的自然語(yǔ)言處理實(shí)踐任務(wù)如文本摘要生成、聊天系統(tǒng)等,讓讀者循序漸進(jìn)地入門(mén)系統(tǒng)的自然語(yǔ)言處理技術(shù)。隨著本書(shū)的講解,讀者的自然語(yǔ)言處理學(xué)習(xí)之旅一定會(huì)成為一番難忘的快樂(lè)體驗(yàn)。 本書(shū)特色 1內(nèi)容安排實(shí)用實(shí)在、詳略得當(dāng),符合初學(xué)者的認(rèn)知規(guī)律 本書(shū)內(nèi)容涵蓋了從自然語(yǔ)言數(shù)據(jù)處理、基礎(chǔ)任務(wù)(如分詞、詞性標(biāo)注、命名實(shí)體識(shí)別等)到實(shí)戰(zhàn)性任務(wù)(如文本分類(lèi)、文本摘要、聊天系統(tǒng)等)所必須掌握的知識(shí),從內(nèi)容結(jié)構(gòu)上非常注重知識(shí)的實(shí)用性和可操作性。必須掌握的細(xì)節(jié)處不吝筆墨,輔以圖表以及代碼加深讀者印象;對(duì)僅需要大致了解處簡(jiǎn)要介紹一些相關(guān)理論及前沿動(dòng)態(tài)。這樣的安排使得初學(xué)者能夠掌握必備知識(shí),了解并思考學(xué)術(shù)前沿及行業(yè)應(yīng)用,符合初學(xué)者對(duì)自然語(yǔ)言處理知識(shí)的認(rèn)知規(guī)律。 2行文簡(jiǎn)單直白,以實(shí)例引導(dǎo)理論,特別適合初學(xué)者閱讀 本書(shū)行文簡(jiǎn)單直白,全程都有相應(yīng)的實(shí)例作為引導(dǎo),對(duì)于比較難的內(nèi)容盡量以舉例的形式幫助讀者理解。在介紹這些知識(shí)時(shí),并不是教條式的,填鴨式的講解,而是盡量以平實(shí)化的語(yǔ)言講解相關(guān)理論,猶如幫助一位老朋友,一步步地成為初級(jí)自然語(yǔ)言處理工程師。 3設(shè)置思考題以及項(xiàng)目代碼,激發(fā)初學(xué)者的熱情與興趣 本書(shū)的每一章都設(shè)置有相應(yīng)的思考題,并在附錄中提供了相關(guān)參考答案;讀者可以自測(cè)對(duì)章節(jié)內(nèi)容的學(xué)習(xí)的掌握程度。此外,本書(shū)章節(jié)介紹的代碼實(shí)例,相關(guān)的電子版本會(huì)隨書(shū)贈(zèng)予,使讀者能夠進(jìn)行實(shí)踐操作,更加深入地理解知識(shí)。這些實(shí)踐內(nèi)容是學(xué)習(xí)自然語(yǔ)言處理過(guò)程中必不可少的環(huán)節(jié),通過(guò)思考題以及代碼的操作練習(xí),能夠使讀者朋友快速地入門(mén)自然語(yǔ)言處理。 自然語(yǔ)言處理從入門(mén)到實(shí)戰(zhàn) 本書(shū)內(nèi)容及體系結(jié)構(gòu) 第一部分自然語(yǔ)言處理核心技術(shù) 第1章自然語(yǔ)言處理初探 本章主要為讀者朋友介紹,在這短短不到一百年的時(shí)間里,自然語(yǔ)言處理早期的發(fā)展歷程,近些年突飛猛進(jìn)的發(fā)展,以及自然語(yǔ)言處理的基本任務(wù),在各行各業(yè)中的應(yīng)用和基本的工具框架。 第2章自然語(yǔ)言處理與機(jī)器學(xué)習(xí) 本章主要介紹一些常見(jiàn)機(jī)器學(xué)習(xí)模型的原理、對(duì)比分析各類(lèi)機(jī)器學(xué)習(xí)模型的優(yōu)缺點(diǎn)以及機(jī)器學(xué)習(xí)工具庫(kù)的使用。 第3章自然語(yǔ)言處理與神經(jīng)網(wǎng)絡(luò) 本章將為大家揭開(kāi)深度學(xué)習(xí)的神秘面紗,主要介紹神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)以及一些常見(jiàn)的訓(xùn)練過(guò)程中的優(yōu)化方案。 第二部分自然語(yǔ)言處理基本任務(wù) 第4章文本預(yù)處理 本章主要介紹文本預(yù)處理的基礎(chǔ)項(xiàng)目以及相關(guān)工具、關(guān)鍵詞提取的一些常用的方法以及數(shù)據(jù)不平衡的處理方法。 第5章文本的表示技術(shù) 本章將縱向梳理文本表示技術(shù)的發(fā)展脈絡(luò),分析各類(lèi)表示方法的優(yōu)缺點(diǎn)。 第6章序列標(biāo)注 本章將為大家介紹一些常見(jiàn)的序列標(biāo)注場(chǎng)景以及不同場(chǎng)景下的應(yīng)用模型。 第7章關(guān)系抽取 本章主要講解關(guān)系抽取的主要方法、前沿研究以及相關(guān)的應(yīng)用框架。 第三部分自然語(yǔ)言處理高級(jí)任務(wù) 第8章知識(shí)圖譜 本章主要介紹知識(shí)圖譜的相關(guān)概念、技術(shù)、應(yīng)用等。 第9章文本分類(lèi) 本章主要介紹基本的文本分類(lèi)方法以及相關(guān)工具的應(yīng)用。 第10章文本摘要 本章主要介紹自動(dòng)文本摘要中的兩大類(lèi)型,抽取式(extractive)摘要和生成式(abstractive)摘要,并且通過(guò)代碼搭建演示兩個(gè)簡(jiǎn)單版本的抽取式摘要生成器。 第11章機(jī)器翻譯 本章主要介紹機(jī)器翻譯的歷史、相關(guān)技術(shù)原理、現(xiàn)狀與不足等,通過(guò)本章的學(xué)習(xí),讀者將了解機(jī)器翻譯的源起、統(tǒng)計(jì)機(jī)器翻譯的原理、神經(jīng)機(jī)器翻譯的原理以及常見(jiàn)的改進(jìn)版本的神經(jīng)機(jī)器翻譯模型。 第12章聊天系統(tǒng) 本章節(jié)主要介紹聊天系統(tǒng)的基本類(lèi)型及應(yīng)用、關(guān)鍵技術(shù),并且用代碼演示開(kāi)發(fā)一款簡(jiǎn)單的閑聊系統(tǒng)。 第四部分自然語(yǔ)言處理求職 第13章自然語(yǔ)言處理技術(shù)的現(xiàn)在、未來(lái)及擇業(yè) 最后一章為有志于入門(mén)或從事自然語(yǔ)言處理的讀者提供更多的、與自然語(yǔ)言處理相關(guān)的常識(shí)性及實(shí)用性?xún)?nèi)容,比如學(xué)術(shù)界、工業(yè)界等方面的研究現(xiàn)狀、未來(lái)發(fā)展熱點(diǎn)、如何準(zhǔn)備面試等。 本書(shū)讀者對(duì)象 有一定的編程及機(jī)器學(xué)習(xí)基礎(chǔ),想入門(mén)自然語(yǔ)言處理的讀者 因?yàn)榕d趣,想系統(tǒng)性地了解自然語(yǔ)言處理的讀者 準(zhǔn)備求職自然語(yǔ)言處理初級(jí)崗位的讀者 雖說(shuō)自然語(yǔ)言處理(Natural Language Processing, NLP)技術(shù)的歷史并不悠久,卻有著自身成熟的理論體系,覆蓋多門(mén)學(xué)科,比如數(shù)學(xué)、計(jì)算機(jī)科學(xué)、語(yǔ)言學(xué)、認(rèn)知心理學(xué)等基礎(chǔ)知識(shí),同時(shí)它又是一門(mén)應(yīng)用性極強(qiáng)的技術(shù),在很多領(lǐng)域都具備落地性。這種理論加實(shí)際操作能力的要求對(duì)初學(xué)者形成了雙重困難。通俗地闡述基本的、必備的理論知識(shí),克服困難,使讀者能夠快速?gòu)娜莸厣鲜謱?shí)際項(xiàng)目,成為一名初級(jí)自然語(yǔ)言處理工程師,這是本書(shū)的目標(biāo)。 本書(shū)濃縮編者多年的知識(shí)積累和實(shí)務(wù)工作經(jīng)驗(yàn)奉獻(xiàn)于讀者朋友。書(shū)中采用大量的圖示與代碼案例分析,將枯燥復(fù)雜的理論知識(shí)用平實(shí)的語(yǔ)言娓娓道來(lái),讓讀者在熟悉的場(chǎng)景中能夠動(dòng)態(tài)地理解專(zhuān)業(yè)知識(shí)。在具體內(nèi)容安排上,拋開(kāi)深?yuàn)W的理論化條文,除了必備的基礎(chǔ)理論、知識(shí)介紹外,不貪多求全,強(qiáng)調(diào)實(shí)務(wù)操作、快速上手——從如何對(duì)文本數(shù)據(jù)進(jìn)行預(yù)處理、基礎(chǔ)分析到實(shí)用的自然語(yǔ)言處理實(shí)踐任務(wù)如文本摘要生成、聊天系統(tǒng)等,讓讀者循序漸進(jìn)地入門(mén)系統(tǒng)的自然語(yǔ)言處理技術(shù)。隨著本書(shū)的講解,讀者的自然語(yǔ)言處理學(xué)習(xí)之旅一定會(huì)成為一番難忘的快樂(lè)體驗(yàn)。 本書(shū)特色 1內(nèi)容安排實(shí)用實(shí)在、詳略得當(dāng),符合初學(xué)者的認(rèn)知規(guī)律 本書(shū)內(nèi)容涵蓋了從自然語(yǔ)言數(shù)據(jù)處理、基礎(chǔ)任務(wù)(如分詞、詞性標(biāo)注、命名實(shí)體識(shí)別等)到實(shí)戰(zhàn)性任務(wù)(如文本分類(lèi)、文本摘要、聊天系統(tǒng)等)所必須掌握的知識(shí),從內(nèi)容結(jié)構(gòu)上非常注重知識(shí)的實(shí)用性和可操作性。必須掌握的細(xì)節(jié)處不吝筆墨,輔以圖表以及代碼加深讀者印象;對(duì)僅需要大致了解處簡(jiǎn)要介紹一些相關(guān)理論及前沿動(dòng)態(tài)。這樣的安排使得初學(xué)者能夠掌握必備知識(shí),了解并思考學(xué)術(shù)前沿及行業(yè)應(yīng)用,符合初學(xué)者對(duì)自然語(yǔ)言處理知識(shí)的認(rèn)知規(guī)律。 2行文簡(jiǎn)單直白,以實(shí)例引導(dǎo)理論,特別適合初學(xué)者閱讀 本書(shū)行文簡(jiǎn)單直白,全程都有相應(yīng)的實(shí)例作為引導(dǎo),對(duì)于比較難的內(nèi)容盡量以舉例的形式幫助讀者理解。在介紹這些知識(shí)時(shí),并不是教條式的,填鴨式的講解,而是盡量以平實(shí)化的語(yǔ)言講解相關(guān)理論,猶如幫助一位老朋友,一步步地成為初級(jí)自然語(yǔ)言處理工程師。 3設(shè)置思考題以及項(xiàng)目代碼,激發(fā)初學(xué)者的熱情與興趣 本書(shū)的每一章都設(shè)置有相應(yīng)的思考題,并在附錄中提供了相關(guān)參考答案;讀者可以自測(cè)對(duì)章節(jié)內(nèi)容的學(xué)習(xí)的掌握程度。此外,本書(shū)章節(jié)介紹的代碼實(shí)例,相關(guān)的電子版本會(huì)隨書(shū)贈(zèng)予,使讀者能夠進(jìn)行實(shí)踐操作,更加深入地理解知識(shí)。這些實(shí)踐內(nèi)容是學(xué)習(xí)自然語(yǔ)言處理過(guò)程中必不可少的環(huán)節(jié),通過(guò)思考題以及代碼的操作練習(xí),能夠使讀者朋友快速地入門(mén)自然語(yǔ)言處理。 自然語(yǔ)言處理從入門(mén)到實(shí)戰(zhàn) 前言 本書(shū)內(nèi)容及體系結(jié)構(gòu) 第一部分自然語(yǔ)言處理核心技術(shù) 第1章自然語(yǔ)言處理初探 本章主要為讀者朋友介紹,在這短短不到一百年的時(shí)間里,自然語(yǔ)言處理早期的發(fā)展歷程,近些年突飛猛進(jìn)的發(fā)展,以及自然語(yǔ)言處理的基本任務(wù),在各行各業(yè)中的應(yīng)用和基本的工具框架。 第2章自然語(yǔ)言處理與機(jī)器學(xué)習(xí) 本章主要介紹一些常見(jiàn)機(jī)器學(xué)習(xí)模型的原理、對(duì)比分析各類(lèi)機(jī)器學(xué)習(xí)模型的優(yōu)缺點(diǎn)以及機(jī)器學(xué)習(xí)工具庫(kù)的使用。 第3章自然語(yǔ)言處理與神經(jīng)網(wǎng)絡(luò) 本章將為大家揭開(kāi)深度學(xué)習(xí)的神秘面紗,主要介紹神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)以及一些常見(jiàn)的訓(xùn)練過(guò)程中的優(yōu)化方案。 第二部分自然語(yǔ)言處理基本任務(wù) 第4章文本預(yù)處理 本章主要介紹文本預(yù)處理的基礎(chǔ)項(xiàng)目以及相關(guān)工具、關(guān)鍵詞提取的一些常用的方法以及數(shù)據(jù)不平衡的處理方法。 第5章文本的表示技術(shù) 本章將縱向梳理文本表示技術(shù)的發(fā)展脈絡(luò),分析各類(lèi)表示方法的優(yōu)缺點(diǎn)。 第6章序列標(biāo)注 本章將為大家介紹一些常見(jiàn)的序列標(biāo)注場(chǎng)景以及不同場(chǎng)景下的應(yīng)用模型。 第7章關(guān)系抽取 本章主要講解關(guān)系抽取的主要方法、前沿研究以及相關(guān)的應(yīng)用框架。 第三部分自然語(yǔ)言處理高級(jí)任務(wù) 第8章知識(shí)圖譜 本章主要介紹知識(shí)圖譜的相關(guān)概念、技術(shù)、應(yīng)用等。 第9章文本分類(lèi) 本章主要介紹基本的文本分類(lèi)方法以及相關(guān)工具的應(yīng)用。 第10章文本摘要 本章主要介紹自動(dòng)文本摘要中的兩大類(lèi)型,抽取式(extractive)摘要和生成式(abstractive)摘要,并且通過(guò)代碼搭建演示兩個(gè)簡(jiǎn)單版本的抽取式摘要生成器。 第11章機(jī)器翻譯 本章主要介紹機(jī)器翻譯的歷史、相關(guān)技術(shù)原理、現(xiàn)狀與不足等,通過(guò)本章的學(xué)習(xí),讀者將了解機(jī)器翻譯的源起、統(tǒng)計(jì)機(jī)器翻譯的原理、神經(jīng)機(jī)器翻譯的原理以及常見(jiàn)的改進(jìn)版本的神經(jīng)機(jī)器翻譯模型。 第12章聊天系統(tǒng) 本章節(jié)主要介紹聊天系統(tǒng)的基本類(lèi)型及應(yīng)用、關(guān)鍵技術(shù),并且用代碼演示開(kāi)發(fā)一款簡(jiǎn)單的閑聊系統(tǒng)。 第四部分自然語(yǔ)言處理求職 第13章自然語(yǔ)言處理技術(shù)的現(xiàn)在、未來(lái)及擇業(yè) 最后一章為有志于入門(mén)或從事自然語(yǔ)言處理的讀者提供更多的、與自然語(yǔ)言處理相關(guān)的常識(shí)性及實(shí)用性?xún)?nèi)容,比如學(xué)術(shù)界、工業(yè)界等方面的研究現(xiàn)狀、未來(lái)發(fā)展熱點(diǎn)、如何準(zhǔn)備面試等。 本書(shū)讀者對(duì)象 有一定的編程及機(jī)器學(xué)習(xí)基礎(chǔ),想入門(mén)自然語(yǔ)言處理的讀者 因?yàn)榕d趣,想系統(tǒng)性地了解自然語(yǔ)言處理的讀者 準(zhǔn)備求職自然語(yǔ)言處理初級(jí)崗位的讀者
胡盼盼自然語(yǔ)言處理工程師,斯特拉斯堡大學(xué)計(jì)算機(jī)語(yǔ)言學(xué)碩士,曾任法國(guó)科學(xué)院(CNRS,Centre National de la Recherche Scientifique)算法研究員,負(fù)責(zé)過(guò)醫(yī)療知識(shí)圖譜、聊天機(jī)器人、智能律師系統(tǒng)、文本生成系統(tǒng)等企業(yè)級(jí)核心項(xiàng)目。
目錄
第一部分了解自然語(yǔ)言處理 第1章自然語(yǔ)言處理初探 11自然語(yǔ)言處理概述 111自然語(yǔ)言處理早期發(fā)展史 112新世紀(jì)的里程碑事件 12自然語(yǔ)言處理的挑戰(zhàn) 121詞義消歧 122指代消解 123上下文理解 124語(yǔ)義與語(yǔ)用的不對(duì)等 13自然語(yǔ)言處理的應(yīng)用領(lǐng)域 131醫(yī)療 132教育 133媒體 134金融 135法律 14自然語(yǔ)言處理的常見(jiàn)工具 141基礎(chǔ)任務(wù)工具包 142科學(xué)計(jì)算及機(jī)器學(xué)習(xí)框架 143深度學(xué)習(xí)框架 本章小結(jié) 思考題 第二部分自然語(yǔ)言處理核心技術(shù) 第2章自然語(yǔ)言處理與機(jī)器學(xué)習(xí) 21邏輯回歸 211邏輯回歸基本原理 212邏輯回歸在實(shí)踐中的注意要點(diǎn) 213邏輯回歸的優(yōu)勢(shì)與不足 22樸素貝葉斯 221樸素貝葉斯基本原理 222樸素貝葉斯的類(lèi)型 223樸素貝葉斯的優(yōu)勢(shì)與不足 23Kmeans算法 231Kmeans算法基本原理 232Kmeans算法實(shí)踐 233Kmeans算法的優(yōu)勢(shì)與不足 24決策樹(shù) 241決策樹(shù)的屬性劃分 242隨機(jī)森林的基本原理 243隨機(jī)森林在應(yīng)用中的注意細(xì)節(jié) 25主成分分析 251梯度上升法解PCA 252協(xié)方差矩陣解PCA 253實(shí)戰(zhàn)PCA 本章小結(jié) 思考題 第3章自然語(yǔ)言處理與神經(jīng)網(wǎng)絡(luò) 31神經(jīng)網(wǎng)絡(luò)初探 311神經(jīng)元結(jié)構(gòu) 312常見(jiàn)的激活函數(shù) 313誤差反向傳播算法 32常見(jiàn)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 321多層感知機(jī) 322循環(huán)神經(jīng)網(wǎng)絡(luò)的基本原理 323卷積神經(jīng)網(wǎng)絡(luò)的基本原理 324神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)與不足 33神經(jīng)網(wǎng)絡(luò)算法的改進(jìn)與提升 331防止過(guò)擬合的方法 332訓(xùn)練速度與精度的提高方法 333注意力機(jī)制 本章小結(jié) 思考題 第三部分自然語(yǔ)言處理基本任務(wù) 第4章文本預(yù)處理 41文本預(yù)處理的基礎(chǔ)項(xiàng)目 411文本規(guī)范化 412語(yǔ)義分析 413分詞 414文本糾錯(cuò) 42關(guān)鍵詞提取 421基于特征統(tǒng)計(jì) 422基于主題模型 423基于圖模型 43數(shù)據(jù)不平衡的處理 431常見(jiàn)方法 432數(shù)據(jù)不平衡問(wèn)題實(shí)戰(zhàn) 本章小結(jié) 思考題 第5章文本的表示技術(shù) 51詞袋模型 511基于頻次的詞袋模型 512基于TFIDF的詞袋模型 513相關(guān)工具的使用 52Word2Vec詞向量 521Word2Vec的基本原理 522Word2Vec模型細(xì)節(jié)及代碼演示 523應(yīng)用工具訓(xùn)練Word2Vec 53改進(jìn)后的詞表征 531GloVe模型 532FastText模型 533ELMo模型 54句向量 541基于詞向量的平均 542沿用Word2Vec思想 543有監(jiān)督方式 本章小結(jié) 思考題 第6章序列標(biāo)注 61序列標(biāo)注基礎(chǔ) 611序列標(biāo)注的應(yīng)用場(chǎng)景 612基線(xiàn)方式 613序列標(biāo)注任務(wù)的難點(diǎn) 62基于概率圖的模型 621隱馬爾科夫模型(HMM) 622最大熵馬爾科夫模型(MEMM) 623條件隨機(jī)場(chǎng)模型(CRF) 624天氣預(yù)測(cè)實(shí)例 63基于深度學(xué)習(xí)的方式 631數(shù)據(jù)表征形式 632序列處理模型 本章小結(jié) 思考題 第7章關(guān)系抽取 71關(guān)系抽取基礎(chǔ) 711關(guān)系抽取概述 712關(guān)系抽取的主要方法 713深度學(xué)習(xí)與關(guān)系抽取 714強(qiáng)化學(xué)習(xí)與關(guān)系抽取 72基于半監(jiān)督的關(guān)系抽取模式:Snowball系統(tǒng) 721Patterns及Tuples的生成 722Patterns及Tuples的評(píng)估 723Snowball的實(shí)現(xiàn)細(xì)節(jié) 73關(guān)系抽取工具——DeepDive 731DeepDive概述 732DeepDive工作流程 733概率推斷與因子圖 本章小結(jié) 思考題 第四部分自然語(yǔ)言處理高級(jí)任務(wù) 第8章知識(shí)圖譜 81知識(shí)圖譜基本概念 811從語(yǔ)義網(wǎng)絡(luò)到知識(shí)圖譜 812知識(shí)的結(jié)構(gòu)化、存儲(chǔ)及查詢(xún) 813幾個(gè)開(kāi)源的知識(shí)圖譜 82知識(shí)圖譜的關(guān)鍵構(gòu)建技術(shù) 821本體匹配 822實(shí)體鏈接 823知識(shí)推理 83知識(shí)圖譜應(yīng)用 831反欺詐 832個(gè)性化推薦 833知識(shí)庫(kù)問(wèn)答 本章小結(jié) 思考題 第9章文本分類(lèi) 91文本分類(lèi)的常見(jiàn)方法 911機(jī)器學(xué)習(xí) 912模型融合 913深度學(xué)習(xí) 92文本分類(lèi)的不同應(yīng)用場(chǎng)景 921二分類(lèi) 922多分類(lèi) 923多標(biāo)簽多分類(lèi) 93案例:搭建一款新聞主題分類(lèi)器 931數(shù)據(jù)預(yù)處理 932訓(xùn)練與預(yù)測(cè) 933改進(jìn) 本章小結(jié) 思考題 第10章文本摘要 101抽取式摘要 1011傳統(tǒng)方法 1012基于深度學(xué)習(xí)的方法 1013抽取式摘要的訓(xùn)練數(shù)據(jù)問(wèn)題 102生成式摘要 1021基礎(chǔ)模型 1022前沿模型中的技巧 1023強(qiáng)化學(xué)習(xí)與生成式摘要 103案例:搭建網(wǎng)球新聞?wù)善? 1031基于詞頻統(tǒng)計(jì)的摘要生成器 1032基于圖模型的摘要生成器 1033結(jié)果分析 本章小結(jié) 思考題 第11章機(jī)器翻譯 111傳統(tǒng)機(jī)器翻譯 1111源起 1112基于規(guī)則 1113基于大規(guī)模語(yǔ)料 112統(tǒng)計(jì)機(jī)器翻譯 1121相關(guān)流派 1122基于信源信道的統(tǒng)計(jì)機(jī)器翻譯 1123案例:外星語(yǔ)的翻譯實(shí)戰(zhàn) 113神經(jīng)機(jī)器翻譯 1131基本原理 1132改進(jìn)機(jī)制 1133前沿與挑戰(zhàn) 本章小結(jié) 思考題 第12章聊天系統(tǒng) 121聊天系統(tǒng)的類(lèi)型 1211閑聊式機(jī)器人 1212知識(shí)問(wèn)答型機(jī)器人 1213任務(wù)型聊天機(jī)器人 122聊天系統(tǒng)的關(guān)鍵技術(shù) 1221檢索技術(shù) 1222意圖識(shí)別和詞槽填充 1223對(duì)話(huà)管理 1224強(qiáng)化學(xué)習(xí)與多輪對(duì)話(huà) 123案例:閑聊機(jī)器人實(shí)戰(zhàn) 1231技術(shù)概要 1232基本配置及數(shù)據(jù)預(yù)處理 1233閑聊機(jī)器人模型的搭建 1234模型訓(xùn)練、預(yù)測(cè)以及優(yōu)化 本章小結(jié) 思考題 第五部分自然語(yǔ)言處理求職 第13章自然語(yǔ)言處理技術(shù)的現(xiàn)在、未來(lái)及擇業(yè) 131自然語(yǔ)言處理組織及人才需求介紹 1311學(xué)術(shù)界 1312工業(yè)界 1313人才需求現(xiàn)狀 132未來(lái)與自然語(yǔ)言處理 1321自然語(yǔ)言處理熱點(diǎn)技術(shù)方向 1322自然語(yǔ)言處理的應(yīng)用暢想 1323自然語(yǔ)言處理帶來(lái)的行業(yè)沖擊 133面試題 1331數(shù)據(jù)結(jié)構(gòu)與算法 1332數(shù)學(xué)基礎(chǔ) 1333機(jī)器學(xué)習(xí)與深度學(xué)習(xí) 1334自然語(yǔ)言處理專(zhuān)業(yè) 1335實(shí)際問(wèn)題解決及技術(shù)領(lǐng)域見(jiàn)解 本章小結(jié) 思考題 附錄A思考題參考答案 附錄B面試題答案目錄 第一部分了解自然語(yǔ)言處理 第1章自然語(yǔ)言處理初探 11自然語(yǔ)言處理概述 111自然語(yǔ)言處理早期發(fā)展史 112新世紀(jì)的里程碑事件 12自然語(yǔ)言處理的挑戰(zhàn) 121詞義消歧 122指代消解 123上下文理解 124語(yǔ)義與語(yǔ)用的不對(duì)等 13自然語(yǔ)言處理的應(yīng)用領(lǐng)域 131醫(yī)療 132教育 133媒體 134金融 135法律 14自然語(yǔ)言處理的常見(jiàn)工具 141基礎(chǔ)任務(wù)工具包 142科學(xué)計(jì)算及機(jī)器學(xué)習(xí)框架 143深度學(xué)習(xí)框架 本章小結(jié) 思考題 第二部分自然語(yǔ)言處理核心技術(shù) 第2章自然語(yǔ)言處理與機(jī)器學(xué)習(xí) 21邏輯回歸 211邏輯回歸基本原理 212邏輯回歸在實(shí)踐中的注意要點(diǎn) 213邏輯回歸的優(yōu)勢(shì)與不足 22樸素貝葉斯 221樸素貝葉斯基本原理 222樸素貝葉斯的類(lèi)型 223樸素貝葉斯的優(yōu)勢(shì)與不足 23Kmeans算法 231Kmeans算法基本原理 232Kmeans算法實(shí)踐 233Kmeans算法的優(yōu)勢(shì)與不足 24決策樹(shù) 241決策樹(shù)的屬性劃分 242隨機(jī)森林的基本原理 243隨機(jī)森林在應(yīng)用中的注意細(xì)節(jié) 25主成分分析 251梯度上升法解PCA 252協(xié)方差矩陣解PCA 253實(shí)戰(zhàn)PCA 本章小結(jié) 思考題 第3章自然語(yǔ)言處理與神經(jīng)網(wǎng)絡(luò) 31神經(jīng)網(wǎng)絡(luò)初探 311神經(jīng)元結(jié)構(gòu) 312常見(jiàn)的激活函數(shù) 313誤差反向傳播算法 32常見(jiàn)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 321多層感知機(jī) 322循環(huán)神經(jīng)網(wǎng)絡(luò)的基本原理 323卷積神經(jīng)網(wǎng)絡(luò)的基本原理 324神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)與不足 33神經(jīng)網(wǎng)絡(luò)算法的改進(jìn)與提升 331防止過(guò)擬合的方法 332訓(xùn)練速度與精度的提高方法 333注意力機(jī)制 本章小結(jié) 思考題 第三部分自然語(yǔ)言處理基本任務(wù) 第4章文本預(yù)處理 41文本預(yù)處理的基礎(chǔ)項(xiàng)目 411文本規(guī)范化 412語(yǔ)義分析 413分詞 414文本糾錯(cuò) 42關(guān)鍵詞提取 421基于特征統(tǒng)計(jì) 422基于主題模型 423基于圖模型 43數(shù)據(jù)不平衡的處理 431常見(jiàn)方法 432數(shù)據(jù)不平衡問(wèn)題實(shí)戰(zhàn) 本章小結(jié) 思考題 第5章文本的表示技術(shù) 51詞袋模型 511基于頻次的詞袋模型 512基于TFIDF的詞袋模型 513相關(guān)工具的使用 52Word2Vec詞向量 521Word2Vec的基本原理 522Word2Vec模型細(xì)節(jié)及代碼演示 523應(yīng)用工具訓(xùn)練Word2Vec 53改進(jìn)后的詞表征 531GloVe模型 532FastText模型 533ELMo模型 54句向量 541基于詞向量的平均 542沿用Word2Vec思想 543有監(jiān)督方式 本章小結(jié) 思考題 第6章序列標(biāo)注 61序列標(biāo)注基礎(chǔ) 611序列標(biāo)注的應(yīng)用場(chǎng)景 612基線(xiàn)方式 613序列標(biāo)注任務(wù)的難點(diǎn) 62基于概率圖的模型 621隱馬爾科夫模型(HMM) 622最大熵馬爾科夫模型(MEMM) 623條件隨機(jī)場(chǎng)模型(CRF) 624天氣預(yù)測(cè)實(shí)例 63基于深度學(xué)習(xí)的方式 631數(shù)據(jù)表征形式 632序列處理模型 本章小結(jié) 思考題 第7章關(guān)系抽取 71關(guān)系抽取基礎(chǔ) 711關(guān)系抽取概述 712關(guān)系抽取的主要方法 713深度學(xué)習(xí)與關(guān)系抽取 714強(qiáng)化學(xué)習(xí)與關(guān)系抽取 72基于半監(jiān)督的關(guān)系抽取模式:Snowball系統(tǒng) 721Patterns及Tuples的生成 722Patterns及Tuples的評(píng)估 723Snowball的實(shí)現(xiàn)細(xì)節(jié) 73關(guān)系抽取工具——DeepDive 731DeepDive概述 732DeepDive工作流程 733概率推斷與因子圖 本章小結(jié) 思考題 第四部分自然語(yǔ)言處理高級(jí)任務(wù) 第8章知識(shí)圖譜 81知識(shí)圖譜基本概念 811從語(yǔ)義網(wǎng)絡(luò)到知識(shí)圖譜 812知識(shí)的結(jié)構(gòu)化、存儲(chǔ)及查詢(xún) 813幾個(gè)開(kāi)源的知識(shí)圖譜 82知識(shí)圖譜的關(guān)鍵構(gòu)建技術(shù) 821本體匹配 822實(shí)體鏈接 823知識(shí)推理 83知識(shí)圖譜應(yīng)用 831反欺詐 832個(gè)性化推薦 833知識(shí)庫(kù)問(wèn)答 本章小結(jié) 思考題 第9章文本分類(lèi) 91文本分類(lèi)的常見(jiàn)方法 911機(jī)器學(xué)習(xí) 912模型融合 913深度學(xué)習(xí) 92文本分類(lèi)的不同應(yīng)用場(chǎng)景 921二分類(lèi) 922多分類(lèi) 923多標(biāo)簽多分類(lèi) 93案例:搭建一款新聞主題分類(lèi)器 931數(shù)據(jù)預(yù)處理 932訓(xùn)練與預(yù)測(cè) 933改進(jìn) 本章小結(jié) 思考題 第10章文本摘要 101抽取式摘要 1011傳統(tǒng)方法 1012基于深度學(xué)習(xí)的方法 1013抽取式摘要的訓(xùn)練數(shù)據(jù)問(wèn)題 102生成式摘要 1021基礎(chǔ)模型 1022前沿模型中的技巧 1023強(qiáng)化學(xué)習(xí)與生成式摘要 103案例:搭建網(wǎng)球新聞?wù)善? 1031基于詞頻統(tǒng)計(jì)的摘要生成器 1032基于圖模型的摘要生成器 1033結(jié)果分析 本章小結(jié) 思考題 第11章機(jī)器翻譯 111傳統(tǒng)機(jī)器翻譯 1111源起 1112基于規(guī)則 1113基于大規(guī)模語(yǔ)料 112統(tǒng)計(jì)機(jī)器翻譯 1121相關(guān)流派 1122基于信源信道的統(tǒng)計(jì)機(jī)器翻譯 1123案例:外星語(yǔ)的翻譯實(shí)戰(zhàn) 113神經(jīng)機(jī)器翻譯 1131基本原理 1132改進(jìn)機(jī)制 1133前沿與挑戰(zhàn) 本章小結(jié) 思考題 第12章聊天系統(tǒng) 121聊天系統(tǒng)的類(lèi)型 1211閑聊式機(jī)器人 1212知識(shí)問(wèn)答型機(jī)器人 1213任務(wù)型聊天機(jī)器人 122聊天系統(tǒng)的關(guān)鍵技術(shù) 1221檢索技術(shù) 1222意圖識(shí)別和詞槽填充 1223對(duì)話(huà)管理 1224強(qiáng)化學(xué)習(xí)與多輪對(duì)話(huà) 123案例:閑聊機(jī)器人實(shí)戰(zhàn) 1231技術(shù)概要 1232基本配置及數(shù)據(jù)預(yù)處理 1233閑聊機(jī)器人模型的搭建 1234模型訓(xùn)練、預(yù)測(cè)以及優(yōu)化 本章小結(jié) 思考題 第五部分自然語(yǔ)言處理求職 第13章自然語(yǔ)言處理技術(shù)的現(xiàn)在、未來(lái)及擇業(yè) 131自然語(yǔ)言處理組織及人才需求介紹 1311學(xué)術(shù)界 1312工業(yè)界 1313人才需求現(xiàn)狀 132未來(lái)與自然語(yǔ)言處理 1321自然語(yǔ)言處理熱點(diǎn)技術(shù)方向 1322自然語(yǔ)言處理的應(yīng)用暢想 1323自然語(yǔ)言處理帶來(lái)的行業(yè)沖擊 133面試題 1331數(shù)據(jù)結(jié)構(gòu)與算法 1332數(shù)學(xué)基礎(chǔ) 1333機(jī)器學(xué)習(xí)與深度學(xué)習(xí) 1334自然語(yǔ)言處理專(zhuān)業(yè) 1335實(shí)際問(wèn)題解決及技術(shù)領(lǐng)域見(jiàn)解 本章小結(jié) 思考題 附錄A思考題參考答案 附錄B面試題答案
你還可能感興趣
我要評(píng)論
|