定 價(jià):99 元
叢書(shū)名:智能科學(xué)與技術(shù)叢書(shū)
- 作者:[英]伯納黛特·夏普(Bernadette Sharp) [法]弗洛倫斯·賽德
- 出版時(shí)間:2019/8/1
- ISBN:9787111631996
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類(lèi):TP391
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:
- 開(kāi)本:16開(kāi)
【網(wǎng)店勿用!此為申報(bào)選題所填信息,網(wǎng)店請(qǐng)調(diào)用*終版】
自然語(yǔ)言處理跨越了許多不同的學(xué)科,有時(shí)很難理解它們各自帶來(lái)的貢獻(xiàn)和挑戰(zhàn)。本書(shū)探討了自然語(yǔ)言處理與認(rèn)知科學(xué)之間的關(guān)系,每章都由相關(guān)領(lǐng)域的專(zhuān)家撰寫(xiě),內(nèi)容涵蓋語(yǔ)言理解、語(yǔ)言生成、詞聯(lián)想、詞義消除歧義、詞可預(yù)測(cè)性、文本生成和作者身份識(shí)別。本書(shū)適合對(duì)自然語(yǔ)言處理及其跨學(xué)科特性感興趣的學(xué)生和研究人員。
本書(shū)是一本論文專(zhuān)輯,致力于探索自然語(yǔ)言處理和認(rèn)知科學(xué)之間的關(guān)系,以及計(jì)算機(jī)科學(xué)對(duì)于這兩個(gè)領(lǐng)域的貢獻(xiàn)。根據(jù)Poibeau和Vasishth[POI 16]所述,對(duì)認(rèn)知問(wèn)題的研究興趣可能較少受到關(guān)注。因?yàn)樵谡J(rèn)知科學(xué)領(lǐng)域,研究者往往無(wú)力應(yīng)對(duì)自然語(yǔ)言處理技術(shù)的復(fù)雜性;同樣,自然語(yǔ)言處理的研究者也沒(méi)有認(rèn)識(shí)到認(rèn)知科學(xué)對(duì)于他們工作的貢獻(xiàn)。我們相信,2004年啟動(dòng)的自然語(yǔ)言處理和認(rèn)知科學(xué)國(guó)際研討會(huì)(NLPCS)提供了一個(gè)強(qiáng)大的平臺(tái),支持新的研究課題的多樣性,并且能幫助研究者建立共識(shí)。與此同時(shí),這個(gè)平臺(tái)還認(rèn)可跨學(xué)科方法的重要性,并將計(jì)算機(jī)科學(xué)家、認(rèn)知學(xué)和語(yǔ)言學(xué)的研究者聚集到一起來(lái)推動(dòng)自然語(yǔ)言處理研究。
本書(shū)包含10章,都是由自然語(yǔ)言處理和認(rèn)知科學(xué)國(guó)際研討會(huì)的研究者完成的。
在第1章,Philippe Blache闡述了理解語(yǔ)言的過(guò)程在理論上是非常復(fù)雜的,該過(guò)程必須實(shí)時(shí)進(jìn)行,且需要許多不同來(lái)源的信息。他認(rèn)為對(duì)于一個(gè)語(yǔ)言輸入的整體解釋?xiě)?yīng)該建立在基于塊的基本單元的分組之上,而這些單元構(gòu)成了“盡可能解釋”原則的支柱,該原則負(fù)責(zé)推遲理解過(guò)程,直到有足夠的信息可用。
接下來(lái)的兩章討論人類(lèi)關(guān)聯(lián)問(wèn)題。在第2章,Korzycki、Gatkowska和Lubaszewski討論了一個(gè)有900個(gè)學(xué)生參與的自由詞關(guān)聯(lián)測(cè)試。他們利用三個(gè)算法從文本中提取出關(guān)聯(lián)列表,然后將提取的關(guān)聯(lián)列表與人類(lèi)關(guān)聯(lián)列表做對(duì)比。這三個(gè)算法分別是Church-Hanks算法、潛在語(yǔ)義分析(LSA)和潛在狄利克雷分配(LDA)。
在第3章,Lubaszewski、Gatkowska和Godny描述了一個(gè)過(guò)程,用于在實(shí)驗(yàn)中建立的人類(lèi)關(guān)聯(lián)網(wǎng)絡(luò)中的單詞關(guān)聯(lián)。他們認(rèn)為每個(gè)關(guān)聯(lián)都是基于兩個(gè)釋義之間的語(yǔ)義關(guān)系,而這種釋義之間的關(guān)聯(lián)有自己的方向,并且獨(dú)立于其他關(guān)聯(lián)的方向。此過(guò)程使用圖結(jié)構(gòu)來(lái)生成語(yǔ)義一致的子圖。
在第4章,Rapp探索了人類(lèi)語(yǔ)言生成是否是由關(guān)聯(lián)控制的,以及話(huà)語(yǔ)的下一個(gè)實(shí)詞是否可被視為該實(shí)詞表示的一種關(guān)聯(lián),而這種關(guān)聯(lián)已經(jīng)在說(shuō)話(huà)人的記憶中被激活。他還介紹了反向關(guān)聯(lián)任務(wù)的概念,討論了激勵(lì)詞是否可以通過(guò)響應(yīng)詞來(lái)預(yù)測(cè)。他根據(jù)反向關(guān)聯(lián)任務(wù)搜集了人類(lèi)數(shù)據(jù),并將其與機(jī)器生成的結(jié)果進(jìn)行了比較。
在第5章中,Vincent-Lamarre和他的同事研究了在字典中定義所有其余單詞所需的單詞及其數(shù)量。為此,他們?cè)谠~典組件Wordsmyth上使用了圖論分析。其研究結(jié)果對(duì)于理解符號(hào)基礎(chǔ),以及詞義的學(xué)習(xí)和心理表征具有重要意義。他們得出的結(jié)論是,語(yǔ)言使用者只有掌握用于理解詞的定義的詞匯表中的單詞,才能夠從語(yǔ)言(口頭)定義中學(xué)習(xí)和理解單詞的含義。
第6章側(cè)重于詞義消歧。Tripodi和Pelillo根據(jù)進(jìn)化博弈論方法來(lái)研究詞義消歧。要消除歧義的每個(gè)單詞都表示為玩家,每個(gè)意義都表示為策略。該算法已經(jīng)在具有不同數(shù)量標(biāo)記詞的四個(gè)數(shù)據(jù)集上進(jìn)行了測(cè)試。它利用關(guān)系和上下文信息來(lái)推斷目標(biāo)詞的含義。實(shí)驗(yàn)結(jié)果表明,該方法的性能優(yōu)于傳統(tǒng)方法,并且只需要少量標(biāo)記點(diǎn)就能勝過(guò)有監(jiān)督系統(tǒng)。
在第7章中,Zock和Tesfaye專(zhuān)注于以四個(gè)任務(wù)表達(dá)的文本生成的挑戰(zhàn)性任務(wù):構(gòu)思、文本結(jié)構(gòu)、表達(dá)和修訂。他們專(zhuān)注于文本結(jié)構(gòu),涉及消息的分組(分塊)、排序和鏈接。其目的是研究文本生成的哪些部分可以自動(dòng)化,以及計(jì)算機(jī)是否可以基于用戶(hù)提供的一組輸入構(gòu)建一個(gè)或多個(gè)主題樹(shù)。
著述屬性是第8章研究的重點(diǎn)。Boukhaled和Ganascia分析了使用虛詞的序貫規(guī)則和詞性(POS)標(biāo)簽作為文本標(biāo)記的有效性。該有效性不依賴(lài)于詞袋假設(shè)或原始頻率。他們的研究表明,虛詞和詞性n元組(n-gram)的頻率優(yōu)于序貫規(guī)則。
第9章討論了基頻檢測(cè)(F0),它在人類(lèi)語(yǔ)音感知中起著重要作用。Glavitsch探索了使用人類(lèi)認(rèn)知原理進(jìn)行的F0估計(jì)是否能夠表現(xiàn)得與最新的F0檢測(cè)算法一樣好或更好。他所提出的運(yùn)行在時(shí)域的算法錯(cuò)誤率較小,并且在使用有限的存儲(chǔ)和計(jì)算資源的情況下,其表現(xiàn)超過(guò)了傳統(tǒng)的最高水平的基于關(guān)聯(lián)的RAPT方法。在神經(jīng)認(rèn)知心理學(xué)中,手動(dòng)收集的完形填充概率(CCP)用于量化眼球運(yùn)動(dòng)控制模型中句內(nèi)上下文單詞的可預(yù)測(cè)性。由于CCP數(shù)據(jù)都是基于上百個(gè)參與者的采樣,在所有新的激勵(lì)上泛化該模型是很難的。
在第10章中,Hofmann、Biemann和Remus提出應(yīng)用語(yǔ)言模型,這些模型可以通過(guò)在線(xiàn)數(shù)據(jù)庫(kù)中公開(kāi)可用數(shù)據(jù)集的item級(jí)別的性能進(jìn)行基準(zhǔn)測(cè)試。先前在腦電圖(EEG)和眼球運(yùn)動(dòng)(EM)數(shù)據(jù)中從句內(nèi)上下文中預(yù)測(cè)單詞的神經(jīng)認(rèn)知方法依賴(lài)于CCP數(shù)據(jù)。他們的研究表明,當(dāng)直接計(jì)算CCP、EEG和EM數(shù)據(jù)時(shí),n元語(yǔ)言模型和遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的句法和短程語(yǔ)義過(guò)程差不多同樣好。這可以幫助將神經(jīng)認(rèn)知模型推廣到所有可能的新穎單詞組合。
參考文獻(xiàn)
---作者簡(jiǎn)介---
伯納黛特•夏普(Bernadette Sharp) 英國(guó)斯塔福德郡大學(xué)應(yīng)用人工智能系教授。她的研究興趣包括人工智能、自然語(yǔ)言處理和文本挖掘。自從2004年以來(lái),她一直擔(dān)任NLPCS的主席和審稿人。
弗洛倫斯•賽德斯(Florence Sèdes) 法國(guó)圖盧茲第三大學(xué)計(jì)算機(jī)科學(xué)系教授。她的研究領(lǐng)域包括信息系統(tǒng)、數(shù)據(jù)管理以及多媒體、元數(shù)據(jù)等方面的應(yīng)用。
維斯拉夫•盧巴澤斯基(Wiesław Lubaszewski) 波蘭雅蓋沃大學(xué)計(jì)算語(yǔ)言學(xué)系教授,克拉科夫AGH科技大學(xué)計(jì)算機(jī)科學(xué)系教授。他的研究興趣包括自然語(yǔ)言詞典、文本理解、知識(shí)表示和信息抽取等。
---譯者簡(jiǎn)介---
徐金安 北京交通大學(xué)計(jì)算機(jī)學(xué)院教授、博士生導(dǎo)師,研究方向?yàn)闄C(jī)器翻譯、自然語(yǔ)言處理、人機(jī)交互和文本情感分析等。博士畢業(yè)于北海道大學(xué),曾任日本電氣株式會(huì)社中央研究院研究員。
譯者序
前言
作者名單
第1章延遲解釋、淺層處理和構(gòu)式:“盡可能解釋”原則的基礎(chǔ) 1
1.1引言 1
1.2延遲處理 2
1.3工作記憶 5
1.4如何識(shí)別語(yǔ)塊:分詞操作 7
1.5延遲架構(gòu) 10
1.5.1分段和存儲(chǔ) 11
1.5.2內(nèi)聚聚集 12
1.6結(jié)論 15
1.7參考文獻(xiàn) 16
第2章人類(lèi)關(guān)聯(lián)規(guī)范能否評(píng)估機(jī)器制造的關(guān)聯(lián)列表 19
2.1引言 19
2.2人類(lèi)語(yǔ)義關(guān)聯(lián) 20
2.2.1單詞關(guān)聯(lián)測(cè)試 20
2.2.2作者的實(shí)驗(yàn) 21
2.2.3人類(lèi)關(guān)聯(lián)拓?fù)? 22
2.2.4人類(lèi)關(guān)聯(lián)具有可比性 24
2.3算法效率比較 26
2.3.1語(yǔ)料庫(kù) 26
2.3.2LSA源關(guān)聯(lián)列表 27
2.3.3LDA源列表 28
2.3.4基于關(guān)聯(lián)比率的列表 28
2.3.5列表比較 29
2.4結(jié)論 33
2.5參考文獻(xiàn) 34
第3章文本詞如何在人類(lèi)關(guān)聯(lián)網(wǎng)絡(luò)中選擇相關(guān)詞 37
3.1引言 37
3.2網(wǎng)絡(luò) 40
3.3基于文本的激勵(lì)驅(qū)動(dòng)的網(wǎng)絡(luò)提取 42
3.3.1子圖提取算法 42
3.3.2控制流程 43
3.3.3最短路徑提取 44
3.3.4基于語(yǔ)料庫(kù)的子圖 46
3.4網(wǎng)絡(luò)提取流程的測(cè)試 46
3.4.1進(jìn)行測(cè)試的語(yǔ)料庫(kù) 46
3.4.2提取子圖的評(píng)估 46
3.4.3有向和無(wú)向子圖提。簩(duì)比 48
3.4.4每個(gè)激勵(lì)產(chǎn)生的結(jié)果 49
3.5對(duì)結(jié)果和相關(guān)工作的簡(jiǎn)要討論 54
3.6參考文獻(xiàn) 57
第4章反向關(guān)聯(lián)任務(wù) 59
4.1引言 59
4.2計(jì)算前向關(guān)聯(lián) 63
4.2.1步驟 63
4.2.2結(jié)果和評(píng)估 65
4.3計(jì)算反向關(guān)聯(lián) 67
4.3.1問(wèn)題 67
4.3.2步驟 67
4.3.3結(jié)果和評(píng)估 71
4.4人類(lèi)的表現(xiàn) 73
4.4.1數(shù)據(jù)集 73
4.4.2測(cè)試流程 75
4.4.3評(píng)估 76
4.5機(jī)器性能 77
4.6討論、結(jié)果和展望 78
4.6.1人類(lèi)的反向關(guān)聯(lián) 78
4.6.2機(jī)器的反向關(guān)聯(lián) 80
4.7致謝 82
4.8參考文獻(xiàn) 82
第5章詞匯的隱藏結(jié)構(gòu)與功能 85
5.1引言 86
5.2方法 86
5.2.1詞典圖 86
5.2.2心理語(yǔ)言學(xué)變量 90
5.2.3數(shù)據(jù)分析 91
5.3內(nèi)核、衛(wèi)星、核心、MinSet以及詞典余下部分的心理語(yǔ)言學(xué)屬性 93
5.4討論 96
5.5未來(lái)工作 99
5.6參考文獻(xiàn) 101
第6章用于詞義消歧的直推式學(xué)習(xí)博弈 103
6.1引言 103
6.2基于圖的詞義消歧 104
6.3半監(jiān)督學(xué)習(xí)方法 107
6.3.1基于圖的半監(jiān)督學(xué)習(xí) 107
6.3.2博弈論和博弈動(dòng)態(tài) 108
6.4詞義消歧博弈 110
6.4.1圖構(gòu)造 110
6.4.2策略空間 111
6.4.3收益矩陣 111
6.4.4系統(tǒng)動(dòng)力學(xué) 112
6.5評(píng)估 113
6.5.1實(shí)驗(yàn)設(shè)置 113
6.5.2評(píng)估結(jié)果 114
6.5.3對(duì)比先進(jìn)水平算法 116
6.6結(jié)論 117
6.7參考文獻(xiàn) 117
第7章用心學(xué)寫(xiě):生成連貫文本的問(wèn)題 121
7.1問(wèn)題 121
7.2次優(yōu)文本及其相關(guān)原因 123
7.2.1缺乏連貫性或凝聚力 124
7.2.2錯(cuò)誤引用 125
7.2.3無(wú)動(dòng)機(jī)的主題轉(zhuǎn)移 126
7.3如何解決任務(wù)的復(fù)雜性 127
7.4相關(guān)研究 128
7.5關(guān)于構(gòu)建輔助寫(xiě)作過(guò)程的工具的假設(shè) 130
7.6方法論 133
7.6.1句法結(jié)構(gòu)的識(shí)別 135
7.6.2語(yǔ)義種子詞的識(shí)別 135
7.6.3單詞對(duì)齊 137
7.6.4確定對(duì)齊單詞的相似性值 137
7.6.5確定句子之間的相似性 141
7.6.6基于句子相似性值的聚類(lèi) 142
7.7實(shí)驗(yàn)結(jié)果和評(píng)估 142
7.8展望和總結(jié) 145
7.9參考文獻(xiàn) 146
第8章面向著述屬性的基于序貫規(guī)則挖掘的文體特征 149
8.1引言和研究動(dòng)機(jī) 149
8.2著述屬性過(guò)程 151
8.3著述屬性的文體特征 152
8.4針對(duì)文體分析的時(shí)序數(shù)據(jù)挖掘 154
8.5實(shí)驗(yàn)設(shè)置 155
8.5.1數(shù)據(jù)集 156
8.5.2分類(lèi)方案 157
8.6結(jié)果和討論 158
8.7結(jié)論 162
8.8參考文獻(xiàn) 162
第9章一種并行的、面向認(rèn)知的基頻估計(jì)算法 165
9.1引言 165
9.2語(yǔ)音信號(hào)分割 167
9.2.1語(yǔ)音和停頓段 168
9.2.2濁音和清音區(qū) 169
9.2.3穩(wěn)定和不穩(wěn)定區(qū)間 170
9.3穩(wěn)定區(qū)間的F0估計(jì) 171
9.4F0傳播 173
9.4.1控制流 174
9.4.2峰值傳播 175
9.5不穩(wěn)定的濁音區(qū)域 178
9.6并行化 178
9.7實(shí)驗(yàn)和結(jié)果 179
9.8結(jié)論 180
9.9致謝 181
9.10參考文獻(xiàn) 182
第10章基于完形填充、腦電圖和眼球運(yùn)動(dòng)數(shù)據(jù)對(duì)n元語(yǔ)言模型、主題模型和循環(huán)神經(jīng)網(wǎng)絡(luò)的基準(zhǔn)測(cè)試 185
10.1引言 186
10.2相關(guān)工作 187
10.3方法 188
10.3.1人類(lèi)績(jī)效評(píng)估 188
10.3.2語(yǔ)言模型的三種風(fēng)格 189
10.4實(shí)驗(yàn)設(shè)置 192
10.5結(jié)果 193
10.5.1可預(yù)測(cè)性結(jié)果 193
10.5.2N400振幅結(jié)果 196
10.5.3單一注視時(shí)延結(jié)果 198
10.6討論和結(jié)論 200
10.7致謝 202
10.8參考文獻(xiàn) 202
術(shù)語(yǔ)表 207