本書(shū)介紹如何在PyTorch框架中使用BERT模型完成自然語(yǔ)言處理(NLP)任務(wù)。
BERT模型是當(dāng)今處理自然語(yǔ)言任務(wù)效果好的模型。掌握了該模型,就相當(dāng)于掌握了當(dāng)今主流的NLP技術(shù)。
本書(shū)共3篇。
-第1篇介紹了神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)知識(shí)、NLP的基礎(chǔ)知識(shí),以及編程環(huán)境的搭建;
-第2篇介紹了PyTorch編程基礎(chǔ),以及BERT模型的原理、應(yīng)用和可解釋性;
-第3篇是BERT模型實(shí)戰(zhàn),幫助讀者開(kāi)闊思路、增長(zhǎng)見(jiàn)識(shí),使讀者能夠真正駕馭BERT模型,活學(xué)活用,完成自然語(yǔ)言處理任務(wù)。
通過(guò)本書(shū),讀者可以熟練地在PyTorch框架中開(kāi)發(fā)并訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,快速地使用BERT模型完成各種主流的自然語(yǔ)言處理任務(wù),獨(dú)立地設(shè)計(jì)并訓(xùn)練出針對(duì)特定需求的BERT模型,輕松地將BERT模型封裝成Web服務(wù)部署到云端。
本書(shū)結(jié)構(gòu)清晰、案例豐富、通俗易懂、實(shí)用性強(qiáng),適合對(duì)自然語(yǔ)言處理、BERT模型感興趣的讀者作為自學(xué)教程。另外,本書(shū)也適合社會(huì)培訓(xùn)學(xué)校作為培訓(xùn)教材,還適合計(jì)算機(jī)相關(guān)專業(yè)作為教學(xué)參考書(shū)。
BERT模型是當(dāng)今處理自然語(yǔ)言任務(wù)效果好的模型。掌握了該模型,就相當(dāng)于掌握了當(dāng)今主流的NLP技術(shù)。
通過(guò)本書(shū),讀者可以:
- 熟練地在PyTorch框架中開(kāi)發(fā)并訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,
- 快速地使用BERT模型完成各種主流的自然語(yǔ)言處理任務(wù),
- 獨(dú)立地設(shè)計(jì)并訓(xùn)練出針對(duì)特定需求的BERT模型,
- 輕松地將BERT模型封裝成Web服務(wù)部署到云端。
BERT模型在2018年一問(wèn)世便引起了轟動(dòng)。之后,各種改進(jìn)版本的預(yù)訓(xùn)練模型(Pre-Training Model,PTM)如過(guò)江之鯽,層出不窮,它們?cè)?NLP 各個(gè)領(lǐng)域攻城略地,所向披靡,頻頻登榜于多種 NLP 數(shù)據(jù)集競(jìng)賽榜單,個(gè)別模型的能力已超過(guò)人類。
BERT模型在刷新傳統(tǒng)NLP指標(biāo)的同時(shí),也給NLP領(lǐng)域的技術(shù)帶來(lái)革命性的變革。它使用帶有注意力模型的深度神經(jīng)網(wǎng)絡(luò)所實(shí)現(xiàn)的效果,優(yōu)于一大批使用傳統(tǒng)的NLP方法所實(shí)現(xiàn)的效果,這使得NLP工作人員不得不向BERT模型的技術(shù)體系靠攏。
與此同時(shí),近年來(lái),圖神經(jīng)網(wǎng)絡(luò)的崛起也為深度學(xué)習(xí)領(lǐng)域指明了前進(jìn)的方向BERT模型結(jié)合圖深度學(xué)習(xí)將是未來(lái)NLP的主流趨勢(shì)。
本書(shū)從零基礎(chǔ)開(kāi)始,介紹了與BERT模型相關(guān)的一系列知識(shí)與實(shí)現(xiàn)方法,包括神經(jīng)網(wǎng)絡(luò)的原理、NLP基礎(chǔ)、PyTorch的使用、BERT模型的原理及實(shí)現(xiàn)、BERTology系列模型的原理及實(shí)現(xiàn),以及BERT模型與圖神經(jīng)網(wǎng)絡(luò)的結(jié)合。
本書(shū)適合于即將從事NLP工作,以及正在從事NLP工作并打算向BERT模型技術(shù)體系靠攏的讀者閱讀。
總的來(lái)說(shuō),本書(shū)具有以下特色。
1.知識(shí)系統(tǒng),逐層遞進(jìn)
本書(shū)涵蓋了BERT模型的完整技術(shù)體系:
從神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)知識(shí),到NLP的基礎(chǔ)知識(shí),再到BERT模型的原理及應(yīng)用;
從BERTology系列模型的原理,到BERT模型與圖神經(jīng)網(wǎng)絡(luò)的結(jié)合,再到多種場(chǎng)景下BERT模型的應(yīng)用。
2.內(nèi)容緊跟技術(shù)趨勢(shì)
本書(shū)所介紹的知識(shí)與近年來(lái)學(xué)術(shù)領(lǐng)域發(fā)表的論文技術(shù)基本同步。為了拓展讀者的學(xué)習(xí)視野,本書(shū)在介紹一些知識(shí)的原理和應(yīng)用的同時(shí),還附有相關(guān)的論文索引,方便讀者對(duì)感興趣的知識(shí)擴(kuò)展閱讀。
3.圖文結(jié)合,化繁為簡(jiǎn)。
本書(shū)在介紹模型的結(jié)構(gòu)和原理的同時(shí),還穿插了大量的圖片。這些圖片有的可視化了模型中的數(shù)據(jù)流向,有的展示了模型的擬合能力,有的細(xì)化了某種技術(shù)的內(nèi)部原理,有的直觀化了模型的內(nèi)部結(jié)構(gòu),從而讓讀者更容易、更快捷地理解和掌握知識(shí)。
4.站在入門者的角度講解,內(nèi)容更系統(tǒng)、更易學(xué)
考慮到初學(xué)者知識(shí)儲(chǔ)備的不足,凡是書(shū)中涉及的知識(shí)點(diǎn),都從零開(kāi)始進(jìn)行系統(tǒng)介紹:從PyTorch框架的安裝、使用;到向量、矩陣、張量的基礎(chǔ)變換;再到神經(jīng)網(wǎng)絡(luò)及圖神經(jīng)網(wǎng)絡(luò)的系統(tǒng)介紹;從NLP基礎(chǔ),到BERT模型的原理剖析,再到BERT模型的多場(chǎng)景實(shí)戰(zhàn)。這樣可以消除讀者學(xué)習(xí)中的跳躍感。
李金洪
擅長(zhǎng)神經(jīng)網(wǎng)絡(luò)、算法、協(xié)議分析、逆向、移動(dòng)互聯(lián)網(wǎng)安全架構(gòu)等技術(shù)
先后擔(dān)任過(guò)CAD算法工程師、手機(jī)游戲主程、架構(gòu)師、項(xiàng)目經(jīng)理、CTO、部門經(jīng)理、資深產(chǎn)品總監(jiān)等職位
目前創(chuàng)業(yè)中。