計算機(jī)視覺、自然語言處理和語音識別是目前深度學(xué)習(xí)領(lǐng)域很熱門的三大應(yīng)用方向,本書旨在幫助零基礎(chǔ)或基礎(chǔ)較為薄弱的讀者入門深度學(xué)習(xí),達(dá)到能夠獨立使用深度學(xué)習(xí)知識處理計算機(jī)視覺問題的水平。通過閱讀本書,讀者將學(xué)到人工智能的基礎(chǔ)概念及Python編程技能,掌握PyTorch的使用方法,學(xué)到深度學(xué)習(xí)相關(guān)的理論知識,比如卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、自動編碼器,等等。在掌握深度學(xué)習(xí)理論和編程技能之后,讀者還會學(xué)到如何基于PyTorch深度學(xué)習(xí)框架實戰(zhàn)計算機(jī)視覺。本書中的大量實例可讓讀者在循序漸進(jìn)地學(xué)習(xí)的同時,不斷地獲得成就感。本書面向?qū)ι疃葘W(xué)習(xí)技術(shù)感興趣、但是相關(guān)基礎(chǔ)知識較為薄弱或者零基礎(chǔ)的讀者。
作者的文筆很好,對深度學(xué)習(xí)、Python、PyTorch、神經(jīng)網(wǎng)絡(luò)、遷移學(xué)習(xí)及相關(guān)數(shù)學(xué)知識講解透徹,使書中的內(nèi)容很好理解。
全書的架構(gòu)也很好,學(xué)習(xí)下來,對深度學(xué)習(xí)的整個脈絡(luò)都掌握得很清晰,可以說一本書通俗易懂地講到了PyTorch實戰(zhàn)計算機(jī)視覺所涉及的方方面面。
這是一本零基礎(chǔ)入門書,希望能幫助您更好地入門并進(jìn)階深度學(xué)習(xí)。
人工智能(Artificial Intelligence,簡稱AI)一詞在很久以前就有了,被大眾津津樂道卻是近幾年的事情,這和機(jī)器學(xué)習(xí)(Machine Learning)、深度學(xué)習(xí)(Deep Learning)等技術(shù)的崛起有著千絲萬縷的聯(lián)系,而這一切又得益于大數(shù)據(jù)的發(fā)展和計算機(jī)處理性能的不斷提升。
本書將帶領(lǐng)讀者了解人工智能的相關(guān)技術(shù)和發(fā)展近況,通過一些實例來掌握必備的技能,并能夠獨立使用相關(guān)技術(shù)完成對計算機(jī)視覺問題的分析和處理。本書各個章節(jié)的知識要點如下。
第1章主要介紹人工智能、神經(jīng)網(wǎng)絡(luò)和計算機(jī)視覺的發(fā)展歷史,讓讀者對這一領(lǐng)域有一個全面的認(rèn)識。
第2章主要介紹在理解和掌握后面章節(jié)的內(nèi)容時需要用到的數(shù)學(xué)知識,以及在實戰(zhàn)操作的過程中進(jìn)行環(huán)境搭建及安裝相關(guān)軟件的方法。本書中數(shù)學(xué)相關(guān)的大部分知識都集中在本章中,其主要目的是讓讀者先對這個領(lǐng)域的知識產(chǎn)生興趣,這樣才能更好地深入學(xué)習(xí)和研究。在本章中不會插入大量的數(shù)學(xué)公式,這樣做會讓初學(xué)者望而卻步,在不斷消化公式的過程中喪失學(xué)習(xí)興趣和動力。通過不斷實戰(zhàn)來學(xué)習(xí),可以累積成就感,這種自頂向下的方式不失為一種更好的學(xué)習(xí)方法。
第3章主要介紹在學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的過程中會經(jīng)常遇到的一些概念和定義。比如后向傳播(Back Propagation)、激活函數(shù)(Activation Function)、監(jiān)督學(xué)習(xí)(Supervised Learning)、無監(jiān)督學(xué)習(xí)(Unsupervised Learning),等等,這也是為之后學(xué)習(xí)深度神經(jīng)網(wǎng)絡(luò)做準(zhǔn)備。在搭建一個完整的深度神經(jīng)網(wǎng)絡(luò)模型時,就需要不斷地用到本章的內(nèi)容了。
第4章主要介紹深度神經(jīng)網(wǎng)絡(luò)中的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)。首先介紹卷積層、全連接層、池化層等相關(guān)內(nèi)容,之后又列舉了目前主流的一些卷積神經(jīng)網(wǎng)絡(luò)架構(gòu),并對比它們之間的相同點和不同點,以便于掌握不同的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和技術(shù)細(xì)節(jié)。
第5章主要介紹Python編程語言的相關(guān)知識,目的是讓讀者掌握Python語言的語法定義和使用方式,并使用Python語言進(jìn)行功能代碼的編寫;還會介紹在處理計算機(jī)視覺問題時需要用到的兩個重要的Python包:NumPy和Matplotlib。本章內(nèi)容豐富,而且Python語言自身就很簡單且易上手,讀者很快就能掌握Python這門編程語言。
第6章主要介紹如何使用PyTorch深度學(xué)習(xí)框架。PyTorch非常簡單易用,能夠根據(jù)我們的需求快速搭建出我們想要的深度神經(jīng)網(wǎng)絡(luò)模型,這在很大程度上歸功于PyTorch基于動態(tài)圖計算的特性,它與基于靜態(tài)圖計算的深度學(xué)習(xí)框架相比,有更多的優(yōu)勢,比如PyTorch不僅速度快,還有許多功能強(qiáng)大的包可供調(diào)用。本章先介紹PyTorch中常用的包和類的使用方法;然后介紹如何使用PyTorch中的一些自動化方法來提升代碼的執(zhí)行效率和簡潔度;最后會通過一個綜合實例,使用本章的內(nèi)容解決一個實際的計算機(jī)視覺問題。
第7章一開始就是一個關(guān)于計算機(jī)視覺問題的實戰(zhàn),介紹了一種非常實用的深度神經(jīng)網(wǎng)絡(luò)復(fù)用方法,即遷移學(xué)習(xí)(Transfer Learning)。在掌握遷移學(xué)習(xí)的原理之后,會基于PyTorch對遷移學(xué)習(xí)進(jìn)行實戰(zhàn),并解決比之前更復(fù)雜的計算機(jī)視覺問題。對實戰(zhàn)代碼的解析會貫穿本章,讓讀者更深刻地理解代碼。
第8章講解如何基于PyTorch實戰(zhàn)圖像風(fēng)格遷移(Neural Style)。通過對本章的學(xué)習(xí),讀者會發(fā)現(xiàn),利用卷積神經(jīng)網(wǎng)絡(luò)不僅能處理圖片分類問題,只要有想法和創(chuàng)意,還能做更多、更有趣的事情。
第9章介紹一種多模型融合方法,在現(xiàn)有的模型遭遇性能提升瓶頸時,可通過搭建一種經(jīng)過科學(xué)融合的新模型達(dá)到超過預(yù)期的泛化能力。本章依然會基于PyTorch對多模型融合方法進(jìn)行實戰(zhàn)。
第10章介紹一種區(qū)別于卷積神經(jīng)網(wǎng)絡(luò)的新神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),即循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡稱RNN)。不同于卷積神經(jīng)網(wǎng)絡(luò)強(qiáng)大的圖像特征提取能力,循環(huán)神經(jīng)網(wǎng)絡(luò)主要用于處理有序輸入的數(shù)據(jù)。為了方便讀者理解模型如何對有序數(shù)據(jù)進(jìn)行處理,本章會基于PyTorch使用循環(huán)神經(jīng)網(wǎng)絡(luò)來處理一個計算機(jī)視覺問題。
第11章講解自動編碼器,它是一種使用非監(jiān)督學(xué)習(xí)方法的神經(jīng)網(wǎng)絡(luò)。自編碼器能夠?qū)崿F(xiàn)很多功能,本章會選取一個圖像去噪問題來進(jìn)行自動編碼器實戰(zhàn)。
本書前6章的內(nèi)容可作為后5章的鋪墊,前6章的知識偏向基礎(chǔ)和理論,不過,只有掌握了這些內(nèi)容,才能從容應(yīng)對后5章的實戰(zhàn)。這個循序漸進(jìn)的過程會讓讀者對知識的理解更深刻,技能提升更迅速。
人工智能在近幾年大熱,網(wǎng)絡(luò)上的相關(guān)資料良莠不齊且沒有體系,即使有優(yōu)秀的干貨,對于基礎(chǔ)薄弱的初學(xué)者來說起點也太高。本書也是出于對這一現(xiàn)狀的考慮,通過從基礎(chǔ)到實戰(zhàn)、由淺入深的過程,讓讀者基于PyTorch來使用深度學(xué)習(xí)方法實際解決一些計算機(jī)視覺相關(guān)的問題,這樣,讀者在獲取知識的過程中會更有成就感,學(xué)起來也會更積極、主動。
感謝家人的鼓勵和支持,也感謝張國霞編輯的幫助和付出,筆者才能以更好的方式將這部作品呈現(xiàn)在讀者的面前。希望讀者能遵從敏捷學(xué)習(xí)的思路,多實戰(zhàn)、多思考并不斷進(jìn)步。在本書中會有很多實例,讀者可以舉一反三、不斷實踐,在發(fā)現(xiàn)問題時要多思考,畢竟本書涉及的內(nèi)容有限,若想讓自己的能力得到更高層次的提升,則需要獲取更多的資料來充實自己。
唐進(jìn)民
2018年5月
輕松注冊成為博文視點社區(qū)用戶(www.broadview.com.cn),掃碼直達(dá)本書頁面。
- 提交勘誤:您對書中內(nèi)容的修改意見可在 提交勘誤 處提交,若被采納,將獲贈博文視點社區(qū)積分(在您購買電子書時,積分可用來抵扣相應(yīng)金額)。
- 交流互動:在頁面下方 讀者評論 處留下您的疑問或觀點,與我們和其他讀者一同學(xué)習(xí)交流。
頁面入口:http://www.broadview.com.cn/34144
唐進(jìn)民
深入理解深度學(xué)習(xí)與計算機(jī)視覺知識體系,有扎實的PyTorch、Python和數(shù)學(xué)功底。長期活躍于Github、知乎等平臺并分享與深度學(xué)習(xí)相關(guān)的文章,具有一定的閱讀量和人氣。此前還在某AI網(wǎng)絡(luò)教育平臺兼職Mentor,輔導(dǎo)新學(xué)員入門機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。