數(shù)據(jù)標(biāo)注工程——概念、方法、工具與案例
定 價:59 元
- 作者:聶明
- 出版時間:2021/1/1
- ISBN:9787121286346
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:296
- 紙張:
- 版次:01
- 開本:16開
本書是人工智能技術(shù)應(yīng)用核心課程系列教材之一,通過對人工智能數(shù)據(jù)標(biāo)注的概念、方法、工具與案例的系統(tǒng)介紹,結(jié)合對圖像、視頻、語音、文本和3D點云等類別數(shù)據(jù)的具體標(biāo)注案例的分析與操作,使初學(xué)者可以快速掌握數(shù)據(jù)標(biāo)注的基礎(chǔ)知識和常用方法,使從業(yè)者在提升數(shù)據(jù)標(biāo)注技術(shù)水平的同時,掌握工程化數(shù)據(jù)標(biāo)注的項目組織、管理和質(zhì)量控制的技術(shù)與方法。本書適合作為高校人工智能相關(guān)專業(yè)的教材,也可供人工智能、機器學(xué)習(xí)與深度學(xué)習(xí)愛好者閱讀,還可作為人工智能改造升級項目的規(guī)劃與實施者、人工智能數(shù)據(jù)服務(wù)從業(yè)者以及數(shù)據(jù)標(biāo)注技術(shù)工程管理人員閱讀和參考。
聶明,男,1964年生人,中共黨員,博士,三級教授, 現(xiàn)任南京信息職業(yè)技術(shù)學(xué)院人工智能學(xué)院(籌)院長,是全國工信和信息化職業(yè)教育教學(xué)指導(dǎo)委員會計算機專指委委員、江蘇省"333工程”中青年學(xué)術(shù)帶頭人、江蘇省"六大人才高峰”高層次人才培養(yǎng)對象。編著出版過《移動增值應(yīng)用開發(fā)導(dǎo)論》、《Java Web應(yīng)用開發(fā)項目教程》、《VC++程序設(shè)計技能教程與實訓(xùn)》和《計算機應(yīng)用技術(shù)導(dǎo)論》等多本專著和教材。
第1章 人工智能概述 1
1.1 人工智能發(fā)展概況 1
1.1.1 人工智能的發(fā)展歷程 1
1.1.2 人工智能的影響力 3
1.1.3 人工智能的國際競爭 5
1.2 人工智能的典型技術(shù) 7
1.2.1 人工智能技術(shù)的分類 7
1.2.2 語音合成 10
1.2.3 語音識別 11
1.2.4 自然語言處理 12
1.2.5 圖像識別 13
1.2.6 3D點云 13
1.2.7 多模態(tài)數(shù)據(jù)處理 14
1.3 人工智能是新一代信息技術(shù)的核心 15
1.3.1 5G與人工智能的關(guān)系 16
1.3.2 云計算與人工智能的關(guān)系 16
1.3.3 大數(shù)據(jù)與人工智能的關(guān)系 17
1.3.4 物聯(lián)網(wǎng)與人工智能的關(guān)系 18
1.4 本章小結(jié) 18
1.5 作業(yè)與練習(xí) 19
第2章 數(shù)據(jù)標(biāo)注的概念、工具與方法 20
2.1 數(shù)據(jù)標(biāo)注的概念及其對人工智能發(fā)展的意義 20
2.1.1 全球數(shù)據(jù)的快速增長催生大數(shù)據(jù)產(chǎn)業(yè) 20
2.1.2 數(shù)據(jù)產(chǎn)業(yè)推動人工智能應(yīng)用技術(shù)的發(fā)展 21
2.1.3 數(shù)據(jù)標(biāo)注對于人工智能應(yīng)用的意義 21
2.2 數(shù)據(jù)標(biāo)注對象 22
2.2.1 數(shù)據(jù)集 22
2.2.2 語音數(shù)據(jù)集 24
2.2.3 圖像數(shù)據(jù)集 25
2.2.4 文本數(shù)據(jù)集 26
2.2.5 視頻數(shù)據(jù)集 27
2.3 數(shù)據(jù)標(biāo)注工具與平臺 28
2.3.1 語音數(shù)據(jù)標(biāo)注工具 28
2.3.2 圖像數(shù)據(jù)標(biāo)注工具 30
2.3.3 視頻數(shù)據(jù)標(biāo)注工具 31
2.3.4 文本數(shù)據(jù)標(biāo)注工具 33
2.3.5 3D點云標(biāo)注工具 34
2.4 典型數(shù)據(jù)標(biāo)注技術(shù) 35
2.4.1 語音轉(zhuǎn)寫技術(shù) 35
2.4.2 人臉檢測和關(guān)鍵點檢測 36
2.4.3 圖像分割 36
2.4.4 視頻類標(biāo)注 37
2.5 數(shù)據(jù)標(biāo)注工程 37
2.5.1 數(shù)據(jù)采集 37
2.5.2 數(shù)據(jù)處理 40
2.5.3 數(shù)據(jù)標(biāo)注 42
2.5.4 數(shù)據(jù)質(zhì)檢 46
2.5.5 數(shù)據(jù)交付 46
2.5.6 數(shù)據(jù)驗收 47
2.6 本章小結(jié) 47
2.7 作業(yè)與練習(xí) 48
第3章 圖像數(shù)據(jù)標(biāo)注 49
3.1 圖像數(shù)據(jù)標(biāo)注簡介 49
3.1.1 圖像數(shù)據(jù)標(biāo)注的目的與發(fā)展 49
3.1.2 圖像數(shù)據(jù)標(biāo)注規(guī)范 50
3.1.3 場景分類型圖像數(shù)據(jù)標(biāo)注 52
3.1.4 圖像數(shù)據(jù)標(biāo)注形式分類 52
3.1.5 圖像任務(wù)和數(shù)據(jù)標(biāo)注的關(guān)系 55
3.1.6 圖像數(shù)據(jù)標(biāo)注的術(shù)語 56
3.2 關(guān)鍵點標(biāo)注方法 56
3.2.1 關(guān)鍵點標(biāo)注項目的應(yīng)用及發(fā)展前景 56
3.2.2 關(guān)鍵點的標(biāo)注內(nèi)容 57
3.2.3 標(biāo)注數(shù)據(jù)結(jié)果格式 58
3.2.4 關(guān)鍵點標(biāo)注工具簡介 59
3.2.5 關(guān)鍵點標(biāo)注案例分析 61
3.2.6 關(guān)鍵點標(biāo)注難點及分析 63
3.3 標(biāo)注框標(biāo)注方法 63
3.3.1 框標(biāo)注適合的場景 63
3.3.2 框標(biāo)注工具簡介 65
3.3.3 標(biāo)注方案及案例分析 67
3.3.4 標(biāo)注框標(biāo)注難點及分析 69
3.4 圖像區(qū)域標(biāo)注方法 69
3.4.1 圖像區(qū)域標(biāo)注適合的場景 69
3.4.2 圖像區(qū)域標(biāo)注工具簡介 70
3.4.3 標(biāo)注方案及案例分析 72
3.4.4 圖像區(qū)域標(biāo)注難點及分析 74
3.5 本章小結(jié) 74
3.6 作業(yè)與練習(xí) 74
第4章 視頻數(shù)據(jù)標(biāo)注 76
4.1 視頻數(shù)據(jù)標(biāo)注簡介 76
4.1.1 視頻數(shù)據(jù)標(biāo)注的意義 76
4.1.2 視頻數(shù)據(jù)標(biāo)注任務(wù) 77
4.1.3 視頻源數(shù)據(jù)管理 77
4.2 視頻數(shù)據(jù)標(biāo)注工具 78
4.2.1 視頻數(shù)據(jù)標(biāo)注工具簡介 78
4.2.2 視頻數(shù)據(jù)標(biāo)注流程 80
4.2.3 典型視頻數(shù)據(jù)標(biāo)注方法 83
4.3 視頻數(shù)據(jù)標(biāo)注案例解析 85
4.3.1 矩形框標(biāo)注案例—人體追蹤屬性標(biāo)注 85
4.3.2 矩形框標(biāo)注案例—車輛標(biāo)注 86
4.3.3 矩形框標(biāo)注案例—商場監(jiān)控視頻數(shù)據(jù)標(biāo)注 88
4.4.4 視頻幀標(biāo)注案例—足球視頻數(shù)據(jù)標(biāo)注 92
4.5 本章小結(jié) 94
4.6 作業(yè)與練習(xí) 95
第5章 語音數(shù)據(jù)標(biāo)注 96
5.1 語音數(shù)據(jù)標(biāo)注簡介 96
5.1.1 語音數(shù)據(jù)標(biāo)注相關(guān)背景 96
5.1.2 語音信號基礎(chǔ)知識 97
5.2 語音數(shù)據(jù)標(biāo)注概述 99
5.2.1 標(biāo)注任務(wù)分類 99
5.2.2 常見語音數(shù)據(jù)異常 100
5.2.3 基本標(biāo)注規(guī)范 102
5.3 典型開源語音數(shù)據(jù)標(biāo)注工具 104
5.3.1 Praat語音學(xué)軟件 104
5.3.2 語音數(shù)據(jù)標(biāo)注平臺 105
5.4 語音數(shù)據(jù)標(biāo)注整體流程 110
5.4.1 項目背景與意義 110
5.4.2 語音項目整體規(guī)程 110
5.4.3 語音數(shù)據(jù)標(biāo)注過程詳情 111
5.5 多樣化語音數(shù)據(jù)標(biāo)注項目 115
5.5.1 智能家居兒童語音數(shù)據(jù)標(biāo)注 115
5.5.2 智能音箱語音數(shù)據(jù)標(biāo)注 117
5.5.3 智能客服語音拼音標(biāo)注 119
5.5.4 演講語音數(shù)據(jù)標(biāo)注 120
5.6 本章小結(jié) 122
5.7 作業(yè)與練習(xí) 122
第6章 文本數(shù)據(jù)標(biāo)注 123
6.1 文本數(shù)據(jù)標(biāo)注簡介 123
6.1.1 文本數(shù)據(jù)標(biāo)注的發(fā)展與研究現(xiàn)狀 123
6.1.2 基本概念 124
6.1.3 流程介紹 127
6.1.4 交付格式 127
6.1.5 應(yīng)用場景 127
6.2 文本數(shù)據(jù)標(biāo)注工具 129
6.2.1 開源文本數(shù)據(jù)標(biāo)注工具 129
6.2.2 專業(yè)文本數(shù)據(jù)標(biāo)注工具及其標(biāo)注場景 132
6.2.3 優(yōu)秀的標(biāo)注工具應(yīng)具備的條件 142
6.3 序列標(biāo)注方法舉例 142
6.3.1 外賣成分識別標(biāo)注案例 142
6.3.2 單品推廣文案標(biāo)注案例 144
6.3.3 多音字關(guān)鍵詞提取標(biāo)注案例 145
6.4 關(guān)系標(biāo)注方法舉例—中文閱讀理解分析案例 147
6.5 屬性標(biāo)注方法案例 148
6.5.1 語音文本判別標(biāo)注案例 148
6.5.2 文本情感分析判別標(biāo)注案例 150
6.6 本章小結(jié) 152
6.7 作業(yè)與練習(xí) 152
第7章 3D點云標(biāo)注 153
7.1 3D點云標(biāo)注簡介 153
7.1.1 點云的獲取方法 154
7.1.2 3D點云應(yīng)用 156
7.1.3 3D點云的存儲方式及數(shù)據(jù)類型 158
7.1.4 3D點云典型數(shù)據(jù)集 159
7.2 3D點云標(biāo)注工具 160
7.2.1 3D點云標(biāo)注工具的主要功能 161
7.2.2 界面布局和操作 161
7.2.3 標(biāo)注輸出格式 164
7.3 3D點云標(biāo)注項目 164
7.3.1 項目背景 164
7.3.2 自動駕駛3D點云標(biāo)注規(guī)范 164
7.3.3 3D點云標(biāo)注流程 166
7.4 本章小結(jié) 169
7.5 作業(yè)與練習(xí) 169
第8章 工程化數(shù)據(jù)標(biāo)注的組織管理 171
8.1 數(shù)據(jù)標(biāo)注項目實施流程 171
8.1.1 數(shù)據(jù)標(biāo)注項目 171
8.1.2 一般項目實施流程 173
8.1.3 數(shù)據(jù)標(biāo)注項目實施流程 174
8.2 數(shù)據(jù)標(biāo)注團隊組織架構(gòu) 176
8.2.1 數(shù)據(jù)標(biāo)注團隊組織類型 176
8.2.2 數(shù)據(jù)標(biāo)注團隊組織架構(gòu) 177
8.3 數(shù)據(jù)標(biāo)注團隊角色分工 179
8.3.1 數(shù)據(jù)標(biāo)注團隊角色分工之一 179
8.3.2 數(shù)據(jù)標(biāo)注團隊角色分工之二 181
8.3.3 數(shù)據(jù)標(biāo)注團隊角色分工總覽 182
8.4 數(shù)據(jù)標(biāo)注團隊溝通和建設(shè) 184
8.4.1 項目相關(guān)方管理 184
8.4.2 數(shù)據(jù)標(biāo)注團隊溝通 186
8.4.3 數(shù)據(jù)標(biāo)注團隊建設(shè) 188
8.4.4 數(shù)據(jù)標(biāo)注員培訓(xùn) 189
8.5 國外數(shù)據(jù)產(chǎn)品生產(chǎn)組織方式案例 191
8.5.1 亞馬遜機械特克平臺 191
8.5.2 澳鵬平臺 192
8.6 本章小結(jié) 193
8.7 作業(yè)與練習(xí) 193
第9章 工程化數(shù)據(jù)標(biāo)注的質(zhì)量控制 194
9.1 質(zhì)量控制 194
9.1.1 質(zhì)量控制流程 194
9.1.2 控制流程細(xì)則 196
9.1.3 質(zhì)量監(jiān)控 198
9.1.4 質(zhì)量檢驗方法 199
9.2 質(zhì)量標(biāo)準(zhǔn) 200
9.2.1 語音數(shù)據(jù)標(biāo)注 200
9.2.2 圖像數(shù)據(jù)標(biāo)注 202
9.2.3 文本數(shù)據(jù)標(biāo)注 203
9.3 質(zhì)檢與驗收 204
9.3.1 質(zhì)檢流程 204
9.3.2 驗收原則 205
9.3.3 驗收報告 205
9.4 質(zhì)量總結(jié) 209
9.5 數(shù)據(jù)質(zhì)檢與驗收案例 210
9.5.1 人臉68點標(biāo)注質(zhì)檢案例 210
9.5.2 客服語音數(shù)據(jù)標(biāo)注質(zhì)檢案例 214
9.5.3 3~5歲中國兒童朗讀文本數(shù)據(jù)標(biāo)注質(zhì)檢案例 215
9.6 本章小結(jié) 216
9.7 作業(yè)與練習(xí) 216
第10章 工程化數(shù)據(jù)標(biāo)注的進度管理 217
10.1 項目進度管理的定義和實踐 217
10.1.1 物理架構(gòu) 217
10.1.2 項目進度管理的實踐 218
10.2 項目活動分解排序和估算時間 221
10.2.1 定義活動 221
10.2.2 排列活動順序 222
10.2.3 估算活動持續(xù)時間 224
10.3 制訂項目進度計劃 225
10.3.1 制訂項目進度計劃的常用技術(shù) 225
10.3.2 數(shù)據(jù)標(biāo)注項目進度計劃實例 228
10.4 監(jiān)控進度計劃實施 230
10.4.1 監(jiān)控進度計劃實施的流程 230
10.4.2 監(jiān)控進度計劃實施的時機和方法 231
10.4.3 數(shù)據(jù)標(biāo)注項目進度監(jiān)控實例 233
10.5 本章小結(jié) 236
10.6 作業(yè)與練習(xí) 236
第11章 工程化數(shù)據(jù)標(biāo)注的系統(tǒng)平臺 238
11.1 數(shù)據(jù)標(biāo)注系統(tǒng)概述 238
11.1.1 典型數(shù)據(jù)標(biāo)注平臺系統(tǒng)架構(gòu) 239
11.1.2 典型標(biāo)注工具 240
11.2 數(shù)據(jù)標(biāo)注平臺實例介紹 246
11.2.1 數(shù)加加Pro標(biāo)注平臺的適用范圍 246
11.2.2 數(shù)加加Pro標(biāo)注平臺的產(chǎn)品特性 246
11.2.3 數(shù)加加Pro標(biāo)注平臺的產(chǎn)品架構(gòu) 247
11.2.4 數(shù)加加Pro標(biāo)注平臺的產(chǎn)品優(yōu)勢 248
11.3 本章小結(jié) 250
11.4 作業(yè)與練習(xí) 250
第12章 數(shù)據(jù)標(biāo)注的發(fā)展趨勢 251
12.1 人工智能總體發(fā)展趨勢 251
12.1.1 主要國家和地區(qū)高度重視AI發(fā)展 251
12.1.2 有監(jiān)督學(xué)習(xí)仍是人工智能的主流 252
12.2 人工智能數(shù)據(jù)發(fā)展趨勢 254
12.2.1 人工智能數(shù)據(jù)需求 254
12.2.2 人工智能數(shù)據(jù)市場規(guī)模 258
12.2.3 人工智能數(shù)據(jù)需求特點 259
12.3 數(shù)據(jù)標(biāo)注發(fā)展趨勢 259
12.3.1 定制化精細(xì)化發(fā)展 259
12.3.2 高度自動化發(fā)展 260
12.3.3 智能化流程化發(fā)展 262
12.3.4 重視安全與隱私保護 263
12.4 本章小結(jié) 264
12.5 作業(yè)與練習(xí) 264
附錄A 典型數(shù)據(jù)產(chǎn)品介紹 266
附錄B 開源數(shù)據(jù)集介紹與獲取 269
附錄C 人工智能的網(wǎng)絡(luò)學(xué)習(xí)資源 273
附錄D 人工智能的產(chǎn)業(yè)生態(tài)與技術(shù)圖譜 276
參考文獻 280