本書是一本專門面向數(shù)據(jù)標注人才培養(yǎng)的實訓(xùn)教材,適用于有意從事人工智能訓(xùn)練師和數(shù)據(jù)標注工作的人員。為了使學(xué)習(xí)更具有針對性,本書特別選擇了能代表行業(yè)普遍需求的標注項目管理知識及典型文本、語音和圖像標注任務(wù)進行講解與訓(xùn)練,輔助學(xué)習(xí)者快速完成系統(tǒng)化學(xué)習(xí),進行標注實戰(zhàn)工作。 本書對文本的事件標注和關(guān)系標注、語音的采集和質(zhì)檢、圖像的語義分割任務(wù)進行逐一講解和分析,每種標注類型均配有對應(yīng)的規(guī)范、舉例分析、習(xí)題與解析。本書還針對各類標注配套了多種子任務(wù)類型或多個領(lǐng)域的實操練習(xí)題,目的是幫助標注學(xué)習(xí)者增長見識,從而實現(xiàn)系統(tǒng)、完整的標注學(xué)習(xí)和實戰(zhàn)練習(xí)。
張熠天,國家工業(yè)信息安全發(fā)展研究中心高級工程師,教育部計算機行業(yè)指導(dǎo)委員會委員、中國中文信息學(xué)會智能寫作專委會委員、中國智能寫作聯(lián)盟秘書長、清華大學(xué)戰(zhàn)略與安全研究中心客座研究員、清華大學(xué)人工智能國際治理中心項目主任。政策研究方面:支撐國安委某戰(zhàn)略性文件、作為主要起草者參與中央深改組《關(guān)于促進人工智能和實體經(jīng)濟深度融合的指導(dǎo)意見》,工信部《促進新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計劃(2018-2020)》起草。技術(shù)及理論研究方面:牽頭多部委的研究課題和重點專項,在人工智能技術(shù)圖譜,智能語音、NLP、智能寫作等方向著有研究成果,研究成果曾獲工信部優(yōu)秀科研成果一等獎。國際治理方面:中美二軌談判專家組成員、中美歐人工智能巴黎對話中方代表。
目錄
第1章 標注項目管理實訓(xùn) 1
1.1 標注項目管理概述 1
1.2 標注項目管理內(nèi)容 2
1.2.1 標注項目人員管理 3
1.2.2 標注項目質(zhì)量管理 7
1.2.3 標注項目進度管理 11
1.2.4 標注項目數(shù)據(jù)管理 12
1.3 標注項目過程中的項目管理應(yīng)用 14
第2章 關(guān)鍵點檢測標注實訓(xùn) 30
2.1 認識關(guān)鍵點檢測標注 31
2.2 關(guān)鍵點檢測標注的應(yīng)用場景 32
2.2.1 人臉識別或面部特征提取的場景 32
2.2.2 分析人體結(jié)構(gòu)和動作捕捉的場景 33
2.3 手部關(guān)鍵點檢測標注規(guī)范 36
2.4 實訓(xùn)習(xí)題 55
第3章 語義分割標注實訓(xùn) 57
3.1 認識語義分割 57
3.2 語義分割應(yīng)用場景 58
3.3 交通場景語義分割規(guī)范 62
3.4 實訓(xùn)習(xí)題 86
第4章 語音采集與質(zhì)檢實訓(xùn) 88
4.1 認識語音采集 88
4.2 語音采集標注規(guī)范 89
4.3 語音質(zhì)檢 92
4.4 實訓(xùn)習(xí)題 103
第5章 事件標注實訓(xùn) 105
5.1 認識事件標注 105
5.2 事件抽取標注應(yīng)用場景 106
5.3 體育賽事事件標注規(guī)范 108
5.4 實訓(xùn)習(xí)題 124
第6章 關(guān)系標注實訓(xùn) 125
6.1 認識關(guān)系標注 125
6.2 關(guān)系標注應(yīng)用場景 126
6.3 生物關(guān)系標注規(guī)范 130
6.4 實訓(xùn)習(xí)題 148