本書是一本專門面向數據標注人才培養(yǎng)的實訓教材,適用于有意從事人工智能訓練師和數據標注工作的人員。為了使學習更具有針對性,本書特別選擇了能代表行業(yè)普遍需求的標注項目管理知識及典型文本、語音和圖像標注任務進行講解與訓練,輔助學習者快速完成系統(tǒng)化學習,進行標注實戰(zhàn)工作。 本書對文本的事件標注和關系標注、語音的采集和質檢、圖像的語義分割任務進行逐一講解和分析,每種標注類型均配有對應的規(guī)范、舉例分析、習題與解析。本書還針對各類標注配套了多種子任務類型或多個領域的實操練習題,目的是幫助標注學習者增長見識,從而實現系統(tǒng)、完整的標注學習和實戰(zhàn)練習。
張熠天,國家工業(yè)信息安全發(fā)展研究中心高級工程師,教育部計算機行業(yè)指導委員會委員、中國中文信息學會智能寫作專委會委員、中國智能寫作聯盟秘書長、清華大學戰(zhàn)略與安全研究中心客座研究員、清華大學人工智能國際治理中心項目主任。政策研究方面:支撐國安委某戰(zhàn)略性文件、作為主要起草者參與中央深改組《關于促進人工智能和實體經濟深度融合的指導意見》,工信部《促進新一代人工智能產業(yè)發(fā)展三年行動計劃(2018-2020)》起草。技術及理論研究方面:牽頭多部委的研究課題和重點專項,在人工智能技術圖譜,智能語音、NLP、智能寫作等方向著有研究成果,研究成果曾獲工信部優(yōu)秀科研成果一等獎。國際治理方面:中美二軌談判專家組成員、中美歐人工智能巴黎對話中方代表。
目錄
第1章 標注項目管理實訓 1
1.1 標注項目管理概述 1
1.2 標注項目管理內容 2
1.2.1 標注項目人員管理 3
1.2.2 標注項目質量管理 7
1.2.3 標注項目進度管理 11
1.2.4 標注項目數據管理 12
1.3 標注項目過程中的項目管理應用 14
第2章 關鍵點檢測標注實訓 30
2.1 認識關鍵點檢測標注 31
2.2 關鍵點檢測標注的應用場景 32
2.2.1 人臉識別或面部特征提取的場景 32
2.2.2 分析人體結構和動作捕捉的場景 33
2.3 手部關鍵點檢測標注規(guī)范 36
2.4 實訓習題 55
第3章 語義分割標注實訓 57
3.1 認識語義分割 57
3.2 語義分割應用場景 58
3.3 交通場景語義分割規(guī)范 62
3.4 實訓習題 86
第4章 語音采集與質檢實訓 88
4.1 認識語音采集 88
4.2 語音采集標注規(guī)范 89
4.3 語音質檢 92
4.4 實訓習題 103
第5章 事件標注實訓 105
5.1 認識事件標注 105
5.2 事件抽取標注應用場景 106
5.3 體育賽事事件標注規(guī)范 108
5.4 實訓習題 124
第6章 關系標注實訓 125
6.1 認識關系標注 125
6.2 關系標注應用場景 126
6.3 生物關系標注規(guī)范 130
6.4 實訓習題 148