本書在邏輯上分為三個板塊,即眾包實驗方法研究、語義透明度研究和詞感研究。三個板塊既有相對獨立性,又存在密切關聯(lián),有些地方還存在不同程度的交叉。眾包實驗方法研究側重于方法論研究,語義透明度研究和詞感研究則側重于語言理論研究。眾包實驗是對語義透明度、詞感進行計量研究時采用的數(shù)據(jù)收集方法。本書也通過語義透明度實驗和分詞實驗評估眾包實驗的可靠性。本書先討論了眾包實驗的方法,然后運用眾包方法構建了語義透明度數(shù)據(jù)集,運用語義透明度數(shù)據(jù)集探討了語義透明度評估中的詞法結構效應,然后從中抽取詞例用于研究語義透明度對詞感的影響。之后運用眾包實驗方法構建了分詞數(shù)據(jù)集,運用分詞數(shù)據(jù)集測量了漢語母語者的詞感一致度,探討了語段詞感強度的測量方法,并分析了語義透明度對詞感的影響。書末附上了三個附錄,附錄1是通過眾包實驗方法構建的語義透明度數(shù)據(jù)集,附錄2是運用傳統(tǒng)實驗室實驗方法構建的語義透明度數(shù)據(jù)集,附錄3是眾包分詞實驗構建的語段頻率數(shù)據(jù)集。
王世昌 男,1985年1月生,山東五蓮人,山東大學文學院助理研究員,碩士研究生導師。2007年山東大學文學與新聞傳播學院本科畢業(yè);2011年山東大學文學與新聞傳播學院碩士畢業(yè),師從楊振蘭教授,學習現(xiàn)代漢語詞匯學;2016年香港理工大學博士畢業(yè),師從黃居仁教授,學習語料庫語言學與計算語言學。研究方向為現(xiàn)代漢語詞匯學、語料庫語言學、計算語言學。為本科生開設“現(xiàn)代漢語”“《普通語言學教程》導讀”等課程,為研究生開設“語言理論專題”“漢語詞匯專題研究”“計量語言學”等課程。承擔山東省社會科學規(guī)劃青年項目、山東大學青年團隊項目、山東大學文學院一般科研項目、山東大學教育教學改革研究一般項目各一項,參與各級項目多項。在Language andLinguistics、《文史哲》、《語言戰(zhàn)略研究》、Lingua Sinica等期刊以及國內外學術會議發(fā)表論文十余篇,出版譯著一部,構建語料庫及詞匯數(shù)據(jù)庫等語言資源多種。2018年獲山東大學青年教師教學比賽三等獎,2020年獲山東大學優(yōu)秀科研個人獎勵,2021年獲山東大學文學院優(yōu)秀青年科研成果獎一等獎。
第1章 導論
1.1 語言數(shù)據(jù)瓶頸問題
1.2 眾包方法
1.3 計量語言學
1.4 本書結構
第2章 眾包概要
2.1 眾包的興起
2.2 眾包的定義
2.3 眾包的類型
2.4 土耳其機器人與語言數(shù)據(jù)
第3章 眾包實驗
3.1 主要關切與研究問題
3.2 平臺可用性分析
3.3 預實驗
第4章 語義透明度
4.1 語義透明度的定義
4.2 語義透明度的測量
4.3 漢語語言學中的相關研究
4.4 討論
第5章 眾包構建語義透明度數(shù)據(jù)集
5.1 方法
5.2 結果
5.3 小結
第6章 眾包數(shù)據(jù)與實驗室數(shù)據(jù)的比較
6.1 實驗室語義透明度評估實驗
6.2 數(shù)據(jù)比較
6.3 評估者間語義透明度評估的不確定度
第7章 語義透明度評估中的詞法結構效應
7.1 方法
7.2 結果
7.3 討論
第8章 詞的定義與辨識
8.1 詞的定義與辨識問題
8.2 葛本儀論詞的定義與辨識
8.3 討論
第9章 眾包構建漢語分詞數(shù)據(jù)集
9.1 方法
9.2 結果
9.3 數(shù)據(jù)質量評估
第10章 詞感—致度
10.1 分詞結果的表示
10.2 漢語母語者間的詞感一致性
第11章 詞感強度
11.1 語段及其表示
11.2 語段的詞感強度
11.3 語段在分詞結果中的相對頻率
11.4 覆蓋問題及其應對方法
11.5 語段詞感強度的分布
第12章 語義透明度在詞感中的作用
附錄1 眾包實驗語義透明度數(shù)據(jù)
附錄2 實驗室實驗語義透明度數(shù)據(jù)
附錄3 眾包分詞實驗語段頻率數(shù)據(jù)
參考文獻
致謝
后記
山東大學中文?夸