基于索引行聚類的英語(yǔ)動(dòng)詞型式自動(dòng)識(shí)別與提取研究
定 價(jià):61.9 元
叢書名:大數(shù)據(jù)視野下的外語(yǔ)與外語(yǔ)學(xué)習(xí)研究系列叢書
- 作者:于濤
- 出版時(shí)間:2017/12/1
- ISBN:9787513596596
- 出 版 社:外語(yǔ)教學(xué)與研究出版社
- 中圖法分類:H314.2
- 頁(yè)碼:264
- 紙張:膠版紙
- 版次:1
- 開本:32開
《基于索引行聚類的英語(yǔ)動(dòng)詞型式自動(dòng)識(shí)別與提取研究》關(guān)注概括和提取語(yǔ)言型式。本書中采用相似度分析方法,在索引行自動(dòng)聚類的基礎(chǔ)上實(shí)現(xiàn)英語(yǔ)動(dòng)詞型式的自動(dòng)識(shí)別與提取,圍繞索引行聚類的影響因素及分組數(shù)量的選擇,型式自動(dòng)識(shí)別的準(zhǔn)確率及其影響因素進(jìn)行探究,建構(gòu)了英語(yǔ)動(dòng)詞型式自動(dòng)提取模型,該模型以后可能廣泛應(yīng)用于語(yǔ)言教學(xué)、語(yǔ)言研究及自動(dòng)語(yǔ)法檢查中。
于濤,文學(xué)博士,江蘇師范大學(xué)外國(guó)語(yǔ)學(xué)院副教授,副院長(zhǎng),碩士生導(dǎo)師。研究方向?yàn)椋簯?yīng)用語(yǔ)言學(xué)與語(yǔ)料庫(kù)語(yǔ)言學(xué)。曾主持江蘇省社科基金項(xiàng)目一項(xiàng)(已結(jié)題),現(xiàn)主持國(guó)家社科基金項(xiàng)目 "基于型式語(yǔ)法及索引行聚類的動(dòng)詞型式自動(dòng)識(shí)別與提取研究"一項(xiàng)。迄今發(fā)表論文數(shù)十篇。
緒論 1
0.1 研究背景 1
0.2 本研究的理論及實(shí)踐意義 4
0.2.1 理論意義 4
0.2.2 實(shí)踐意義 6
0.3 本研究概述 9
0.3.1 研究目的 9
0.3.2 研究問題及研究對(duì)象 9
0.3.3 研究步驟 10
0.3.3.1 語(yǔ)料及預(yù)處理 11
0.3.3.2 特征集的建立及其轉(zhuǎn)換 11
0.3.3.3 權(quán)重計(jì)算 13
0.3.3.4 索引行聚類 14
0.3.3.5 型式提取 15
0.4 本書結(jié)構(gòu) 15
0.5 小結(jié) 16
第一章 型式與型式語(yǔ)法 17
1.1 型式 17
1.1.1 型式研究的緣起與發(fā)展 17
1.1.2 型式的定義 20
1.1.3 型式實(shí)例 21
1.1.4 型式元素及其編碼 23
1.1.5 本研究中判別型式的六個(gè)標(biāo)準(zhǔn) 26
1.2 型式語(yǔ)法 26
1.2.1 短語(yǔ)學(xué)思想與習(xí)語(yǔ)原則 27
1.2.2 詞匯與語(yǔ)法關(guān)系及各自地位 28
1.2.2.1 詞匯語(yǔ)法不可分 28
1.2.2.2 詞匯為中心的研究 30
1.2.3 型式與意義的關(guān)系 32
1.3 型式語(yǔ)法的優(yōu)缺點(diǎn) 35
1.3.1 型式語(yǔ)法與傳統(tǒng)語(yǔ)法的差異 35
1.3.2 型式語(yǔ)法的優(yōu)點(diǎn) 36
1.3.3 型式語(yǔ)法的不足 37
1.4 以型式語(yǔ)法為理論基礎(chǔ)的相關(guān)研究 40
1.5 小結(jié) 41
第二章 型式識(shí)別方法與相關(guān)應(yīng)用研究 42
2.1 型式識(shí)別標(biāo)準(zhǔn) 42
2.2 型式總結(jié)的必要性 43
2.3 型式的識(shí)別 44
2.3.1 型式的人工識(shí)別 45
2.3.2 型式人工識(shí)別輔助工具的開發(fā) 48
2.3.3 型式的自動(dòng)識(shí)別 48
2.3.3.1 型式自動(dòng)識(shí)別的理?yè)?jù) 48
2.3.3.2 型式的自動(dòng)識(shí)別研究 51
2.4 現(xiàn)有的語(yǔ)言型式網(wǎng)絡(luò)平臺(tái)數(shù)據(jù)庫(kù) 52
2.4.1 基于機(jī)器處理的網(wǎng)絡(luò)數(shù)據(jù)庫(kù) 53
2.4.2 基于人工處理的網(wǎng)絡(luò)數(shù)據(jù)庫(kù) 54
2.5 小結(jié) 56
第三章 聚類分析 57
3.1 文本表示 58
3.2 特征選擇及其權(quán)重 59
3.2.1 特征選擇 59
3.2.2 權(quán)重計(jì)算 60
3.3 相似度計(jì)算 61
3.3.1 相似度計(jì)算的源起及理?yè)?jù) 61
3.3.2 相似度計(jì)算方法 61
3.3.3 相似度分析在語(yǔ)言研究中的應(yīng)用 63
3.4 聚類算法 64
3.4.1 劃分聚類 65
3.4.2 層次聚類 66
3.5 聚類質(zhì)量評(píng)價(jià)指標(biāo) 67
3.6 聚類在本研究的應(yīng)用理?yè)?jù) 68
3.7 小結(jié) 69
第四章 文本預(yù)處理與特征集的建立及轉(zhuǎn)換 70
4.1 研究概述 70
4.2 語(yǔ)料選取 70
4.3 研究工具 72
4.3.1 語(yǔ)料預(yù)處理工具 72
4.3.2 自主開發(fā)的模塊及腳本 72
4.4 語(yǔ)料預(yù)處理流程 73
4.5 動(dòng)詞型式中的必要元素及其轉(zhuǎn)換方法 75
4.5.1 型式列表中元素的總體特征 75
4.5.2 具體詞形的處理方法 77
4.5.2.1 右側(cè)搭配詞處理方法 77
4.5.2.2 左側(cè)搭配詞處理方法 90
4.5.2.3 兩側(cè)搭配詞處理方法 90
4.5.3 相鄰單詞組合的處理方法 90
4.5.4 詞類標(biāo)簽及語(yǔ)義類標(biāo)簽的轉(zhuǎn)換方法 98
4.5.4.1 詞類標(biāo)簽的轉(zhuǎn)換方法 98
4.5.4.2 語(yǔ)義類標(biāo)簽轉(zhuǎn)換方法 102
4.5.5 轉(zhuǎn)換順序及步驟 104
4.6 小結(jié) 105
第五章 索引行聚類及型式自動(dòng)提取方法 106
5.1 特征表示方法、特征權(quán)重與位置權(quán)重的計(jì)算 106
5.1.1 特征及特征權(quán)重 106
5.1.1.1 功能詞處理方法 107
5.1.1.2 特征標(biāo)記方法 107
5.1.1.3 型式邊界的界定 108
5.1.1.4 索引行跨距的設(shè)定 110
5.1.1.5 特征權(quán)重計(jì)算方法 112
5.1.2 位置權(quán)重 112
5.1.3 特征索引行矩陣的生成 113
5.2 聚類算法 114
5.2.1 相似度計(jì)算 114
5.2.2 K均值算法 115
5.2.2.1 K均值聚類 115
5.2.2.2 K值的選擇標(biāo)準(zhǔn) 115
5.3 型式自動(dòng)提取 116
5.4 小結(jié) 117