《大類別集分類與自適應及其在漢字識別中的應用》由中國科學院自動化研究所副研究員張煦堯博士撰寫。全書從大類別集和非獨立同分布的角度出發(fā),分別對降維、分類器學習、分類器自適應三方面的研究進行了深入的闡述,并且通過實驗證明了在聯(lián)機及脫機手寫漢字識別上本書方法的性能優(yōu)于傳統(tǒng)方法。
《大類別集分類與自適應及其在漢字識別中的應用》共六章:
第1章首先介紹了研究背景和意義,然后介紹了全書的主要工作、貢獻以及組織結(jié)構(gòu)。第2章首先闡述了FDA和類別可分性問題,然后分析了加權(quán)Fisher準則,*后提出了一種非參數(shù)加權(quán)Fisher準則降維方法,并取得了*佳性能。第3章首先回顧了修正二次判別函數(shù)MQDF以及對它的改進方法,然后提出了一種局部平滑的修正二次判別函數(shù)LSMQDF。第4章首先對書寫人自適應的方法進行了歷史回顧,然后提出了一種基于風格遷移映射的分類器自適應框架。第5章首先介紹了模式域分類問題的定義以及相關歷史,然后提出了一種貝葉斯模式域分類方法,*后在三個不同類型的實驗數(shù)據(jù)庫上展示了模式域分類帶來的性能提升。第6章對全書的研究工作進行了總結(jié),并對后續(xù)的研究方向進行了展望。
第1章 引言
1.1 背景介紹和研究意義 1
1.1.1 特征描述 2
1.1.2 分類器設計 3
1.1.3 分類器自適應 5
1.1.4 大類別集漢字識別 6
1.2 本書主要內(nèi)容及貢獻 7
1.3 本書組織結(jié)構(gòu) 10
第2章 基于加權(quán)Fisher準則的大類別集降維
2.1 引言 12
2.2 FDA和類別可分性問題 16
2.2.1 第一步:白化(whitening) 17
2.2.2 第二步:白化空間的PCA 18
2.2.3 類別可分性問題 18
2.3 加權(quán)Fisher準則 20
2.3.1 加權(quán)函數(shù) 22
2.3.2 加權(quán)空間 27
2.4 對不同加權(quán)Fisher準則的評估 29
2.4.1 數(shù)據(jù)集 30
2.4.2 分類器 31
2.4.3 實驗設置 33
2.4.4 實驗結(jié)果 33
2.4.5 統(tǒng)計顯著性 38
2.4.6 五種加權(quán)函數(shù)的比較 40
2.4.7 計算復雜度比較 40
2.4.8 三種加權(quán)空間的比較 43
2.4.9 空間不變性 45
2.4.10 形近字分析 46
2.5 樣本級別的加權(quán)Fisher準則 47
2.5.1 SKNN:樣本級別的KNN方法 48
2.5.2 漢字識別中的其他降維方法 49
2.5.3 性能評估 51
2.6 本章小結(jié) 54
第3章 基于局部平滑的修正二次判別函數(shù)
3.1 引言 56
3.1.1 二次判別函數(shù)QDF 56
3.1.2 修正二次判別函數(shù)MQDF 58
3.2 對MQDF的改進 59
3.3 局部平滑的修正二次判別函數(shù)LSMQDF 60
3.3.1 極大似然估計 61
3.3.2 局部平滑:LSMQDF 62
3.3.3 局部平滑與全局平滑 64
3.4 實驗結(jié)果 65
3.4.1 LSMQDF用于脫機識別 65
3.4.2 不同維數(shù)的影響 67
3.4.3 不同訓練數(shù)據(jù)量的影響 68
3.4.4 對K的選擇 68
3.4.5 對β的選擇 69
3.4.6 LSMQDF用于聯(lián)機識別 70
3.5 本章小結(jié) 71
第4章 基于風格遷移映射的分類器自適應
4.1 引言 73
4.2 歷史回顧 76
4.3 風格遷移映射 80
4.4 源點集和目標點集 83
4.4.1 源點集 83
4.4.2 LVQ的目標點集 84
4.4.3 MQDF的目標點集 86
4.5 置信度估計 88
4.6 分類器自適應 91
4.6.1 監(jiān)督的自適應 91
4.6.2 非監(jiān)督的自適應 93
4.6.3 半監(jiān)督的自適應 94
4.7 實驗結(jié)果 96
4.7.1 數(shù)據(jù)庫 96
4.7.2 實驗設置 98
4.7.3 LVQ自適應 100
4.7.4 MQDF自適應 103
4.7.5 置信度估計的影響 109
4.7.6 對STM和MLLR的比較 111
4.7.7 模型參數(shù)選擇 113
4.8 本章小結(jié) 117
第5章 基于風格歸一化的模式域分類
5.1 引言 119
5.2 模式域分類簡介120
5.2.1 歷史回顧 122
5.2.2 本章工作 123
5.3 貝葉斯模式域分類 124
5.3.1 基本假設 125
5.3.2 模型定義 126
5.3.3 對未知樣本的預測 128
5.3.4 優(yōu)化 130
5.3.5 特殊情況 131
5.4 實驗結(jié)果 134
5.4.1 不同姿態(tài)下的人臉識別 135
5.4.2 多說話者元音分類 136
5.4.3 多書寫人手寫字符識別 138
5.5 本章小結(jié) 140
第6章 總結(jié)和展望
6.1 本書研究成果 142
6.2 未來工作展望 145