本書以近鄰思想、同步聚類模型及快速同步聚類算法為研究課題,重點研究了基于近鄰圖與單元網(wǎng)格圖的聚類算法、基于近鄰勢與單元網(wǎng)格近鄰勢的聚類算法、快速同步聚類算法、基于Vicsek模型線性版本的同步聚類算法、基于線性加權(quán)Vicsek模型的收縮同步聚類算法、基于分而治之框架與收縮同步聚類算法的多層同步聚類方法和基于ESynC算法與微聚類合并判斷過程的組合聚類算法等。本書可作為聚類分析領(lǐng)域研究生的教學(xué)和科研參考教材,也可作為智能數(shù)據(jù)分析與處理技術(shù)人員的自學(xué)研究參考教材。
陳新泉,安徽工程大學(xué)計算機與信息學(xué)院機器學(xué)習(xí)與智能機器人研究室負(fù)責(zé)人。系統(tǒng)仿真&仿真技術(shù)應(yīng)用專委會委員,計算機學(xué)會3個專委會委員,CCF高級會員,中國復(fù)雜性科學(xué)研究會會員,安徽省計算機學(xué)會青工委委員,安徽工程大學(xué)學(xué)報編委,碩士生導(dǎo)師。多個國際權(quán)威SCI期刊(如《Data Mining and Knowledge Discovery》等)和國內(nèi)知名期刊的審稿人。多次參與省自然科學(xué)基金及省重大專項項目的評審,參與多個國家級、省部級科研項目,主持5個省廳級科研項目。獨立出版2部學(xué)術(shù)專著,以第一作者在CCF推薦SCI源期刊及其他期刊或會議上發(fā)表40多篇學(xué)術(shù)論文,其中SCI檢索期刊論文6篇,CSCD檢索8篇。
目錄
第1章 聚類算法與空間索引結(jié)構(gòu)基礎(chǔ) 1
1.1 背景與意義 1
1.2 聚類算法簡介 2
1.2.1 基于劃分的聚類算法 2
1.2.2 層次聚類算法 3
1.2.3 密度聚類算法 4
1.2.4 網(wǎng)格聚類算法 4
1.2.5 模型聚類算法 5
1.2.6 圖聚類算法 5
1.2.7 其他聚類算法 5
1.3 聚類算法的研究現(xiàn)狀及發(fā)展趨勢 5
1.4 同步聚類 7
1.4.1 同步的起源與發(fā)展 7
1.4.2 同步聚類的起源與發(fā)展 7
1.5 近鄰思想及同步模型在聚類分析中的應(yīng)用 11
1.6 空間索引結(jié)構(gòu)基礎(chǔ) 12
1.7 本書的主要內(nèi)容 13
第2章 基于近鄰圖與單元網(wǎng)格圖的聚類算法 14
2.1 基本概念及性質(zhì) 15
2.2 基于近鄰圖的聚類算法 20
2.2.1 CNNG算法示例 20
2.2.2 CNNG算法描述 22
2.2.3 CNNG算法的復(fù)雜度分析 22
2.2.4 CNNG算法的改進 23
2.3 基于單元網(wǎng)格圖的聚類算法 23
2.3.1 CGCG算法的預(yù)處理 24
2.3.2 CGCG算法預(yù)處理步驟的復(fù)雜度分析 24
2.3.3 CGCG算法描述 25
2.3.4 CGCG算法的復(fù)雜度分析 25
2.4 算法實現(xiàn)與改進的若干方法及細(xì)節(jié) 25
2.4.1 多維網(wǎng)格劃分法 25
2.4.2 多維索引樹結(jié)構(gòu) 26
2.4.3 近鄰點集的構(gòu)造 27
2.4.4 ? 近鄰單元網(wǎng)格集的構(gòu)造 28
2.4.5 區(qū)域是否存在交集的判定 31
2.5 本章小結(jié) 32
第3章 基于近鄰勢與單元網(wǎng)格近鄰勢的聚類算法 33
3.1 基本概念 33
3.2 基于近鄰勢的聚類算法 35
3.2.1 CNNI算法描述 35
3.2.2 CNNI算法的說明 36
3.2.3 參數(shù)? 的設(shè)置 37
3.2.4 CNNI算法的改進版本 37
3.2.5 CNNI算法的變種版本 38
3.3 基于單元網(wǎng)格近鄰勢的聚類算法 40
3.3.1 CIGC算法描述 40
3.3.2 CIGC算法的復(fù)雜度分析 43
3.3.3 CIGC算法的參數(shù)設(shè)置 43
3.4 本章小結(jié) 44
第4章 快速同步聚類算法 46
4.1 基本概念 47
4.2 快速同步聚類算法的三種具體版本 48
4.2.1 SynC算法描述 48
4.2.2 基于R樹的快速同步聚類算法 49
4.2.3 基于多維網(wǎng)格和紅黑樹的快速同步聚類算法 50
4.2.4 FSynC算法的一些知識 53
4.2.5 FSynC算法的復(fù)雜度分析 54
4.2.6 FSynC算法的參數(shù)設(shè)置 57
4.3 本章小結(jié) 57
第5章 基于Vicsek模型線性版本的同步聚類算法 58
5.1 基本概念及性質(zhì) 58
5.2 有效的ESynC算法 62
5.2.1 有效的ESynC算法描述 62
5.2.2 比較Kuramoto擴展模型、Vicsek模型的線性版本
及Vicsek模型的原始版本 63
5.2.3 ESynC算法的復(fù)雜度分析 68
5.2.4 ESynC算法的參數(shù)設(shè)置 68
5.2.5 ESynC算法的收斂性 68
5.2.6 ESynC算法的改進 69
5.3 本章小結(jié) 69
第6章 基于線性加權(quán)Vicsek模型的收縮同步聚類算法 71
6.1 基本概念 71
6.2 SSynC算法的對比與分析 73
6.2.1 SSynC算法描述 73
6.2.2 比較SynC算法、ESynC算法和SSynC算法的動態(tài)
同步聚類過程 75
6.2.3 SSynC算法的復(fù)雜度分析 83
6.2.4 SSynC算法的參數(shù)設(shè)置 83
6.2.5 SSynC算法的收斂性 86
6.2.6 SSynC算法的改進 86
6.3 本章小結(jié) 87
第7章 基于分而治之框架與收縮同步聚類算法的多層同步聚類方法 88
7.1 MLSynC 88
7.1.1 使用MLSynC的條件 88
7.1.2 MLSynC的兩層框架算法描述 90
7.1.3 MLSynC的遞歸算法描述 91
7.2 MLSynC的分析 92
7.2.1 比較SynC算法、ESynC算法、SSynC算法和
MLSynC的同步聚類過程 92
7.2.2 MLSynC的復(fù)雜度分析 98
7.2.3 MLSynC的參數(shù)設(shè)置 99
7.2.4 MLSynC的收斂性 100
7.2.5 MLSynC的改進 100
7.3 本章小結(jié) 100
第8章 基于ESynC算法與微聚類合并判斷過程的組合聚類算法 101
8.1 基本概念及性質(zhì) 102
8.2 組合ESynC算法與微聚類合并判斷過程的聚類方法 103
8.2.1 CESynC算法描述 103
8.2.2 CESynC算法中微聚類的合并策略 104
8.2.3 CESynC算法中微聚類的合并判斷方法 106
8.2.4 CESynC算法的復(fù)雜度分析 107
8.2.5 CESynC算法的參數(shù)設(shè)置 108
8.3 本章小結(jié) 108
第9章 近鄰?fù)骄垲惸P团c指數(shù)衰減加權(quán)同步聚類模型的
比較與分析 110
9.1 基本概念 110
9.2 基于同步模型的聚類算法框架 112
9.2.1 CNNS 112
9.2.2 CEDS 113
9.3 復(fù)雜度分析 114
9.3.1 算法9-1的復(fù)雜度分析 114
9.3.2 算法9-2的復(fù)雜度分析 115
9.4 參數(shù)的優(yōu)化確定 116
9.5 本章小結(jié) 116
第10章 總結(jié)與展望 117
10.1 總結(jié) 117
10.2 展望 117
參考文獻 119
附錄A 128
致謝 134