實(shí)時(shí)數(shù)據(jù)流的算法處理及其應(yīng)用
全書(shū)共分為五大部分,*部分介紹了實(shí)時(shí)數(shù)據(jù)流和聚類(lèi)方法的背景,包括實(shí)時(shí)數(shù)據(jù)流的特點(diǎn)、進(jìn)行數(shù)據(jù)分析的技術(shù)以及研究現(xiàn)狀。第二部分詳細(xì)講解了聚類(lèi)方法中的簡(jiǎn)單聚類(lèi),包括基于衰減窗口與剪枝維度樹(shù)的數(shù)據(jù)流聚類(lèi)和實(shí)時(shí)數(shù)據(jù)流動(dòng)態(tài)模式發(fā)現(xiàn)與跟蹤方法,以及相關(guān)實(shí)驗(yàn)證明等內(nèi)容。第三部分詳細(xì)闡述了增量聚類(lèi)技術(shù),包括什么是增量聚類(lèi)、網(wǎng)格劃分策略,以及兩個(gè)特點(diǎn)不同的增量聚類(lèi)算法等內(nèi)容。第四部分介紹了聚類(lèi)算法的一個(gè)應(yīng)用,邊界技術(shù)檢測(cè),這是除了聚類(lèi)方法除了模式發(fā)現(xiàn)之外的另一個(gè)應(yīng)用之處。第五部分以實(shí)時(shí)數(shù)據(jù)流在某鋼鐵廠(chǎng)的實(shí)際應(yīng)用為案例,剖析了實(shí)時(shí)數(shù)據(jù)流在實(shí)際生產(chǎn)中的應(yīng)用過(guò)程和方法,以及通過(guò)實(shí)時(shí)數(shù)據(jù)流對(duì)企業(yè)生產(chǎn)過(guò)程的分析,*后還將聚類(lèi)方法應(yīng)用與該案例中,做到對(duì)結(jié)果進(jìn)行可視化分析,幫助讀者將理論知識(shí)貫穿于實(shí)踐中
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
目錄
第1章 實(shí)時(shí)數(shù)據(jù)流和聚類(lèi)方法的背景 1
1.1 實(shí)時(shí)數(shù)據(jù)流 1
1.1.1 實(shí)時(shí)數(shù)據(jù)流的定義 1
1.1.2 實(shí)時(shí)數(shù)據(jù)流的研究現(xiàn)狀 3
1.2 實(shí)時(shí)數(shù)據(jù)流聚類(lèi) 5
1.3 實(shí)時(shí)數(shù)據(jù)流分類(lèi) 6
1.3.1 Hoeffding樹(shù)算法 7
1.3.2 快速?zèng)Q策樹(shù) 8
1.3.3 概念自適應(yīng)快速?zèng)Q策樹(shù) 8
1.3.4 分類(lèi)器系綜 9
1.4 實(shí)時(shí)數(shù)據(jù)流頻繁模式挖掘 9
1.4.1 基于概率誤差區(qū)間 10
1.4.2 基于確定誤差區(qū)間 11
1.4.3 其他高效的挖掘算法 11
1.5 實(shí)時(shí)數(shù)據(jù)流關(guān)聯(lián)規(guī)則分析 11
1.5.1 多數(shù)據(jù)流的關(guān)聯(lián)度計(jì)算 12
1.5.2 多數(shù)據(jù)流的主分量計(jì)算 12
1.6 數(shù)據(jù)流挖掘應(yīng)用系統(tǒng)研究 12
第2章 基于衰減窗口與剪枝維度樹(shù)的數(shù)據(jù)流聚類(lèi) 14
2.1 聚類(lèi)技術(shù)簡(jiǎn)介 14
2.1.1 數(shù)據(jù)流聚類(lèi)常用技術(shù) 14
2.1.2 衰減窗口模型及衰減因子 16
2.1.3 基本概念與定義 17
2.2 算法整體描述 77
2.3 周期性剪枝策略 25
2.4 實(shí)時(shí)數(shù)據(jù)流在線(xiàn)聚類(lèi) 27
2.5 實(shí)驗(yàn)結(jié)果與分析 27
2.5.1 基于二維人工實(shí)時(shí)數(shù)據(jù)流的聚類(lèi)分析 28
2.5.2 二維人工實(shí)時(shí)數(shù)據(jù)流的演化 30
2.5.3 基于高維真實(shí)實(shí)時(shí)數(shù)據(jù)流的聚類(lèi)分析 32
2.5.4 周期性剪枝效果分析 35
第3章 實(shí)時(shí)數(shù)據(jù)流動(dòng)態(tài)模式發(fā)現(xiàn)與跟蹤方法 38
3.1 數(shù)據(jù)流模式簡(jiǎn)介 38
3.1.1 實(shí)時(shí)數(shù)據(jù)流模式演化分析 38
3.1.2 基本的概念與定義 40
3.2 算法框架 43
3.3 模式存儲(chǔ)結(jié)構(gòu)與模式快照策略 45
3.3.1 模式存儲(chǔ)結(jié)構(gòu) 45
3.3.2 模式快照策略 47
3.4 模式發(fā)現(xiàn)與跟蹤算法 48
3.5 實(shí)驗(yàn)結(jié)果與分析 51
3.5.1 基于二維人l:數(shù)據(jù)集的模式發(fā)現(xiàn)與跟蹤 51
3.5.2 真實(shí)數(shù)據(jù)集的模式發(fā)現(xiàn)跟蹤 53
3.5.3 實(shí)驗(yàn)相關(guān)參數(shù)選擇 55
第4章 增量式聚類(lèi)方法與網(wǎng)格劃分策略 57
4.1 增量式聚類(lèi)方法 58
4.2 網(wǎng)格劃分策略 59
4.2.1 不均勻網(wǎng)格劃分 59
4.2.2 均勻網(wǎng)格劃分 60
第5章 基于網(wǎng)格和密度維度樹(shù)的增量聚類(lèi)算法IGDStream 61
5.1 IGDStream算法主要思想 61
5.2 預(yù)測(cè)下一次聚類(lèi)的時(shí)刻 62
5.3 聚類(lèi)簇的變化 63
5.4 IGDStream算法整體框架 65
5.5 實(shí)驗(yàn)結(jié)果與效率分析 66
5.5.1 實(shí)驗(yàn)結(jié)果比較與分析 66
5.5.2 算法時(shí)問(wèn)性能分析 71
5.5.3 實(shí)驗(yàn)小結(jié) 72
第6章 基于密度維度樹(shù)的增量式網(wǎng)格聚類(lèi)算法IGDDT 73
6.1 問(wèn)題的提出 73
6.2 算法的基本思想 74
6.3 網(wǎng)格二次劃分與網(wǎng)格類(lèi)型的確定 75
6.3.1 網(wǎng)格二次劃分 75
6.3.2 網(wǎng)格類(lèi)型的確定 77
6.4 相鄰可聚類(lèi)區(qū)域的判斷算法 78
6.5 IGDDT算法整體框架 79
6.5.1 初始聚類(lèi)子算法 80
6.5.2 更新聚類(lèi)的算法 81
6.6 實(shí)驗(yàn)結(jié)果與分析 82
6.6.1 人工實(shí)時(shí)數(shù)據(jù)流聚類(lèi)演化過(guò)程分析 82
6.6.2 二維仿真數(shù)據(jù)集聚類(lèi)準(zhǔn)確率比較 85
6.6.3 不同規(guī)模的數(shù)據(jù)集聚類(lèi)速度比較 85
6.6.4 多維真實(shí)數(shù)據(jù)流的聚類(lèi)結(jié)果比較 86
第7章 基于距離和密度的實(shí)時(shí)數(shù)據(jù)流聚類(lèi)及其邊界檢測(cè)技術(shù)的研究 88
7.1 實(shí)時(shí)數(shù)據(jù)流聚類(lèi)的基本概念與定義 88
7.2 算法框架 93
7.3 實(shí)時(shí)數(shù)據(jù)流中數(shù)據(jù)信息的存儲(chǔ)和更新 96
7.4 基于網(wǎng)格方法的實(shí)時(shí)數(shù)據(jù)流聚類(lèi) 99
7.5 實(shí)時(shí)數(shù)據(jù)流的聚類(lèi)邊界檢測(cè) 100
7.6 實(shí)驗(yàn)結(jié)果與效率分析 101
7.6.1 實(shí)驗(yàn)結(jié)果比較與分析 102
7.6.2 算法時(shí)問(wèn)性能分析 107
7.6.3 實(shí)驗(yàn)小結(jié) 107
第8章 實(shí)時(shí)數(shù)據(jù)流在鋼鐵質(zhì)量監(jiān)控中的應(yīng)用 109
8.1 實(shí)時(shí)數(shù)據(jù)庫(kù) 110
8.1.1 實(shí)時(shí)數(shù)據(jù)庫(kù)的定義 110
8.1.2 PI系統(tǒng) 111
8.1.3 實(shí)時(shí)數(shù)據(jù)庫(kù)的應(yīng)用 112
8.2 鋼鐵產(chǎn)品生產(chǎn)過(guò)程實(shí)時(shí)監(jiān)控系統(tǒng)架構(gòu) 113
8.2.1 系統(tǒng)架構(gòu) 113
8.2.2 功能模塊 113
8.3 實(shí)時(shí)數(shù)據(jù)的采集 114
8.4 系統(tǒng)數(shù)據(jù)處理模塊的實(shí)現(xiàn) 115
8.4.1 PIBatch數(shù)據(jù)定時(shí)計(jì)算并導(dǎo)出 115
8.4.2 鋼卷PDI數(shù)據(jù)解包 115
8.5 實(shí)時(shí)數(shù)據(jù)流分析 116
8.5.1 工藝在線(xiàn)監(jiān)控及報(bào)警 116
8.5.2 實(shí)時(shí)數(shù)據(jù)流預(yù)處理 118
8.5.3 產(chǎn)品離線(xiàn)質(zhì)量分析 120
8.5.4 產(chǎn)品在線(xiàn)質(zhì)量判定 123
8.6 實(shí)時(shí)數(shù)據(jù)流聚類(lèi)方法的應(yīng)用 126
8.6.1 數(shù)據(jù)預(yù)處理 126
8.6.2 不同鋼種質(zhì)量分析 127
8.6.3 鋼卷關(guān)鍵工藝點(diǎn)的相互影響 128
8.6.4 班組對(duì)產(chǎn)品質(zhì)量的影響 129
8.6.5 單個(gè)鋼卷質(zhì)量分析 129
參考文獻(xiàn) 131
后記 138