網(wǎng)絡(luò)行為分析與網(wǎng)絡(luò)智慧治理
定 價(jià):41 元
- 作者:于洪濤
- 出版時(shí)間:2020/10/1
- ISBN:9787560657721
- 出 版 社:西安電子科技大學(xué)出版社
- 中圖法分類:C912.6
- 頁碼:272
- 紙張:膠版紙
- 版次:1
- 開本:16K
網(wǎng)絡(luò)空間一如物理世界,所有行為背后都可以看見人的影子,本書給出的即是一種網(wǎng)絡(luò)行為的洞察術(shù),書中具體研究網(wǎng)絡(luò)行為背后是誰、是何居心以及此行為有無規(guī)律、可否預(yù)測(cè)等的理論和方法。
本書共9章,在總體概論的基礎(chǔ)上,按照分析過程,對(duì)網(wǎng)絡(luò)行為數(shù)據(jù)獲取、數(shù)據(jù)聚合、數(shù)據(jù)處理、網(wǎng)絡(luò)用戶資源測(cè)繪、事件檢測(cè)與評(píng)估、事件溯源、行為預(yù)測(cè)等幾部分內(nèi)容進(jìn)行了體系化的講解,并給出了基于行為分析的網(wǎng)絡(luò)智慧治理方法。
本書例程翔實(shí),體系完整,既可作為大數(shù)據(jù)、人工智能、網(wǎng)絡(luò)空間安全領(lǐng)域的教材,也可作為網(wǎng)絡(luò)行為分析專業(yè)研究者的工具書和參考書。
善惡同源,駕之者勝。當(dāng)今世界,網(wǎng)絡(luò)已經(jīng)成為如同空氣和水一樣幾乎不可或缺的存在,同時(shí),網(wǎng)絡(luò)的虛擬性也使其成為各種惡行滋生泛濫的空間:騷擾、詐騙、謠言、虛假評(píng)論、不良信息、反動(dòng)宣傳、網(wǎng)絡(luò)滲透、網(wǎng)絡(luò)群體性事件、網(wǎng)絡(luò)病毒,凡此種種,危害百姓利益,破壞社會(huì)穩(wěn)定甚至威脅國家安全。習(xí)總書記指出,網(wǎng)絡(luò)空間天朗氣清、生態(tài)良好,符合人民利益。網(wǎng)絡(luò)空間的治理,不但需要全社會(huì)共同參與、共同努力,更需要技術(shù)手段的支撐和保障。網(wǎng)絡(luò)空間安全的重要性已為全社會(huì)所公認(rèn),相關(guān)理論與技術(shù)也全面開花、枝繁葉茂。
凡是行過,皆有痕跡。網(wǎng)絡(luò)世界,縱然表象繁雜繚亂,技術(shù)五花八門,其深層的背后仍然是物理世界鮮活的人,因而其本質(zhì)與物理世界并無二致,“行”則有“痕”,透過“痕”則可以看清人。網(wǎng)絡(luò)空間的“行”即網(wǎng)絡(luò)行為,其“痕”即為網(wǎng)絡(luò)行為數(shù)據(jù)。網(wǎng)絡(luò)行為既是網(wǎng)絡(luò)世界的重要組成部分,也是網(wǎng)絡(luò)世界存在的理由。網(wǎng)絡(luò)空間自身構(gòu)成虛擬世界,但是由于網(wǎng)絡(luò)背后的主角和驅(qū)動(dòng)力是人,因而其必定與物理世界建立連接,構(gòu)成廣義上的網(wǎng)絡(luò)空間。在廣義的網(wǎng)絡(luò)空間中,從衣食住行到精神需求甚至于其他的方方面面,物理世界的人都可以通過具體的網(wǎng)絡(luò)行為得到解決和滿足。通過對(duì)這些行為數(shù)據(jù)的分析,不難理解行為者的動(dòng)機(jī),甚至可以通過歷史規(guī)律的分析對(duì)未來行為進(jìn)行預(yù)測(cè),這就是網(wǎng)絡(luò)行為分析的初衷。網(wǎng)絡(luò)行為分析技術(shù)近年來蓬勃發(fā)展,已發(fā)展成為網(wǎng)絡(luò)空間安全的重要支撐。
有道無術(shù),術(shù)尚可求;有術(shù)無道,止于術(shù)。網(wǎng)絡(luò)分析技術(shù)的快速發(fā)展急需與之相適應(yīng)的科學(xué)理論,然而截至目前,尚缺乏全面、統(tǒng)一的網(wǎng)絡(luò)行為分析專著。我們?cè)诮陙淼捻?xiàng)目實(shí)踐和學(xué)術(shù)研究中發(fā)現(xiàn),網(wǎng)絡(luò)大數(shù)據(jù)及人工智能的很多應(yīng)用及研究雖名目各異,然本質(zhì)和方法上殊途同歸,深感統(tǒng)一論述之必要;诮y(tǒng)一論述的初衷,本書搜聚當(dāng)前最熱點(diǎn)的網(wǎng)絡(luò)行為分析類應(yīng)用,以它們?yōu)槠鹗佳芯繉?duì)象,針對(duì)它們做共性分析,建立網(wǎng)絡(luò)行為分析技術(shù)的基本概念和框架,進(jìn)而按照網(wǎng)絡(luò)行為分析的過程,從行為數(shù)據(jù)獲取、數(shù)據(jù)聚合、數(shù)據(jù)處理、網(wǎng)絡(luò)用戶資源測(cè)繪、事件檢測(cè)與評(píng)估、事件溯源、行為預(yù)測(cè)等幾方面進(jìn)行了體系化的講解,最后給出了基于網(wǎng)絡(luò)行為分析的網(wǎng)絡(luò)智慧治理方法。
兵無常法,水無常形,運(yùn)用之妙,存乎一心。本書重點(diǎn)講述關(guān)于行為分析的技術(shù)體系、技術(shù)原理及技術(shù)應(yīng)用方法,但要正確分析網(wǎng)絡(luò)行為,僅限于此是遠(yuǎn)遠(yuǎn)不夠的。技術(shù)乃良工之利器,其重要性毋庸置疑,不過任何技術(shù)都不是萬能仙丹,一試必靈,必須認(rèn)真考察應(yīng)用場(chǎng)景對(duì)技術(shù)的選擇性以及技術(shù)針對(duì)應(yīng)用場(chǎng)景的主動(dòng)適應(yīng),尤其網(wǎng)絡(luò)行為分析,其背后是復(fù)雜的、活生生的人!爸芄謶至餮匀眨趺еt恭未篡時(shí)”說的就是識(shí)人之難。對(duì)網(wǎng)絡(luò)行為分析來說,除了識(shí)人本難,需要從人性角度進(jìn)行考察外,還要加上前置環(huán)節(jié),即行為數(shù)據(jù)的選取難。人類沒有上帝視角,永遠(yuǎn)無法得到全要素、全周期的行為數(shù)據(jù),選取數(shù)據(jù)時(shí),必須擺脫無關(guān)及偽劣數(shù)據(jù)的牽制、迷惑和干擾,否則如同緣木求魚,結(jié)論可能與真相差之千里?梢哉f,行為數(shù)據(jù)選擇的代表性和準(zhǔn)確性很大程度上決定了行為分析的有效性。
本書的內(nèi)容組織和形式設(shè)計(jì),試圖以身邊的熱點(diǎn)應(yīng)用為起點(diǎn),以容易理解的方式引導(dǎo)讀者建立關(guān)于行為分析的整體概念,包括通用定義和理論框架,進(jìn)而以具體的例程貫穿行為分析各個(gè)環(huán)節(jié)的講解,以幫助讀者對(duì)照概念開展實(shí)操以深化理解。其中,全書的章節(jié)內(nèi)容規(guī)劃和整體統(tǒng)籌由于洪濤負(fù)責(zé),第1章由于洪濤、吳翼騰編寫,第2、4章由李邵梅編寫,第3、8章由吳翼騰編寫,第5章由黃瑞陽、李倩編寫,第6章由吳翼騰、曲強(qiáng)編寫,第7章由吳錚、丁悅航編寫,第9章由曲強(qiáng)編寫。另外,趙秀明、胡新棒、鄭洪浩、李繼中等為本書的繪圖、審校、排版付出了大量心血,在此特真誠感謝他們的辛苦付出和認(rèn)真態(tài)度。
本書終于能夠付諸出版,感觸良多,我要感謝所有給予我智慧的偉大的學(xué)者們,還要感謝職業(yè)生涯中給予我真誠的幫助、啟發(fā)以及值得回憶和自省的人和事。特別地:
感謝已去世多年的父親,他曾經(jīng)當(dāng)過多年的村支書,沉默寡言,很少過問我的學(xué)習(xí)和工作,但是他說過的一句話讓我永生難忘,那就是在他供我們姐弟幾個(gè)上學(xué)、遭遇親鄰不解甚至嘲諷時(shí)說的“砸鍋賣鐵也要供孩子們上學(xué)”。正是這句話讓我們姐弟幾個(gè)都走出農(nóng)門、接受了高等教育,也正是這句話,讓他負(fù)債勞累多年,卻幾乎沒有享受過生活。父親,我時(shí)常在夢(mèng)中看到您慈祥的微笑!
感謝我的母親,她只是一個(gè)普通的農(nóng)民,幾乎沒有接受過什么教育,但她是十里八村有名的記憶力好、識(shí)字多的人。在她八十多歲的時(shí)候,仍然會(huì)偶爾戴上老花鏡顫顫巍巍地給孫女寫上一兩句祝福的話,也會(huì)在遇到不認(rèn)識(shí)的字時(shí)向別人虛心請(qǐng)教。她有著那個(gè)年代婦女共有的勤勞能干的品質(zhì),而且富有生活智慧,印象中當(dāng)年她總能把貧窮的家打理得整潔溫馨。她常常會(huì)用“但做好事莫問前程”之類的俗語,告訴我們做個(gè)好人,做個(gè)善良的人。母親很寬容,對(duì)所有的人,其中也包括我,她從不計(jì)較我沒在她膝前盡孝。今年疫情期間母親不幸離世,即使在她生命最后的時(shí)間里,仍然時(shí)常催我早點(diǎn)回單位,好好工作。寸草之心,何以報(bào)母愛春暉!
在此特別感謝我的三個(gè)姐姐,這些年來,她們毫無怨言、默默付出,照顧父親母親,總是告訴我不用牽掛家里,又時(shí)常提醒我工作的時(shí)候要?jiǎng)谝萁Y(jié)合、保重身體。有她們?cè)冢矣幸环N一直沒有長大的錯(cuò)覺,不用操心家里的事,也沒有在父母前盡到我的孝心。她們的愛如冬日暖陽,溫柔和煦。我只想在此告訴她們,我一直幸運(yùn)于做她們的弟弟!
衷心感謝我的愛人,她在兢兢業(yè)業(yè)完成自己工作的同時(shí),無私地操持著全家的衣食起居,默默承擔(dān)著單調(diào)、枯燥、瑣碎的家務(wù)勞動(dòng)。她一直包容我的缺點(diǎn),還用實(shí)際行動(dòng)理解并支持我的工作,會(huì)在我忙得暈頭轉(zhuǎn)向的時(shí)候提醒我給母親打電話、陪母親嘮嘮家常,也會(huì)在我苦惱煩躁時(shí)給予我耐心的傾聽和安慰,還會(huì)在很多問題上與我交流看法,從新的視角給我中肯的建議、啟發(fā)性的思路甚至完美的答案。她的鼓勵(lì)和支持,是我完成此書最大的動(dòng)力!
感謝我的女兒,她很小就獨(dú)自踏上異國求學(xué)之路,用瘦小柔弱的肩膀扛下了一個(gè)人在外的生活和學(xué)習(xí)壓力。尤其是2020年的新冠疫情期間,她自己謀劃、克服重重阻力,輾轉(zhuǎn)第三國回到澳大利亞,并且在澳大利亞疫情爆發(fā)后,一邊堅(jiān)持學(xué)業(yè),一邊“深挖洞、廣積糧”,整個(gè)過程,讓我見識(shí)并且感動(dòng)于她的獨(dú)立、努力和堅(jiān)強(qiáng)。自強(qiáng)者,人恒強(qiáng)之,謹(jǐn)以此書與她共勉!
感謝西安電子科技大學(xué)出版社的李惠萍老師,她熱情地支持我編寫此書,且在寫作過程中給予我不厭其煩的悉心指導(dǎo)。
由于作者水平有限,書中難免存在不足與紕漏之處,敬請(qǐng)廣大讀者不吝指正。
第1章 網(wǎng)絡(luò)行為分析概述 1
1.1 引言 1
1.2 網(wǎng)絡(luò)行為分析的基本概念和實(shí)現(xiàn)過程 2
1.3 網(wǎng)絡(luò)行為分析的八類熱點(diǎn)應(yīng)用 3
1.3.1 用戶行為數(shù)據(jù)聚合 3
1.3.2 社交網(wǎng)絡(luò)群體發(fā)現(xiàn) 5
1.3.3 網(wǎng)絡(luò)機(jī)器人行為分析與異常檢測(cè) 7
1.3.4 信息傳播建模 8
1.3.5 入侵檢測(cè) 9
1.3.6 用戶畫像 9
1.3.7 推薦系統(tǒng) 11
1.3.8 點(diǎn)擊率預(yù)測(cè) 12
1.4 網(wǎng)絡(luò)行為分析的共性方法 13
1.4.1 基于結(jié)構(gòu)化屬性信息的方法 14
1.4.2 基于文本信息的方法 14
1.4.3 基于圖像信息的方法 15
1.4.4 基于網(wǎng)絡(luò)結(jié)構(gòu)信息的方法 16
1.4.5 基于軌跡信息的方法 16
1.5 常用方法對(duì)比分析 17
1.5.1 行為分析方法的實(shí)現(xiàn)過程 18
1.5.2 特征建模的有效性和可解釋性 18
1.5.3 機(jī)器學(xué)習(xí)模型的安全性 19
1.5.4 機(jī)器學(xué)習(xí)方法對(duì)計(jì)算資源的
依賴性 20
1.6 網(wǎng)絡(luò)行為分析與網(wǎng)絡(luò)智慧治理 20
本章小結(jié) 22
本章參考文獻(xiàn) 23
第2章 網(wǎng)絡(luò)空間行為分析數(shù)據(jù)采集技術(shù) 24
2.1 基于爬蟲的網(wǎng)絡(luò)數(shù)據(jù)采集 24
2.1.1 靜態(tài)頁面的數(shù)據(jù)爬取 25
2.1.2 動(dòng)態(tài)頁面的數(shù)據(jù)爬取 28
2.1.3 滑塊驗(yàn)證登錄 33
2.1.4 字體二次編碼 41
2.1.5 Scrapy爬蟲簡介 47
2.1.6 基于Scrapy-Redis的分布式爬蟲 52
2.2 網(wǎng)站分析數(shù)據(jù)的采集 56
2.2.1 基于Web日志的采集方式 56
2.2.2 基于JavaScript標(biāo)記的方式 57
2.2.3 基于第三方平臺(tái)的網(wǎng)站數(shù)據(jù)
采集方式 59
2.3 全量流量采集 61
2.3.1 基于SNMP的流量采集 61
2.3.2 基于端口鏡像的流量采集 62
2.3.3 基于探針的流量采集 63
2.3.4 基于分光器的流量采集 63
2.3.5 基于NetFlow的流量采集 64
2.3.6 基于sFlow的流量采集 65
本章小結(jié) 66
本章參考文獻(xiàn) 66
第3章 網(wǎng)絡(luò)空間行為數(shù)據(jù)聚合技術(shù) 67
3.1 用戶行為數(shù)據(jù)聚合的基本概念 67
3.1.1 問題描述 69
3.1.2 技術(shù)框架 70
3.1.3 相似度計(jì)算 71
3.1.4 賬號(hào)匹配 74
3.1.5 評(píng)價(jià)指標(biāo) 78
3.2 基于網(wǎng)絡(luò)結(jié)構(gòu)信息的行為數(shù)據(jù)
聚合技術(shù) 79
3.2.1 基于隱藏標(biāo)簽節(jié)點(diǎn)挖掘的方法 80
3.2.2 基于網(wǎng)絡(luò)表示學(xué)習(xí)的方法 84
3.3 基于屬性文本信息的行為
數(shù)據(jù)聚合技術(shù) 88
3.3.1 基于屬性信息熵權(quán)決策的方法 89
3.3.2 基于模糊積分的屬性文本
信息融合方法 92
3.4 基于用戶軌跡信息的行為
數(shù)據(jù)聚合技術(shù) 97
3.4.1 基于軌跡位置訪問順序特征的
方法 97
3.4.2 基于時(shí)空軌跡順序特征表示的
方法 103
本章小結(jié) 108
本章參考文獻(xiàn) 108
第4章 網(wǎng)絡(luò)行為數(shù)據(jù)的提取、處理和管理 109
4.1 網(wǎng)絡(luò)協(xié)議解析 109
4.1.1 pcap文件格式 109
4.1.2 基于WireShark的網(wǎng)絡(luò)協(xié)議解析 111
4.1.3 基于Scapy的網(wǎng)絡(luò)協(xié)議解析 115
4.2 數(shù)據(jù)清洗 116
4.2.1 去除/填充有缺失的數(shù)據(jù) 117
4.2.2 邏輯錯(cuò)誤清洗 119
4.2.3 關(guān)聯(lián)性驗(yàn)證 119
4.3 特征數(shù)據(jù)的處理 120
4.3.1 定性特征的處理方法 120
4.3.2 時(shí)間型特征的處理方法 122
4.3.3 文本型特征的處理方法 122
4.3.4 組合特征分析 123
4.4 特征選取 124
4.4.1 過濾式(Filter) 124
4.4.2 包裹式(Wrapper) 125
4.4.3 嵌入式(Embedded) 125
4.5 網(wǎng)絡(luò)行為分析的特征提取案例 126
4.5.1 數(shù)據(jù)理解與分析 126
4.5.2 特征預(yù)處理 128
4.5.3 特征聯(lián)想 128
4.5.4 特征提取 130
4.5.5 特征選擇 131
4.6 用戶行為特征管理 131
4.6.1 存儲(chǔ)機(jī)制 131
4.6.2 查詢機(jī)制 133
4.6.3 定時(shí)更新機(jī)制 134
本章小結(jié) 136
本章參考文獻(xiàn) 136
第5章 基于行為分析的網(wǎng)絡(luò)用戶資源測(cè)繪 137
5.1 全局性網(wǎng)絡(luò)用戶資源測(cè)繪 137
5.1.1 用戶通聯(lián)網(wǎng)絡(luò)的構(gòu)建 138
5.1.2 用戶通聯(lián)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)分析 139
5.1.3 用戶通聯(lián)網(wǎng)絡(luò)抗毀性分析 141
5.1.4 用戶群組發(fā)現(xiàn) 145
5.2 用戶個(gè)性化深度測(cè)繪 147
5.2.1 通信用戶多維度特征建模 147
5.2.2 通信用戶畫像構(gòu)建技術(shù) 151
本章小結(jié) 153
本章參考文獻(xiàn) 154
第6章 事件檢測(cè)與事件狀態(tài)評(píng)估 155
6.1 網(wǎng)絡(luò)輿情事件檢測(cè) 155
6.1.1 虛假內(nèi)容檢測(cè) 156
6.1.2 水軍賬戶檢測(cè) 160
6.1.3 新興事件檢測(cè) 162
6.2 事件狀態(tài)評(píng)估 163
6.2.1 突發(fā)事件分析 164
6.2.2 電信詐騙分析 164
6.2.3 輿情事件分析 166
6.2.4 事件狀態(tài)評(píng)估的層次分析法 168
本章小結(jié) 173
本章參考文獻(xiàn) 173
第7章 網(wǎng)絡(luò)事件溯源 174
7.1 圖像視頻理解 174
7.1.1 基于特征的圖像理解方法 175
7.1.2 深度學(xué)習(xí)方法生成圖像描述 178
7.1.3 行人身份識(shí)別 181
7.1.4 視頻理解 194
7.2 單一自媒體事件信息溯源 195
7.2.1 微博類信息溯源的概念 195
7.2.2 影響力計(jì)算及意見領(lǐng)袖發(fā)現(xiàn) 196
7.2.3 微博類信息傳播模型 197
7.2.4 微博類信息溯源的方法分類 197
7.3 多源媒體事件信息溯源 201
7.3.1 多源媒體信息溯源的概念 201
7.3.2 多源媒體信息的統(tǒng)一表達(dá) 201
7.3.3 多源媒體信息的聯(lián)合溯源方法 202
本章小結(jié) 204
本章參考文獻(xiàn) 204
第8章 網(wǎng)絡(luò)用戶行為預(yù)測(cè) 205
8.1 鏈路預(yù)測(cè)技術(shù) 205
8.1.1 鏈路預(yù)測(cè)方法概述 206
8.1.2 基于靜態(tài)信息的鏈路預(yù)測(cè)技術(shù) 211
8.1.3 基于時(shí)序信息的鏈路預(yù)測(cè)技術(shù) 216
8.2 消費(fèi)行為預(yù)測(cè)和消息精準(zhǔn)推送 221
8.2.1 消費(fèi)預(yù)測(cè)和消息推送的
協(xié)同推薦技術(shù)概述 222
8.2.2 以用戶為中心的協(xié)同推薦技術(shù) 226
8.2.3 以項(xiàng)目為中心的協(xié)同推薦技術(shù) 231
本章小結(jié) 236
本章參考文獻(xiàn) 236
第9章 網(wǎng)絡(luò)空間智慧治理 237
9.1 柔性治理技術(shù) 238
9.1.1 誘導(dǎo)圖片生成 239
9.1.2 誘導(dǎo)文本生成 243
9.1.3 誘導(dǎo)音視頻生成 249
9.1.4 誘導(dǎo)網(wǎng)絡(luò)生成 252
9.1.5 柔性治理技術(shù)小結(jié) 254
9.2 剛性治理技術(shù) 254
9.2.1 小范圍隔離治理 255
9.2.2 大范圍阻斷治理 256
本章小結(jié) 257
本章參考文獻(xiàn) 257