大數(shù)據(jù)安全治理與防范——網(wǎng)址反欺詐實戰(zhàn)
定 價:79.8 元
- 作者:張凱 牛亞峰 等
- 出版時間:2023/9/1
- ISBN:9787115622389
- 出 版 社:人民郵電出版社
- 中圖法分類:TP274
- 頁碼:202
- 紙張:
- 版次:01
- 開本:16開
互聯(lián)網(wǎng)的快速發(fā)展,在方便用戶信息傳遞的過程中,也使大量犯罪活動從線下向線上轉移,黑灰產(chǎn)常常通過搭建和傳播欺詐、賭博、色情等惡意網(wǎng)站來牟取暴利。為了凈化網(wǎng)絡環(huán)境,必須加大對惡意網(wǎng)站的檢測和攔截。
本書主要介紹惡意網(wǎng)址的欺詐手段和對抗技術。本書分為5個部分,共11章。針對網(wǎng)址反欺詐這一領域,首先介紹萬維網(wǎng)的起源、工作原理和發(fā)展歷程;其次通過列舉常見的惡意網(wǎng)站,讓讀者了解網(wǎng)址反欺詐面臨的主要問題;然后講解網(wǎng)址基礎數(shù)據(jù)、數(shù)據(jù)治理和特征工程;接著介紹包含網(wǎng)址結構、文本、圖像、復雜網(wǎng)絡在內(nèi)的一系列對抗方法和實戰(zhàn)案例;最后介紹網(wǎng)址運營體系和網(wǎng)址知識情報挖掘及應用。本書將理論與實踐相結合,幫助讀者了解和掌握網(wǎng)址安全相關知識體系,也能幫助讀者培養(yǎng)從0到1搭建網(wǎng)址反欺詐體系的能力。無論是初級信息安全從業(yè)者,還是有志于從事信息安全方向的在校學生,都會在閱讀中受益匪淺。
1.專業(yè)性:由在互聯(lián)網(wǎng)安全領域有豐富經(jīng)驗和技能的騰訊專家工程師親筆撰寫,他們的知識和經(jīng)驗是這本書的寶貴財富。他們的專業(yè)性和技術實力使得這本書成為讀者了解和掌握網(wǎng)址安全的重要參考。
2.實戰(zhàn)性:本書注重實戰(zhàn),書中包含了大量的網(wǎng)址反欺詐實戰(zhàn)案例和干貨,讀者可以通過這些案例和干貨了解和掌握網(wǎng)址安全的實踐技巧和策略。
3.全面性:從萬維網(wǎng)的起源、工作原理和發(fā)展歷程講起,然后列舉常見的惡意網(wǎng)站,讓讀者了解網(wǎng)址反欺詐面臨的主要問題。接下來,將講解網(wǎng)址基礎數(shù)據(jù)、數(shù)據(jù)治理和特征工程,然后介紹包含網(wǎng)址結構、文本、圖像、復雜網(wǎng)絡在內(nèi)的一系列對抗方法和實戰(zhàn)案例,最后介紹網(wǎng)址運營體系和網(wǎng)址知識情報挖掘及應用。這是一個完整的系統(tǒng)性的講解,將幫助讀者全面了解和掌握網(wǎng)址安全的相關知識。
4.創(chuàng)新性:本書是市面上有關網(wǎng)址安全的業(yè)務實戰(zhàn)級指導圖書之一,來自于互聯(lián)網(wǎng)一線大廠多年網(wǎng)址反欺詐對抗風控經(jīng)驗總結,作者們將高科技從業(yè)人員在網(wǎng)址安全領域的新技術、工具和實踐經(jīng)驗融入其中,以清晰、易懂的方式向讀者展示網(wǎng)址安全的各個方面。此外,書中還提供了大量的實戰(zhàn)案例和技術細節(jié),讓讀者能夠更好地理解并應用所學知識。
張凱,現(xiàn)任騰訊專家工程師。一直從事大數(shù)據(jù)安全方面的工作,積累了10多年的黑灰產(chǎn)對抗經(jīng)驗,主要參與過游戲安全對抗、業(yè)務防刷、金融風控和反詐騙對抗系統(tǒng)等項目。
牛亞峰,現(xiàn)任騰訊高級工程師。一直從事黑灰產(chǎn)對抗業(yè)務方面的工作,參與過反洗錢、支付反欺詐、電信反詐、網(wǎng)址反欺詐等項目。
張旭,現(xiàn)任騰訊高級工程師。主要從事大數(shù)據(jù)下黑灰產(chǎn)安全對抗業(yè)務、反詐騙對抗系統(tǒng)開發(fā)方面的工作。曾參與中國信息通信研究院《電話號碼標記應用技術要求》行業(yè)標準制定,并為《電信網(wǎng)絡詐騙治理與人工智能應用白皮書》提供行業(yè)技術支持。
甘曉華,現(xiàn)任騰訊高級工程師。主要從事金融風控、黑灰產(chǎn)對抗等業(yè)務安全方面的相關工作。
熊奇,現(xiàn)任騰訊專家工程師。一直從事業(yè)務安全方面的工作,先后參與過反詐騙、App安全、金融反詐和安全大數(shù)據(jù)合規(guī)與業(yè)務風控等項目,積累了15年的黑灰產(chǎn)對抗和安全系統(tǒng)架構的經(jīng)驗。
目 錄
第 1部分 網(wǎng)址大數(shù)據(jù)安全基礎
第 1章 緒論 2
1.1 萬維網(wǎng)的起源 2
1.1.1 萬維網(wǎng)的發(fā)明 3
1.1.2 萬維網(wǎng)的關鍵技術 3
1.1.3 萬維網(wǎng)的影響 6
1.2 萬維網(wǎng)的工作原理 6
1.2.1 網(wǎng)站開發(fā) 8
1.2.2 網(wǎng)站部署 9
1.2.3 網(wǎng)站解析 10
1.2.4 網(wǎng)站渲染 11
1.3 萬維網(wǎng)風控發(fā)展歷程 13
1.3.1 專家規(guī)則 14
1.3.2 機器學習模型 14
1.3.3 深度學習模型 14
1.3.4 圖神經(jīng)網(wǎng)絡模型 15
1.4 萬維網(wǎng)安全風控架構 16
1.5 小結 18
第 2部分 黑灰產(chǎn)洞察
第 2章 網(wǎng)絡黑灰產(chǎn)及其危害 20
2.1 詐騙類網(wǎng)站 20
2.1.1 投資理財類 21
2.1.2 貸款、代辦信用卡類 24
2.1.3 刷單返利類 25
2.1.4 仿冒平臺類 26
2.1.5 虛假交易類 29
2.1.6 虛假征信類 29
2.2 網(wǎng)絡賭博類網(wǎng)站 30
2.3 低俗色情類網(wǎng)站 32
2.4 盜號釣魚類網(wǎng)站 33
2.5 木馬病毒類網(wǎng)站 34
2.6 盜版侵權類網(wǎng)站 35
2.7 惡意刷量類網(wǎng)站 36
2.8 虛假廣告類網(wǎng)站 37
2.9 小結 38
第3部分 網(wǎng)址大數(shù)據(jù)治理與異常數(shù)據(jù)發(fā)現(xiàn)
第3章 網(wǎng)址數(shù)據(jù)治理與特征工程 40
3.1 網(wǎng)址基礎數(shù)據(jù) 40
3.1.1 資源定位符信息 41
3.1.2 域名IP地址 42
3.1.3 Whois注冊 42
3.1.4 ICP備案 43
3.1.5 Alexa排名 43
3.1.6 跳轉關系 44
3.1.7 頁面內(nèi)容 45
3.2 網(wǎng)址數(shù)據(jù)治理 45
3.2.1 數(shù)據(jù)采集 46
3.2.2 數(shù)據(jù)清洗 46
3.2.3 數(shù)據(jù)存儲 47
3.2.4 數(shù)據(jù)計算 48
3.3 網(wǎng)址特征工程 49
3.3.1 特征編碼與嵌入 49
3.3.2 特征挖掘 50
3.3.3 特征評估 51
3.4 小結 52
第4章 網(wǎng)址異常檢測體系 53
4.1 流量模型 54
4.2 傳播渠道模型 55
4.3 網(wǎng)站行為模型 57
4.4 時間序列模型 59
4.5 網(wǎng)址關系鏈模型 60
4.6 小結 62
第4部分 網(wǎng)址反欺詐檢測模型
第5章 網(wǎng)址結構檢測模型 64
5.1 網(wǎng)頁結構基礎 64
5.1.1 網(wǎng)頁核心構成 65
5.1.2 資源列表結構 69
5.1.3 網(wǎng)站目錄結構 71
5.1.4 惡意代碼片段 72
5.2 網(wǎng)頁指紋算法流程 75
5.3 生成網(wǎng)頁指紋 76
5.3.1 網(wǎng)頁預處理 76
5.3.2 指紋生成算法的選型 78
5.4 構建異常指紋庫 79
5.5 指紋相似度算法 81
5.6 小結 82
第6章 網(wǎng)址文本檢測模型 83
6.1 網(wǎng)址文本數(shù)據(jù) 83
6.2 常見惡意網(wǎng)址文本 86
6.3 敏感詞規(guī)則模型 88
6.3.1 敏感詞發(fā)現(xiàn) 90
6.3.2 敏感詞規(guī)則 91
6.4 文本聚類模型 92
6.4.1 惡意種子擴散案例 92
6.4.2 新型惡意網(wǎng)址發(fā)現(xiàn)案例 95
6.5 文本分類模型 97
6.5.1 文本二分類算法 99
6.5.2 文本多分類算法 101
6.6 小結 104
第7章 網(wǎng)址圖像檢測模型 105
7.1 圖像提取與預處理 105
7.1.1 圖像提取 106
7.1.2 圖像預處理 109
7.1.3 圖像數(shù)據(jù)集 111
7.2 圖像分類模型 112
7.2.1 數(shù)據(jù)準備 112
7.2.2 模型訓練 114
7.2.3 訓練加速 117
7.2.4 預測與可解釋性 118
7.3 圖像相似度方法 119
7.3.1 相似度計算 120
7.3.2 擴散方法 121
7.3.3 檢索方法 123
7.4 圖像目標檢測方法 124
7.4.1 模型訓練 124
7.4.2 模型預測 126
7.5 小結 129
第8章 網(wǎng)址復雜網(wǎng)絡檢測模型 130
8.1 網(wǎng)址復雜網(wǎng)絡的構建 130
8.1.1 網(wǎng)絡的節(jié)點 130
8.1.2 網(wǎng)絡的邊 134
8.2 網(wǎng)址復雜網(wǎng)絡的節(jié)點預測 138
8.2.1 預訓練文本模型對網(wǎng)絡節(jié)點的預測 139
8.2.2 預訓練圖像模型對網(wǎng)絡節(jié)點的預測 140
8.2.3 預訓練指紋模型對網(wǎng)絡節(jié)點的預測 141
8.2.4 預訓練DNN模型對網(wǎng)絡節(jié)點的預測 142
8.2.5 預訓練多模態(tài)模型對網(wǎng)絡節(jié)點的預測 143
8.3 網(wǎng)址復雜網(wǎng)絡的關系應用 144
8.3.1 歸屬與包含關系的應用 144
8.3.2 聚集關系的應用 145
8.3.3 引用關系的應用 147
8.3.4 跳轉關系的應用 149
8.4 網(wǎng)址復雜網(wǎng)絡的綜合應用 151
8.4.1 圖神經(jīng)網(wǎng)絡算法 151
8.4.2 社區(qū)劃分算法 156
8.5 小結 158
第9章 網(wǎng)址多模態(tài)檢測模型 159
9.1 特征融合 161
9.1.1 直接融合 161
9.1.2 無監(jiān)督融合 164
9.1.3 有監(jiān)督融合 167
9.2 決策融合 169
9.2.1 模型集成 169
9.2.2 分層篩選 170
9.3 協(xié)同訓練 172
9.4 小結 174
第5部分 網(wǎng)址運營與情報體系
第 10章 網(wǎng)址運營體系 176
10.1 穩(wěn)定性運營 177
10.1.1 在線服務 177
10.1.2 網(wǎng)址黑庫 180
10.1.3 特征模型 181
10.2 防誤報運營 182
10.2.1 白保護名單 182
10.2.2 防誤報監(jiān)控 184
10.2.3 自動化處置 185
10.3 用戶反饋運營 186
10.3.1 網(wǎng)址申訴 187
10.3.2 網(wǎng)址舉報 188
10.3.3 故障反饋 189
10.4 分級告警體系 190
10.5 小結 190
第 11章 網(wǎng)址知識情報挖掘及應用 191
11.1 黑灰產(chǎn)團伙資源情報挖掘 191
11.1.1 網(wǎng)址類資源挖掘 191
11.1.2 賬號類資源挖掘 195
11.2 黑產(chǎn)入侵網(wǎng)站情報挖掘 196
11.2.1 HTML源文件分析法 196
11.2.2 網(wǎng)址關系鏈分析法 198
11.3 惡意網(wǎng)址服務商情報挖掘 200
11.3.1 內(nèi)容服務商 200
11.3.2 支付服務商 201
11.4 小結 202