本書全面地介紹了網絡表示學習的基本概念、模型和應用。本書從網絡嵌入的背景和興起開始介紹,為讀者提供一個整體的描述;通過對多個代表性方法的介紹,闡述了網絡嵌入技術的發(fā)展和基于矩陣分解的統(tǒng)一網絡嵌入框架;提出了結合附加信息的網絡嵌入方法——結合圖中節(jié)點屬性/內容/標簽的網絡嵌入;面向不同特性圖結構的網絡嵌入方法——面向具有社區(qū)結構的/大規(guī)模的/異質圖結構的網絡嵌入。本書還進一步介紹了網絡嵌入的不同應用,如推薦場景和信息擴散預測。本書的最后總結了這些方法和應用,并展望了未來的研究方向。
1.全面揭秘網絡表示學習:詳細探討網絡嵌入技術的各個層面,從基本概念到各種創(chuàng)新方法,讓您全面了解網絡表示學習的理論和實踐,幫助您構建完整的知識體系。
2.杰出作者團隊:作者是清華大學計算機科學系的研究團隊,在網絡嵌入學習、社會計算、自然語言處理等領域擁有深厚的研究背景和豐富的實踐經驗。
3.深度解讀網絡嵌入應用:不僅介紹了網絡嵌入的基本框架和方法,還進一步解析了網絡嵌入在實際生活中的應用場景,如推薦系統(tǒng)設計和信息傳播預測等,讓您更深入地了解網絡嵌入技術的實用價值。
4.高品質全彩印刷:本書采用全彩印刷,精美的設計及高質量的輸出,讓您在閱讀的過程中享受視覺的盛宴。
楊成,北京郵電大學計算機學院副教授。他分別于 2014 年和 2019 年獲得清華大學計算機科學專業(yè)學士學位和博士學位。其研究方向包括網絡表示學習、社會計算和自然語言處理,在 IJCAI、ACL、ACM TOIS、IEEE TKDE 等top級會議和期刊上發(fā)表論文四十余篇,谷歌學術引用近四千次。
劉知遠,清華大學計算機科學與技術系副教授。他分別于在 2006 年和 2011 年獲得清華大學計算機科學與技術專業(yè)學士和博士學位。研究方向是自然語言處理和社會計算,在國際期刊和 IJCAI、AAAI、ACL、EMNLP 等會議上發(fā)表了六十余篇論文,谷歌學術應用量超過一萬次。
涂存超,清華大學計算機科學與技術系博士后。他分別于 2013 年和 2018 年獲得清華大學計算機科學與技術專業(yè)學士和博士學位。其研究方向包括網絡表示學習、社會計算和法律智能,在 IEEE TKDE、AAAI、ACL、EMNLP 等國際期刊和會議上發(fā)表論文二十余篇。
石川,北京郵電大學計算機學院教授。其主要研究方向包括數據挖掘、機器學習和大數據分析。在數據挖掘方面的top級期刊和會議,如 IEEE TKDE、ACM TIST、KDD、WWW、AAAI 和 IJCAI 等,發(fā)表了相關論文一百余篇。
孫茂松,清華大學計算機科學與技術系教授,清華大學人工智能研究院常務副院長。其研究方向包括自然語言處理、互聯網智能、機器學習、社會計算和計算教育學,在各種top級會議和期刊上發(fā)表論文二百余篇,谷歌學術引用量超 1.5 萬次,并于 2020 年當選歐洲科學院外籍院士。
第 一部分 網絡嵌入介紹
第 1 章 網絡嵌入基礎 3
1.1 背景 3
1.2 網絡嵌入的興起 4
1.3 網絡嵌入的評估 5
1.3.1 節(jié)點分類 6
1.3.2 鏈接預測 6
1.3.3 節(jié)點聚類 6
第 2 章 一般圖的網絡嵌入 9
2.1 代表性方法 9
2.1.1 早期工作 (約 2001~2013) 9
2.1.2 近期工作(2014 至今) 10
2.2 理論:一種統(tǒng)一的網絡嵌入框架 13
2.2.1 k 階鄰近度 13
2.2.2 網絡表示學習框架 14
2.2.3 對比觀察 16
2.3 方法:網絡嵌入更新 17
2.3.1 問題形式化 17
2.3.2 近似算法 18
2.4 實驗 19
2.4.1 數據集 19
2.4.2 基線方法和實驗設置 20
2.4.3 多標簽分類 21
2.4.4 鏈接預測 22
2.4.5 實驗分析 22
2.5 擴展閱讀 23
第二部分 結合附加信息的網絡嵌入
第 3 章 結合節(jié)點屬性的網絡嵌入 27
3.1 概述 27
3.2 方法: 文本輔助 DeepWalk 28
3.2.1 低秩矩陣分解 29
3.2.2 TADW 算法 29
3.2.3 復雜度分析 30
3.3 實驗分析 30
3.3.1 數據集 31
3.3.2 TADW 設置 31
3.3.3 基線方法 31
3.3.4 分類器和實驗設置 32
3.3.5 實驗結果分析 32
3.3.6 案例分析 34
3.4 擴展閱讀 34
第 4 章 回顧結合節(jié)點屬性的網絡嵌入:一種基于圖卷積網絡的視角 37
4.1 基于圖卷積網絡的網絡嵌入 37
4.1.1 圖卷積網絡 37
4.1.2 基于圖卷積網絡的屬性圖嵌入 35
4.1.3 討論 39
4.2 方法:自適應圖編碼器 40
4.2.1 問題形式化 40
4.2.2 總體框架 40
4.2.3 拉普拉斯平滑濾波器 41
4.2.4 自適應編碼器 43
4.3 實驗分析 46
4.3.1 數據集 46
4.3.2 基線方法 46
4.3.3 評估指標和參數設置 47
4.3.4 節(jié)點聚類結果 48
4.3.5 鏈接預測結果 48
4.3.6 GAE 與 LS+RA 49
4.3.7 消融實驗 49
4.3.8 k 值的選取 50
4.3.9 可視化 52
4.4 擴展閱讀 53
第 5 章 結合節(jié)點內容的網絡嵌入 55
5.1 概述 55
5.2 方法:上下文感知網絡嵌入 56
5.2.1 問題形式化 56
5.2.2 總體框架 57
5.2.3 基于結構的目標 57
5.2.4 基于文本的目標 58
5.2.5 上下文無關的文本表示 58
5.2.6 上下文感知的文本表示 59
5.2.7 CANE 的優(yōu)化 61
5.3 實驗分析 61
5.3.1 數據集 61
5.3.2 基線方法 62
5.3.3 評估指標和實驗設置 62
5.3.4 鏈接預測 63
5.3.5 節(jié)點分類 64
5.3.6 案例分析 65
5.4 擴展閱讀 66
第 6 章 結合節(jié)點標簽的網絡嵌入 69
6.1 概述 69
6.2 方法:最大間隔 DeepWalk 69
6.2.1 問題形式化 70
6.2.2 基于矩陣分解的 DeepWalk 70
6.2.3 最大間隔 DeepWalk 71
6.2.4 MMDW 的優(yōu)化 71
6.3 實驗分析 73
6.3.1 數據集和實驗設置 73
6.3.2 基線方法 73
6.3.3 實驗結果和分析 74
6.3.4 可視化 75
6.4 擴展閱讀 76
第三部分 面向不同特性圖結構的網絡嵌入
第 7 章 面向具有社區(qū)結構的圖的網絡嵌入 79
7.1 概述 79
7.2 方法:社區(qū)增強的網絡表示學習 80
7.2.1 問題形式化 81
7.2.2 DeepWalk 81
7.2.3 社區(qū)增強的 DeepWalk 81
7.3 實驗分析 84
7.3.1 數據集 84
7.3.2 基線方法 84
7.3.3 評測指標和參數設置 85
7.3.4 節(jié)點分類 86
7.3.5 鏈接預測 86
7.3.6 社區(qū)發(fā)現 87
7.3.7 發(fā)現社區(qū)的可視化 87
7.4 擴展閱讀 88
第 8 章 面向大規(guī)模圖的網絡嵌入 91
8.1 概述 92
8.2 方法:壓縮式網絡嵌入 93
8.2.1 問題形式化 94
8.2.2 圖劃分 94
8.2.3 組映射 95
8.2.4 組聚合 96
8.2.5 目標函數和優(yōu)化 96
8.3 實驗分析 97
8.3.1 數據集 97
8.3.2 基線方法和實驗設置 98
8.3.3 鏈接預測 99
8.3.4 多標簽分類 99
8.3.5 可擴展性 102
8.3.6 時間效率 103
8.3.7 不同的圖劃分算法 104
8.4 擴展閱讀 105
第 9 章 面向異質圖的網絡嵌入 107
9.1 概述 107
9.2 方法:關系結構感知的異質圖嵌入 109
9.2.1 問題形式化 109
9.2.2 數據觀察 109
9.2.3 基本思想 111
9.2.4 附屬關系和交互關系的建模 112
9.2.5 異質圖嵌入的統(tǒng)一模型 113
9.3 實驗分析 113
9.3.1 數據集 113
9.3.2 基線方法 113
9.3.3 參數設置 114
9.3.4 節(jié)點聚類 114
9.3.5 鏈接預測 115
9.3.6 節(jié)點分類 115
9.3.7 變體模型的比較 116
9.3.8 可視化 117
9.4 擴展閱讀 118
第四部分 網絡嵌入應用
第 10 章 面向社會關系抽取的網絡嵌入 123
10.1 概述 123
10.2 方法: 平移網絡 124
10.2.1 問題形式化 124
10.2.2 平移機制 124
10.2.3 邊表示構建 126
10.2.4 整體模型 127
10.2.5 預測 127
10.3 實驗分析 128
10.3.1 數據集 128
10.3.2 基線模型 128
10.3.3 評測指標和實驗設置 129
10.3.4 實驗結果和分析 129
10.3.5 標簽對比 130
10.3.6 案例分析 131
10.4 擴展閱讀 131
第 11 章 面向基于位置的社交網絡推薦系統(tǒng)的網絡嵌入 133
11.1 概述 133
11.2 方法: 網絡與軌跡聯合模型 135
11.2.1 問題形式化 135
11.2.2 社交網絡構建建模 136
11.2.3 移動軌跡生成建模 137
11.2.4 整體模型 141
11.2.5 參數學習 142
11.3 實驗分析 143
11.3.1 數據集 143
11.3.2 評估任務與基線方法 144
11.3.3 下一個位置推薦任務實驗結果 145
11.3.4 好友推薦任務實驗結果 148
11.4 擴展閱讀 149
第 12 章 面向信息傳播預測的網絡嵌入 153
12.1 概述 153
12.2 方法:神經傳播模型 155
12.2.1 問題形式化 155
12.2.2 模型假設 156
12.2.3 使用注意力機制提取活躍用戶 157
12.2.4 使用卷積神經網絡聚合活躍用戶表示進行預測 158
12.2.5 整體架構、模型細節(jié)和學習算法 159
12.3 實驗分析 159
12.3.1 數據集 160
12.3.2 基線模型 160
12.3.3 超參數設置 161
12.3.4 微觀級別的傳播預測 161
12.3.5 網絡嵌入的好處 163
12.3.6 可解釋性 164
12.4 擴展閱讀 165
第五部分 網絡嵌入展望
第 13 章 網絡嵌入的未來方向 169
13.1 基于先進技術的網絡嵌入 169
13.2 更細粒度場景中的網絡嵌入 169
13.3 具有更好的可解釋性的網絡嵌入 170
13.4 面向應用的網絡嵌入 170
參考文獻 171