本書深入全面地講解了現(xiàn)代推薦算法,同時(shí)兼顧深度和廣度,介紹了當(dāng)下較前沿、先進(jìn)的各類算法及其實(shí)踐。本書從總覽篇開始,介紹推薦系統(tǒng)的基本概念及工作環(huán)節(jié)。在模型篇中,除了梳理推薦系統(tǒng)的發(fā)展史,本書還重點(diǎn)講解面向工業(yè)實(shí)踐的選擇及改進(jìn),為讀者打下推薦系統(tǒng)的算法基礎(chǔ);進(jìn)而帶著讀者進(jìn)階到前沿篇、難點(diǎn)篇,面對(duì)推薦系統(tǒng)中的各式問(wèn)題,給出解決方案;最后在決策篇中,從技術(shù)原理和用戶心理出發(fā),解釋一些常見(jiàn)決策背后的依據(jù),從而幫助讀者從執(zhí)行層面進(jìn)階到?jīng)Q策層面,建立大局觀。本書力求用簡(jiǎn)潔易懂的語(yǔ)言說(shuō)清核心原理,對(duì)已經(jīng)有一定機(jī)器學(xué)習(xí)概念和數(shù)學(xué)基礎(chǔ)的學(xué)生和相關(guān)領(lǐng)域的從業(yè)者非常友好,特別適合推薦系統(tǒng)、計(jì)算廣告和搜索領(lǐng)域的從業(yè)者及學(xué)生拓展新知和項(xiàng)目實(shí)戰(zhàn)
趙致辰本碩畢業(yè)于清華大學(xué)電子工程系。主要研究方向包括動(dòng)作識(shí)別、人臉識(shí)別、廣告和推薦中的排序模型及冷啟動(dòng)問(wèn)題等,發(fā)表相關(guān)學(xué)術(shù)領(lǐng)域論文7篇。曾從事移動(dòng)端人臉識(shí)別工作,開發(fā)的紅外人臉識(shí)別算法應(yīng)用于國(guó)內(nèi)多款手機(jī);在推薦領(lǐng)域,提出的“POSO”模型在用戶冷啟動(dòng)問(wèn)題上取得突破性收益,已經(jīng)在業(yè)界廣泛應(yīng)用,國(guó)內(nèi)外多家公司與產(chǎn)品如TikTok、快手、Meta等都在以POSO為原型探索冷啟動(dòng)模型。
總覽篇
第 1 章 推薦系統(tǒng)概述 ............................................................................................. 2
1.1 推薦系統(tǒng)是什么 .......................................................................................... 2
1.2 推薦系統(tǒng)發(fā)展的天時(shí)、地利、人和 .......................................................... 4
1.2.1 天時(shí) .................................................................................................. 6
1.2.2 地利 .................................................................................................. 6
1.2.3 人和 .................................................................................................. 7
第 2 章 現(xiàn)代推薦鏈路 ............................................................................................. 9
2.1 召回、粗排、精排——各有所長(zhǎng) .............................................................. 9
2.2 召回、粗排、精排——級(jí)聯(lián)漏斗 ............................................................ 13
2.3 打壓、保送、重排——拍不完的腦袋 .................................................... 20
模型篇
第 3 章 精排之鋒 ................................................................................................... 25
3.1 簡(jiǎn)單“復(fù)讀機(jī)”——邏輯回歸模型 ........................................................ 25
3.2 工業(yè)邏輯回歸模型的稀疏性要求 ............................................................ 29
3.3 FM 的一小步,泛化的一大步 ................................................................. 34
3.4 多彩的 FNN/PNN/ONN/NFM 世界 ......................................................... 37
3.5 高階交叉 ................................................................................................... 41
3.6 工具人 GBDT ............................................................................................ 45
3.7 嵌入表示亦福亦禍,樹模型的新機(jī)遇 .................................................... 49
3.8 DNN 與兩大門派,“一念神魔”與功不唐捐 ........................................ 53
3.9 再論特征與嵌入生成 ................................................................................ 58
3.10 機(jī)器學(xué)習(xí)唯一指定王牌技術(shù)——注意力機(jī)制 ...................................... 62
3.11 注意力機(jī)制的幾種寫法 .......................................................................... 65
3.12 Transformer 的升維打擊 ......................................................................... 69
第 4 章 粗排之柔 ................................................................................................... 72
4.1 粗排存在與否的必要性 ............................................................................ 73
4.2 粗排復(fù)雜化的方法 .................................................................................... 73
4.3 Pair-wise 與 List-wise ................................................................................ 74
第 5 章 召回之厚 ................................................................................................... 76
5.1 u2i 之雙塔進(jìn)擊史 ..................................................................................... 76
5.2 i2i 及 u2u2i 方案 ....................................................................................... 81
5.3 近似搜索概覽 ............................................................................................ 85
5.3.1 向量量化類方法 ............................................................................ 86
5.3.2 基于圖的搜索 ................................................................................ 87
5.4 樹模型與類樹模型的沖擊 ........................................................................ 89
第 6 章 模型迭代的術(shù)與道 .................................................................................... 93
6.1 什么是“老湯模型” ................................................................................ 93
6.2 模型迭代的“術(shù)” .................................................................................... 96
6.3 模型迭代的“道” .................................................................................... 98
前沿篇
第 7 章 用戶興趣建模 ......................................................................................... 101
7.1 從百到萬(wàn)的用戶長(zhǎng)期興趣建模 .............................................................. 101
7.1.1 從百到千 ...................................................................................... 102
7.1.2 從千到萬(wàn) ...................................................................................... 102
7.2 用戶多峰興趣建模 .................................................................................. 104
第 8 章 多任務(wù)學(xué)習(xí) ............................................................................................. 107
8.1 多任務(wù)學(xué)習(xí)的實(shí)踐意義 .......................................................................... 107
8.2 多任務(wù)學(xué)習(xí)的基本框架 .......................................................................... 110
8.3 平行關(guān)系建!狹MoE 類方法 ......................................................... 113
8.4 非平行關(guān)系建模,任務(wù)間的因果 .......................................................... 117
第 9 章 非梯度場(chǎng)景 ............................................................................................. 121
9.1 線上與線下的鴻溝 .................................................................................. 121
9.2 弱個(gè)性化 CEM,強(qiáng)個(gè)性化強(qiáng)化學(xué)習(xí) .................................................... 124
9.3 探微參數(shù)與性能的關(guān)系,把點(diǎn)連成面 .................................................. 128
第 10 章 探索與利用 ........................................................................................... 133
10.1 為什么要探索與利用 ............................................................................ 133
10.2 探索的本質(zhì)是巧妙“貪心” ................................................................ 136
第 11 章 后精排環(huán)節(jié) ........................................................................................... 139
11.1 定義多樣性問(wèn)題,簡(jiǎn)單的形式與復(fù)雜的標(biāo)準(zhǔn) .................................... 139
11.2 DPP 算法與多樣性 ............................................................................... 142
11.3 考慮上下文的重排序 ............................................................................ 144
第 12 章 推薦中的偏差與消除............................................................................. 147
12.1 各種各樣的偏差 .................................................................................... 147
12.2 流行度偏差的消除 ................................................................................ 148
12.3 位置偏差的消除 .................................................................................... 151
第 13 章 自動(dòng)機(jī)器學(xué)習(xí)技術(shù) ................................................................................ 155
13.1 網(wǎng)絡(luò)結(jié)構(gòu)搜索與網(wǎng)絡(luò)微操的探索 ........................................................ 155
13.2 特征的搜索 ............................................................................................ 159
13.3 模型壓縮 ............................................................................................... 161
第 14 章 圖計(jì)算 .................................................................................................. 165
14.1 數(shù)據(jù)結(jié)構(gòu)的終極 .................................................................................... 165
14.2 GNN 的極簡(jiǎn)發(fā)展史 .............................................................................. 168
14.3 物料非原子化,建模轉(zhuǎn)向圖 ................................................................ 171
難點(diǎn)篇
第 15 章 延遲轉(zhuǎn)化 ............................................................................................... 175
15.1 轉(zhuǎn)化與廣告機(jī)制 .................................................................................... 175
15.2 轉(zhuǎn)化的分解 ............................................................................................ 177
15.3 其他角度 ............................................................................................... 178
第 16 章 物料冷啟動(dòng) ........................................................................................... 181
16.1 “多模態(tài)之石,可以攻玉” ................................................................ 181
16.2 預(yù)排序向左,個(gè)性化向右 .................................................................... 184
16.3 流量分配,“普度眾生”還是“造神” .............................................. 188
第 17 章 用戶冷啟動(dòng) ........................................................................................... 191
17.1 元學(xué)習(xí),對(duì)模型拔高的要求 ................................................................ 191
17.2 初始化的基底分解與生成 .................................................................... 195
17.3 POSO,首個(gè)從結(jié)構(gòu)角度改善用戶冷啟動(dòng)的模型 .............................. 197
17.4 精品池:抓住人性需求 ........................................................................ 201
第 18 章 因果推斷 ............................................................................................... 204
18.1 當(dāng)分布不夠用時(shí) .................................................................................... 204
18.2 尋找“工具人”,將因果推斷直接應(yīng)用于推薦 ................................ 209
第 19 章 長(zhǎng)尾優(yōu)化 ............................................................................................... 212
決策篇
第 20 章 流量 ...................................................................................................... 218
20.1 重新認(rèn)識(shí)流量 ........................................................................................ 218
20.1.1 流量區(qū)分快慢 ............................................................................ 219
20.1.2 流量區(qū)分成本高低 .................................................................... 220
20.1.3 流量是盲目的 ............................................................................ 220
20.1.4 流量是有“圈子”的 ................................................................ 221
20.2 時(shí)間的研究 ............................................................................................ 222
第 21 章 分層 ...................................................................................................... 224
21.1 你必須理解的物料生命周期 ................................................................ 224
21.2 你必須理解的用戶分層 ........................................................................ 228
21.3 三階段讓用戶為我“死心塌地” ........................................................ 231
第 22 章 實(shí)驗(yàn)現(xiàn)象與回收 .................................................................................... 234
22.1 決策上線的黃金法則 ............................................................................ 234
22.2 “臨門一腳”,結(jié)果真的置信了嗎 ...................................................... 237
22.3 不萬(wàn)能的 A/B 實(shí)驗(yàn)和難以歸因的反轉(zhuǎn) ............................................... 239
22.4 線上和線下的對(duì)齊——無(wú)窮逼近 ........................................................ 241
后記 ....................................................................................................................... 243
參考文獻(xiàn) ............................................................................................................... 244