業(yè)務(wù)驅(qū)動(dòng)的推薦系統(tǒng):方法與實(shí)踐
定 價(jià):89 元
叢書(shū)名:智能系統(tǒng)與技術(shù)叢書(shū)
- 作者:付聰 著
- 出版時(shí)間:2023/2/1
- ISBN:9787111720935
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類(lèi):TP301.6
- 頁(yè)碼:195
- 紙張:
- 版次:
- 開(kāi)本:16
這是一本從業(yè)務(wù)視角解讀推薦系統(tǒng)架構(gòu)設(shè)計(jì)、評(píng)估方法、數(shù)據(jù)工程和算法原理的著作。
市面上推薦系統(tǒng)方面的著作,內(nèi)容多以推薦技術(shù)、算法和模型為主,讓讀者誤以為掌握了推薦算法就能用好推薦系統(tǒng)并提升業(yè)務(wù)指標(biāo),其實(shí)推薦算法只是工具,要真正發(fā)揮推薦系統(tǒng)的價(jià)值,需要將推薦系統(tǒng)植根于業(yè)務(wù)之上。本書(shū)從業(yè)務(wù)視角出發(fā),描繪了當(dāng)下主流推薦系統(tǒng)的設(shè)計(jì)思想和架構(gòu)全貌,重點(diǎn)突出系統(tǒng)每個(gè)模塊所需要解決的問(wèn)題,進(jìn)而介紹一到兩種實(shí)踐檢驗(yàn)普遍有效、在學(xué)術(shù)界具備里程碑性質(zhì)的算法。幫助讀者練成識(shí)別算法的火眼金睛,從每年大量產(chǎn)出的新算法研究中去粗取精,真正解決實(shí)際問(wèn)題。
閱讀本書(shū),你將有如下收獲:
從商業(yè)、運(yùn)營(yíng)、算法、工程視角理解推薦系統(tǒng),對(duì)推薦系統(tǒng)的認(rèn)知更加立體化;
從業(yè)務(wù)視角理解推薦系統(tǒng)的頂層設(shè)計(jì),掌握業(yè)務(wù)驅(qū)動(dòng)的推薦系統(tǒng)設(shè)計(jì)思想;
掌握業(yè)務(wù)驅(qū)動(dòng)型推薦系統(tǒng)的評(píng)估方法,涵蓋B端、C端和平臺(tái)等多個(gè)維度;
了解推薦系統(tǒng)的數(shù)據(jù)工程,掌握獲取各類(lèi)數(shù)據(jù)、構(gòu)建特征體系的方法;
從業(yè)務(wù)視角理解召回、排序和決策智能方面的經(jīng)典算法和學(xué)術(shù)界有里程碑意義的算法;
從技術(shù)和業(yè)務(wù)的雙重視角去規(guī)劃推薦算法工程師的成長(zhǎng)路徑,以達(dá)到事半功倍的效果。
CONTENTS
目 錄
前言
第一部分 業(yè)務(wù)驅(qū)動(dòng)下的推薦系統(tǒng)總覽
第1章 從業(yè)務(wù)視角看推薦系統(tǒng)2
1.1 推薦系統(tǒng)的定義與商業(yè)價(jià)值2
1.1.1 推薦系統(tǒng)的基本概念
與業(yè)務(wù)驅(qū)動(dòng)思想3
1.1.2 淺談個(gè)性化推薦帶來(lái)的
商業(yè)價(jià)值7
1.2 從運(yùn)營(yíng)、算法與工程視角
看推薦系統(tǒng)7
1.2.1 推薦業(yè)務(wù)運(yùn)營(yíng)思維:
貨找人8
1.2.2 推薦算法建模思維:
人找貨10
1.2.3 推薦引擎工程展望:
服務(wù)產(chǎn)品化11
第2章 從業(yè)務(wù)視角看推薦系統(tǒng)的
頂層設(shè)計(jì)12
2.1 業(yè)務(wù)驅(qū)動(dòng)下的推薦系統(tǒng)
設(shè)計(jì)思想12
2.1.1 業(yè)務(wù)無(wú)關(guān)的推薦系統(tǒng)
抽象13
2.1.2 推薦算法模塊核心能力
的建設(shè)15
2.2 從系統(tǒng)框架透視業(yè)務(wù)生態(tài)
循環(huán)17
2.2.1 系統(tǒng)大圖剖析17
2.2.2 監(jiān)察者:埋點(diǎn)日志
服務(wù)17
2.2.3 業(yè)務(wù)大腦:數(shù)據(jù)計(jì)算、
分析及倉(cāng)儲(chǔ)服務(wù)18
2.2.4 主循環(huán)系統(tǒng):召回與
排序模塊19
2.2.5 副循環(huán)系統(tǒng):運(yùn)營(yíng)管控
與作業(yè)模塊21
2.2.6 新陳代謝:運(yùn)維與實(shí)驗(yàn)
平臺(tái)22
2.3 迭代效率大化:圖化服務(wù)和
配置化迭代25
第3章 評(píng)估推薦系統(tǒng)的方式
與維度27
3.1 業(yè)務(wù)驅(qū)動(dòng)型推薦系統(tǒng)的評(píng)估
要點(diǎn)27
3.1.1 體驗(yàn)優(yōu)先準(zhǔn)則和量化
方式28
3.1.2 評(píng)估推薦系統(tǒng)的
方法論29
3.1.3 從3種業(yè)務(wù)價(jià)值出發(fā)
設(shè)計(jì)評(píng)估體系31
3.2 B端業(yè)務(wù):B端用戶(hù)體驗(yàn)的
評(píng)估維度31
3.2.1 平臺(tái)玩法的
可解釋性31
3.2.2 投放效果的
可預(yù)測(cè)性32
3.2.3 投入產(chǎn)出比33
3.2.4 基尼指數(shù)34
3.3 C端業(yè)務(wù):C端用戶(hù)體驗(yàn)
的評(píng)估維度34
3.3.1 興趣相關(guān)性35
3.3.2 內(nèi)容質(zhì)量35
3.3.3 結(jié)果多樣性35
3.3.4 推薦驚喜性36
3.4 平臺(tái)成長(zhǎng):平臺(tái)價(jià)值評(píng)估
維度36
3.4.1 產(chǎn)品調(diào)性和品牌
印象37
3.4.2 消費(fèi)與轉(zhuǎn)化率37
3.4.3 高、中、低活用戶(hù)
留存37
3.4.4 活躍用戶(hù)量38
3.5 評(píng)估方法概覽38
3.5.1 用戶(hù)調(diào)研39
3.5.2 離線(xiàn)評(píng)估39
3.5.3 在線(xiàn)評(píng)估42
3.6 AB實(shí)驗(yàn)42
3.6.1 AB實(shí)驗(yàn)中的流量切分
設(shè)計(jì)43
3.6.2 AB實(shí)驗(yàn)的通用流程44
3.6.3 實(shí)驗(yàn)結(jié)果的顯著性校驗(yàn)
和關(guān)聯(lián)分析44
3.6.4 實(shí)驗(yàn)報(bào)表與監(jiān)控
報(bào)警45
第二部分 推薦系統(tǒng)的數(shù)據(jù)工程
第4章 業(yè)務(wù)標(biāo)簽體系48
4.1 業(yè)務(wù)標(biāo)簽體系概述48
4.1.1 業(yè)務(wù)標(biāo)簽體系的
含義48
4.1.2 業(yè)務(wù)標(biāo)簽體系的
價(jià)值49
4.1.3 標(biāo)簽體系為什么要業(yè)務(wù)
定制化49
4.2 業(yè)務(wù)標(biāo)簽體系的設(shè)計(jì)思路50
4.2.1 業(yè)務(wù)標(biāo)簽體系的概念
設(shè)計(jì)50
4.2.2 業(yè)務(wù)標(biāo)簽體系的系統(tǒng)
設(shè)計(jì)52
4.3 業(yè)務(wù)標(biāo)簽的挖掘方法53
4.3.1 提取式標(biāo)簽挖掘54
4.3.2 生成式標(biāo)簽挖掘55
4.3.3 基于主動(dòng)學(xué)習(xí)的人機(jī)
協(xié)同標(biāo)注系統(tǒng)56
4.3.4 標(biāo)簽改寫(xiě)、糾錯(cuò)與
聚合56
4.3.5 標(biāo)簽權(quán)重計(jì)算57
4.4 業(yè)務(wù)標(biāo)簽體系的評(píng)估方法58
4.4.1 離線(xiàn)評(píng)估58
4.4.2 在線(xiàn)評(píng)估59
第5章 用戶(hù)畫(huà)像:業(yè)務(wù)層面
的人格抽象60
5.1 用戶(hù)畫(huà)像概述60
5.1.1 用戶(hù)畫(huà)像的含義60
5.1.2 用戶(hù)畫(huà)像的業(yè)務(wù)價(jià)值
和算法價(jià)值61
5.2 用戶(hù)畫(huà)像設(shè)計(jì)61
5.2.1 用戶(hù)畫(huà)像概念體系
設(shè)計(jì)61
5.2.2 用戶(hù)畫(huà)像數(shù)據(jù)系統(tǒng)
設(shè)計(jì)64
5.3 用戶(hù)畫(huà)像的構(gòu)建與迭代65
5.3.1 人工挖掘方法65
5.3.2 基于機(jī)器學(xué)習(xí)的挖掘
方法66
5.3.3 用戶(hù)畫(huà)像的優(yōu)化
迭代68
5.3.4 用戶(hù)畫(huà)像權(quán)重計(jì)算70
5.4 用戶(hù)畫(huà)像的評(píng)估方法71
5.4.1 離線(xiàn)評(píng)估71
5.4.2 在線(xiàn)評(píng)估72
第6章 生態(tài)循環(huán)的血液:
數(shù)據(jù)獲取與處理73
6.1 埋點(diǎn)日志服務(wù)與埋點(diǎn)體系的
設(shè)計(jì)思想73
6.1.1 埋點(diǎn)日志服務(wù)簡(jiǎn)介74
6.1.2 業(yè)務(wù)驅(qū)動(dòng)的埋點(diǎn)體系
設(shè)計(jì)思想75
6.2 可擴(kuò)展的業(yè)務(wù)埋點(diǎn)體系77
6.2.1 SPM埋點(diǎn)體系77
6.2.2 SCM埋點(diǎn)體系77
6.2.3 擴(kuò)展埋點(diǎn)體系EXT78
6.2.4 會(huì)話(huà)級(jí)埋點(diǎn)設(shè)計(jì)與
消費(fèi)路徑跟蹤78
6.3 基于埋點(diǎn)數(shù)據(jù)的處理和分析79
6.3.1 常見(jiàn)重要數(shù)據(jù)指標(biāo)
釋義79
6.3.2 漏斗效應(yīng)和優(yōu)化
分析81
第7章 業(yè)務(wù)定制化特征和
樣本工程設(shè)計(jì)83
7.1 推薦特征體系概覽83
7.1.1 推薦特征體系簡(jiǎn)介84
7.1.2 特征體系的設(shè)計(jì)
思想85
7.2 推薦系統(tǒng)特征設(shè)計(jì)及案例86
7.2.1 用戶(hù)描述性特征86
7.2.2 用戶(hù)特征的人群
泛化87
7.2.3 內(nèi)容描述性特征87
7.2.4 內(nèi)容統(tǒng)計(jì)類(lèi)特征88
7.2.5 內(nèi)容統(tǒng)計(jì)類(lèi)特征
泛化88
7.2.6 用戶(hù)與內(nèi)容的交叉特征
設(shè)計(jì)89
7.2.7 用戶(hù)歷史行為序列
特征設(shè)計(jì)91
7.2.8 實(shí)時(shí)特征的定義和
價(jià)值92
7.2.9 實(shí)時(shí)統(tǒng)計(jì)特征設(shè)計(jì)和
數(shù)據(jù)流程92
7.2.10 基于機(jī)器學(xué)習(xí)的特征
構(gòu)造94
7.3 特征應(yīng)用常見(jiàn)問(wèn)題95
7.3.1 多值特征處理95
7.3.2 在線(xiàn)、離線(xiàn)特征的
一致性96
7.4 特征去噪96
7.4.1 威爾遜置信區(qū)間
方法96
7.4.2 對(duì)數(shù)平滑方法97
7.4.3 百分位點(diǎn)離散化
方法97
7.5 特征樣本構(gòu)造和模型訓(xùn)練97
7.6 時(shí)間穿越及處理98
7.6.1 時(shí)間穿越的定義及
影響98
7.6.2 樣本現(xiàn)場(chǎng)還原98
7.7 特征與樣本消偏99
7.8 特征評(píng)估方法100
第三部分 推薦系統(tǒng)的算法原理
與實(shí)踐
第8章 業(yè)務(wù)驅(qū)動(dòng)視角下的
召回技術(shù)104
8.1 推薦系統(tǒng)召回技術(shù)概覽104
8.1.1 推薦系統(tǒng)召回技術(shù)的
業(yè)務(wù)定位104
8.1.2 業(yè)務(wù)驅(qū)動(dòng)下的召回
技術(shù)建模思維106
8.2 召回中的策略框架108
8.2.1 圈池策略108
8.2.2 召回多樣性策略108
8.2.3 基于業(yè)務(wù)策略的
召回109
8.2.4 召回模塊框架109
8.3 U2I召回算法111
8.3.1 UserCF算法111
8.3.2 矩陣補(bǔ)全算法113
8.3.3 向Neural CF邁進(jìn):
Deep Match框架114
8.4 I2I召回算法117
8.4.1 I2I召回的業(yè)務(wù)價(jià)值及
特點(diǎn)117
8.4.2 Trigger Selection
方法118
8.4.3 ItemCF算法118
8.4.4 Item2Vec算法118
8.5 基于圖結(jié)構(gòu)的召回算法119
8.5.1 圖召回的前世今生和
業(yè)務(wù)價(jià)值119
8.5.2 Swing I2I召回算法120
8.5.3 GraphSage算法122
8.6 向量召回的另一面:近似檢索
算法127
8.6.1 ENN向量檢索與
ANN向量檢索128
8.6.2 ANN向量檢索算法的
分類(lèi)及特點(diǎn)130
8.6.3 HC檢索算法131
8.6.4 IVF-PQ檢索算法
與Faiss133
8.6.5 SSG檢索算法138
8.7 召回中的采樣技術(shù)140
第9章 業(yè)務(wù)驅(qū)動(dòng)視角下的
排序技術(shù)142
9.1 排序模塊概覽142
9.1.1 排序模塊的業(yè)務(wù)
價(jià)值142
9.1.2 業(yè)務(wù)驅(qū)動(dòng)下的排序
模塊組件143
9.2 粗排模塊144
9.2.1 粗排模塊的業(yè)務(wù)價(jià)值
和技術(shù)思考變遷144
9.2.2 粗排算法選型原則145
9.2.3 GBDT算法145
9.2.4 GBDT+LR復(fù)合
排序149
9.2.5 雙塔深度網(wǎng)絡(luò)150
9.2.6 從精排模型蒸餾
出粗排模型151
9.3 精排模型152
9.3.1 精排模型的特點(diǎn)與
業(yè)務(wù)價(jià)值152
9.3.2 從LR到FM:從半人工
走向全自動(dòng)153
9.3.3 端到端暴力美學(xué):
精排CIN模塊155
9.3.4 序列特征建模157
9.3.5 稠密特征處理158
9.3.6 歸納偏執(zhí)處理159
9.3.7 特征融合160
9.3.8 廣義LR排序范式160
9.4 多準(zhǔn)則排序161
9.4.1 多準(zhǔn)則排序簡(jiǎn)介及
業(yè)務(wù)意義161
9.4.2 MMoE建模多準(zhǔn)則
任務(wù)161
9.4.3 多目標(biāo)的融合163
9.4.4 從Point-wise到
List-wise:強(qiáng)化
學(xué)習(xí)重排序165
9.4.5 解決數(shù)據(jù)匱乏問(wèn)題:
生成式強(qiáng)化學(xué)習(xí)
重排167
第10章 算法輔助人工:
決策智能168
10.1 決策智能概述168
10.1.1 決策智能的含義168
10.1.2 推薦業(yè)務(wù)中的決策
智能169
10.2 決策智能與推薦探索利用
機(jī)制169
10.2.1 冷啟動(dòng)中的決策
智能169
10.2.2 場(chǎng)景冷啟動(dòng)中的
人工部分170
10.2.3 新用戶(hù)冷啟動(dòng)中的
人工部分172
10.2.4 冷啟動(dòng)決策中的
遷移學(xué)習(xí)173
10.2.5 新內(nèi)容冷啟動(dòng)
算法175
10.3 因果推斷技術(shù)178
10.3.1 決策智能與因果
推斷178
10.3.2 智能營(yíng)銷(xiāo)與上推
建模179
10.4 流量調(diào)控181
10.4.1 流量調(diào)控的業(yè)務(wù)
價(jià)值與應(yīng)用場(chǎng)景181
10.4.2 異質(zhì)內(nèi)容混排及
強(qiáng)化學(xué)習(xí)應(yīng)用181
10.4.3 履約保量的流量調(diào)控
及算法184
第四部分 推薦算法工程師的
自我成長(zhǎng)
第11章 推薦算法工程師的
成長(zhǎng)路徑188
11.1 技術(shù):推薦算法工程師的
立身之本188
11.1.1 推薦算法工程師的
知識(shí)體系188
11.1.2 推薦算法工程師的技術(shù)
成長(zhǎng)路徑189
11.2 業(yè)務(wù):推薦算法工程師的
立業(yè)之道190
11.2.1 推薦算法工程師的
業(yè)務(wù)成長(zhǎng)路徑191
11.2.2 推薦算法業(yè)務(wù)目標(biāo)
優(yōu)化迭代的節(jié)奏192
11.3 推薦算法工程師的自我
修養(yǎng)193
11.3.1 推薦算法工程師的
工作日常193
11.3.2 優(yōu)秀的推薦算法
工程師的特征194
11.3.3 在自證價(jià)值和技術(shù)
沉淀中尋求平衡195