推荐系统
推荐系统(十六)—— 工业级架构与最佳实践
工业级推荐系统全景:数据/训练/服务三大平面,召回-粗排-精排-重排序四级漏斗,多路召回与融合,Wide&Deep/DeepFM/DIN 排序模型,特征仓库消除训练-服务偏差,A/B 测试方法论,金丝雀发布与回滚,团队角色分工。结合 YouTube、TikTok、淘宝、字节跳动等真实架构。
推荐系统(十五)—— 实时推荐与在线学习
实时推荐的工程师视角:流式管道(Kafka + Flink)、在线学习(SGD、FTRL、AdaGrad)、Bandit(UCB、Thompson Sampling、LinUCB)、延迟预算、特征新鲜度、概念漂移检测,以及生产环境真正在调的缓存与计算权衡。
推荐系统(十四)—— 跨域推荐与冷启动解决方案
深入讲清冷启动与跨域推荐的整套打法:三种冷启动场景、EMCDR/PTUPCDR 跨域桥接、MeLU/MAML 元学习、UCB Bandit 探索利用,以及从冷到温的完整线上路由策略。
推荐系统(十三)—— 公平性、去偏与可解释性
可信推荐的实战深读:七类偏差(流行度/位置/选择/曝光/从众/人口/确认)的来源与度量;因果推断(RCT、IPS、双重稳健)如何把有偏日志变成无偏信号;MACR、DICE、FairCo 等业界主流去偏方案;LIME、SHAP、反事实解释的工程取舍。
推荐系统(十二)—— 大语言模型与推荐系统
LLM 如何重塑推荐系统:增强器(P5、M6Rec)、预测器(TallRec、GenRec)、智能体(LlamaRec、ChatREC)三种角色,混合管线、冷启动突破、Prompt 设计与成本/质量帕累托前沿。
推荐系统(十一)—— 对比学习与自监督学习
对比学习在推荐系统里到底怎么用?这一篇把 InfoNCE、温度系数、SimCLR/MoCo 的负样本来源、SGL 的图增广、CL4SRec 的序列增广、XSimGCL 的极简噪声扰动讲清楚,配 PyTorch 实现与原理图。
推荐系统(十)—— 深度兴趣网络与注意力机制
从 DIN 的目标注意力到 DIEN 的 AUGRU、再到 BST 的 Transformer——阿里巴巴是怎样让 CTR 模型像主厨读懂客人那样读懂用户行为的。
推荐系统(九)—— 多任务学习与多目标优化
线上推荐从来不是优化一个数。本文从样本选择偏差、负迁移、梯度冲突这些真实痛点出发,把 Shared-Bottom、ESMM、MMoE、PLE 四种工业级架构讲透,配上完整 PyTorch 代码、损失平衡策略与可上线的训练流水线。
推荐系统(八)—— 知识图谱增强推荐系统
知识图谱增强推荐系统全面解析:知识图谱嵌入(TransE/TransR/DistMult),RippleNet 涟漪传播,KGCN 图卷积,KGAT 注意力网络,CKE 多信号融合,附完整 PyTorch 实现。
推荐系统(七)—— 图神经网络与社交推荐
图神经网络推荐系统全面解析:从消息传递的直觉出发,深入 GCN、GAT、GraphSAGE,再到工业级 PinSage、LightGCN、NGCF、社交推荐与图采样、冷启动处理。配 7 张图与完整 PyTorch 实现。
推荐系统(六)—— 序列推荐与会话建模
序列推荐方法全景:从马尔可夫链、GRU4Rec、Caser,到 SASRec、BERT4Rec、BST、SR-GNN,讲清模型动机、关键公式与实现细节,并用图示对比性能与代价。
推荐系统(五)—— Embedding表示学习
推荐系统 Embedding 技术全解:从 Word2Vec、Item2Vec、Node2Vec 到双塔 DSSM 与 YouTube DNN,再到负采样策略与 FAISS/HNSW 近邻检索的工程实践。每节配有可运行的 PyTorch 代码、关键设计权衡与生产经验。
推荐系统(四)—— CTR预估与点击率建模
CTR预估模型全面解析:从Logistic Regression到FM/FFM,再到DeepFM、xDeepFM、DCN、AutoInt、FiBiNet等深度学习模型,附PyTorch实现与训练策略。
推荐系统(三)—— 深度学习基础模型
从 MLP 到 Embedding,再到 NeuMF、YouTube DNN、Wide & Deep —— 用渐进的方式讲清深度学习推荐系统的每一块基石,附经过原文核对的架构图和可直接运行的 PyTorch 代码。
推荐系统(二)—— 协同过滤与矩阵分解
深入讲解协同过滤与矩阵分解:User-CF、Item-CF、相似度度量、潜因子模型、SVD++、ALS、BPR、因子分解机,附直觉解释、推导和可运行 Python。
推荐系统(一)—— 入门与基础概念
推荐系统入门指南:三大范式(协同过滤、内容推荐、混合推荐)、评估指标(Precision、Recall、NDCG)、生产级多阶段漏斗架构,以及冷启动、稀疏性、长尾分布等核心挑战,附可直接运行的 Python 实现。