> 文章列表 > 推荐系统算法学习之路

推荐系统算法学习之路

推荐系统算法学习之路

这是贪心学院的目录
我看着挺好的学习进程(中间的饿技能点可以慢慢点)

文章目录

      • 第一阶段
        • Week 1:机器学习基础
        • Week 2: 推荐系统基础
      • 第二阶段
      • 第三阶段:搭建多路召回+排序的推荐系统
        • Week 5: 传统 match 方法
        • Week 6: 深度 match 方法
        • Week 7: 经典 Ranking 方法·Ranking 与用户画像
      • 第四阶段:基于图的深度排序文本推荐
        • Week 8: GraphEmbedding 大家族与用户行为构建图Deepwalk
        • Week 9: 引入 sideinfo 信息的图推荐、基于推理的图推荐GraphEmbedding 优化
        • Week 10: 深度 Ranking 模型
      • 第五阶段: 工业界推荐的秘密与前沿推荐技术
        • Week 11: 工业界新闻推荐系统中的冷启动
        • Week 12: 热点文章实时召回策略
        • Week 13: 多目标与用户多兴趣
        • Week 14: 强化学习与推荐系统
      • 第六阶段: 面试准备
        • Week 15: 项目总结、部署以及职业规划、面试指导

第一阶段

学习目标

理解机器学习中基础理论与基本的优化论;

理解什么是推荐系统、推荐系统工业界场景、推荐系统的业务和数据流;

掌握用协同过滤的方法做一款简单的推荐系统

Week 1:机器学习基础

  • 四大推荐系统项目介绍

  • 逻辑回归、梯度下降

  • 神经网络

  • 正则化

  • 模型常用评价指标

  • 常用的优化算法

  • 向量的内外积、哈达玛积等

Week 2: 推荐系统基础

  • 推荐系统概述、架构
  • 常用的技术栈
  • 简单的用户协同
  • 基础环境搭建
  • 实现基于用户协同算法

练习:实现基于用户协同的文本推荐系统

第二阶段

学习目标:

深刻理解并掌握推荐领域常用的 nlp 技术原理、并能利用这些 nlp 技术进行内容画像的抽取与构建;

掌握掌握业界常用的内容与用户画像的构建与存储方式,学会操作 mysql与redis;

掌握利用用户画像做 matching 的方法,做一款基于用户画像为基础的召回通道;

了解业内用户画像的更新周期与基于交互性的实时画像如何构建

Week 3: 内容画像与用户画像

  • RNN
  • 梯度消失与 Lstm、GRU
  • Attention 方法、Lstm 结合 Attention 在文本分类中的应用
  • 关键词抽取 tfidf
  • textRank
  • 内容画像的抽取构建
  • jieba等工具使用
  • Mysql数据库的搭建与内容画像存储

练习:基于nlp 技术Redis 构建与存储内容画像

Week 4: 用户画

  • 用户画像与内容画像的关系、用途
  • 长、中、短期的用户画像
  • 基于内容画像的用户画像
  • 基于标签的用户画像、标签权重的计算方法·贝叶斯平滑、威尔逊置信区间、时间衰减技术
  • 基于用户画像的召回方法
  • Redis 的搭建与使用
  • 基于Redis的用户画像存储

**项目实战:**基于用户画像实现召回文本推荐系统

第三阶段:搭建多路召回+排序的推荐系统

学习目标:
深掌握工业界95%以上都在使用的多路 matching+ranking的推荐系统;

实现利用item2vecDSSM +ANN 检索的的召回方式;

实现基于FM的排序模型并与召回结果池进行串联

Week 5: 传统 match 方法

  • MF召回法以及求解
  • SVD、SVD++
  • 梯度法求解MF
  • 基于物品的协同 item-cf

练习:MF方法的实现

Week 6: 深度 match 方法

  • 基于item2Vec召回
  • NCF 及其变种
  • Youtube 召回
  • Dssm
  • Dssm 方法实现
  • Faiss 工具介绍
  • kd 树
  • 局部敏感 hash
  • NeuralCF、GMF 以及二者结合

练习:item2Vec 的实现

Week 7: 经典 Ranking 方法·Ranking 与用户画像

  • 物品画像
  • GBDT+LR、FMFFM法·Auc 评价指标
  • LR RankingGBDT/XGBoost Ranking·基于FMFFM 实现Ranking

项目实战:基于多路召回(Tag、ltem2Vec、Dssm)+Ranking(FM)实现完整工业界推荐系统

第四阶段:基于图的深度排序文本推荐

学习目标:
掌握基于图的大家族的推荐方法原理、业界场景,包括基于用户行为构建图与基于先验信息与用户行为混合图的推荐方式

以及在业界的应用,能实现基于图的推荐方式;

利用深度模型做 ranking 从而优化传统模型泛化与特征交叉学习能力不足的问题

Week 8: GraphEmbedding 大家族与用户行为构建图Deepwalk

  • Node2Vec 及其同质性与结构性
  • LINE
  • neo4i 图数据库的部署于使用、可视化
  • 改进的 Graph Embedding、EGES

练习:Node2Vec 实现

Week 9: 引入 sideinfo 信息的图推荐、基于推理的图推荐GraphEmbedding 优化

  • EGS
  • 注意力机制及其变种与 EGES
  • Ripple 网络方法
  • EGES 的实现
  • 论文带读: GCN/KGCN练习:实现 Ripple 网络

Week 10: 深度 Ranking 模型

  • DeepFM、XDeepFM
  • 引入注意力机制的深度推荐模型 DIN
  • 引入特征交叉的深度模型 PNN
  • 基于Transormer 的推荐模型 BST

练习: DeepFM 实现

项目实战:基于图+深度Ranking 实现文本推荐系统

第五阶段: 工业界推荐的秘密与前沿推荐技术

学习目标:
掌握工业界文本推荐系统的一些实时性交互策略以及文本推荐特有的热点推荐的交互策略、掌握实时画像技术;

了解针对不同人群的投票分发策略、引入注意力机制的 softmax、掌握ucb 算法在推荐领域的应用;

了解前沿推荐领域的前沿模型,如用户多兴趣建模、多目标学习、强化学习技术在推荐领域的应用。

Week 11: 工业界新闻推荐系统中的冷启动

  • 人群泛化、投票策略
  • 实时画像技术
  • 定向与泛化
  • 实时交互正反馈
  • 实时收益获取
  • 引入注意力机制的softmax 优化兴趣增加与衰减

Week 12: 热点文章实时召回策略

  • 热点分级0
  • 热点实时召回
  • 人群投票、人群等级投票
  • 热点文章召回、排序策略
  • 热点话题策略与运营
  • 练习1:实现实时画像基于实时收益计算的实时召回
  • 练习 2:实现人群分层投票与人群降维分发

Week 13: 多目标与用户多兴趣

  • ESMM
  • 胶囊网络与MIND
  • 引入多因素的 Ranking
  • 加权损失
  • 引入阅读时长目标的 deepfm 实现

练习:ESMM 实现

Week 14: 强化学习与推荐系统

  • 强化学习的概念
  • 推荐系统结合强化学习的合理性与困难·UCB 及其在推荐系统中的应用、汤普森采样法
  • Q-Learning
  • DQN
  • 策略梯度
  • 强化学习在推荐场景中的应用

项目实战:实时召回推荐项目

第六阶段: 面试准备

Week 15: 项目总结、部署以及职业规划、面试指导