天天看点

推荐算法初步调研-总结1推荐算法分类基于用户的协同过滤算法–实例步骤详解

推荐算法分类

按照推荐算法分类:

  1. 基于内容的推荐

    以内容为主题推荐与用户购买过的相似物品

  2. 基于协同过滤的推荐

    根据相似用户的兴趣爱好推荐物品给用户

    (协同:利用群体的行为来做决策;过滤:从可行的决策中将与用户喜欢的方案找出来)

    2.1 基于内容的协同过滤

    找到物品和物品之间的相似度,只有找到了目标用户对某些物品的评分

    2.2 基于用户的协同过滤

    主要考虑的是用户和用户之间的相似度,只要找出相似用户喜欢的物品,并预测目标用户对对应物品的评分

    2.3 基于模型的协同过滤

    用已有的部分稀疏数据来预测那些空白的物品和数据之间的评分关系,找到最高评分的物品推荐给用户。

    }

  3. 基于图的推荐:将用户或物品之间的相似度放到了一个图模型里面去考虑,图的路径和权重反映了用户或物品之间的相似度关系;
  4. 基于深度学习的推荐:将大量的稀疏类别特征通过embedding技术映射到一个低维空间;将这些特征的低维表达按照特征的类别继续宁组合与变换(in a group-wise manner来描述(用户属性、用户行为等分组)区分 eg:sum pooling/mean pooling),形成固定长度的向量;最后将这些向量concatenate·起来输入到MLP中,从而学习这些特征的非线性关系;

按照推荐目的分类:

  1. 个性化推荐

    根据用户的显式特征(用户画像、用户自主填写的用户兴趣爱好标签等)和隐式特征(用户的点击行为、浏览时长、收藏等行为、历史购买记录等)进行推荐

  2. 相关推荐

    根据用户行为推荐与之相关的内容

  3. 热门推荐

    根据全站的内容,推荐当下最热门的内容

推荐算法步骤:

  1. 收集用户偏好
  2. 找到相似的用户或物品
  3. 计算推荐

基于用户的协同过滤算法–实例步骤详解

核心思想:为相似用户推荐物品

**目的:**为P5 推荐“玩命速递、环太平洋、变形金刚"散步电影中的一部

1、收集用户偏好

注意:
1、特征的提取和筛选,是否需要特征组合eg:是否给用户推荐游戏键盘,用户是男性且买过游戏鼠标比用户是男性且用户买过男装的作用更大;
2、用什么方式做特征筛选和组合,处理成什么样的特征?eg:原始数据是用户单次的观看电影的信息,用户下次观看什么电影跟观看记录序列有很大的关系(用户兴趣转移)所以特征处理过程中需要根据时间戳提取出用户观影序列数据;
3、物品的特征不能仅仅依赖与物品本身的属性特征,还需要考虑根据用户的喜好对物品进行分类;
           
推荐算法初步调研-总结1推荐算法分类基于用户的协同过滤算法–实例步骤详解

符号说明 用户:P1、P2、P3、P4、P5;商品:A_F\玩命速递、环太平洋、变形金刚、

2、计算P5与其他用户之间的相似度

注意:
1、用户之间的相似度计算方式可以用余弦距离(皮尔逊相关系数描述的是变量的变化程度不太适合),矩阵分解、图的路径、深度学习embedding相似度等计算方式
2、也可以把用户或物品是否相似看作分类或聚类问题,分类问题数据不均衡问题需要注意;
3、离散特征需要考虑归一化或作embedding
           
推荐算法初步调研-总结1推荐算法分类基于用户的协同过滤算法–实例步骤详解

3、推荐:直接推荐和加权推荐两种方式

注意:
1、推荐可以加入人工设定的关联规则(规则和知识)eg:买了数据结构的用户可以考虑给他推荐计算机组成原理
2、推荐结果计算的方式可以是相似度计算结果、规则结果、分类概率、组合结果
           

直接推荐:假如我们需要为用户P5推荐电影,首先我们检查相似度列表,发现用户P5和用户P3的相似度最高。因此,我们可以对用户P5推荐P3的相关数据。但这里有一个问题。我们不能直接推荐前面A-F的商品。因为这这些商品用户P5已经浏览或者购买过了。不能重复推荐。因此我们要推荐用户P5还没有浏览或购买过的商品。如果直接推荐我们可以选择P3用户评价最高的商品,也就是环太平洋和变形金刚两个数据。

推荐算法初步调研-总结1推荐算法分类基于用户的协同过滤算法–实例步骤详解

加权排序推荐:我们根据不同用户间的相似度,对不同商品的评分进行相似度加权。按加权后的结果对商品进行排序,然后推荐给用户P5。这样,用户P5就获得了更好的推荐结果。

根据计算结果中,我们按照(变形金刚–环太平洋–玩命速递)的顺序把结果推荐给用户P5。

继续阅读