天天看點

推薦系統 - 冷啟動問題 and 基于興趣内容的推薦

推薦系統 - 冷啟動問題 and 基于興趣内容的推薦

        • 冷啟動 Cold Start
          • 冷啟動主要類别
          • 對應處理方案
        • 基于興趣内容的推薦
          • 是什麼
          • 優點與缺點
          • 重點
  • 冷啟動 Cold Start

    • 冷啟動主要類别
      冷啟動問題一般歸為 3 個類别:
      1. 系統冷啟動:由于新業務,新上線的推薦系統,沒有任何資料基礎;
      2. 使用者冷啟動:由于新注冊使用者,缺少點選、浏覽及購買等曆史資料;
      3. 物品冷啟動:由于新上線商家、物品等,缺少浏覽購買等曆史資料;
    • 對應處理方案
      1. 對于系統冷啟動

        ∙ \bullet ∙ 整個推薦系統新上線,缺少基礎資料。對于系統冷啟動,應當引入外部資源,利用專家經驗,選用合适推薦架構、建立合适的推薦政策,并适當建立物品間關聯。

      2. 對于使用者冷啟動

        ∙ \bullet ∙ 拓展使用者畫像,注冊時收集資訊。比如年輕的都市女性,往往有較高的消費能力,在推薦政策上可以推薦高規格的一些内容;

        ∙ \bullet ∙ 利用社交賬号登陸,可從社交賬号中擷取使用者詳細資訊;

        ∙ \bullet ∙ 特征挖掘,例如利用身份證号擷取省、市、出生年月日、性别;利用出生年月可獲得星座、屬相等;

        ∙ \bullet ∙ 預采集,在初次登陸時讓使用者勾選感興趣标簽;

        ∙ \bullet ∙ 預推薦,記錄所有使用者在注冊後的興趣物品發展情況,将新注冊使用者在初始注冊的特征空間中進行聚類,将其他相似使用者的後續感興趣的物品進行推薦

        ∙ \bullet ∙ 熱門推薦,利用群體效應,将目前熱門内容進行推送,大機率被使用者接受;

        ∙ \bullet ∙ 随機推薦,将不同類别物品進行推薦,試探使用者喜好,根據回報做下一步推薦。

      3. 對于物品冷啟動

        ∙ \bullet ∙ 特征挖掘,聚類推薦。提取出物品特征,而後對物品進行歸類,之後利用基于物品相似度進行推薦;

        ∙ \bullet ∙ 給與新物品适度的曝光機會。

    除了上述 3 種針對不同情況的不同處理方法以外,還有一種基于興趣内容的推薦方法,下面進行介紹。
  • 基于興趣内容的推薦

    • 是什麼

      針對新使用者沒有浏覽、點選以及購買等曆史資料,可以應用基于興趣内容的推薦。簡單來說就是計算使用者與物品的比對度,用于預測使用者的興趣。

      在同一個特征空間内,對使用者與物品進行描述,特征可以是關鍵詞、打标簽等。

      例如:

      使用者_1(興趣) 體育 足球 意甲
      文章_1(屬性) 體育 足球 英超
      之後利用 one-hot 編碼進行向量化,而後計算比對度。将比對度高的進行推薦。
      item 體育 足球 意甲 英超
      使用者_1(興趣) 1 1 1
      文章_1(屬性) 1 1 1
    • 優點與缺點

      優點:

      ∙ \bullet ∙ 無需其他使用者、物品資訊,使用者、物品較少時也适用;适用于冷啟動情景;

      ∙ \bullet ∙ 可以推薦冷門或新物品,能夠針對使用者進行更個性化推薦;

      ∙ \bullet ∙ 可解釋性強,基于特征相似情況計算比對度,便于提供推薦理由;

      缺點:

      ∙ \bullet ∙ 要求抽取出有意義的特征;

      ∙ \bullet ∙ 無法利用群體效應;

      ∙ \bullet ∙ 依據使用者的喜好進行推薦,很難出現新的推薦結果(驚喜);

    • 重點

      ∙ \bullet ∙ 抽取特征方法;

      ∙ \bullet ∙ 比對度計算(相似度、利用決策樹、線性分類器判斷是否喜歡);

繼續閱讀