推薦系統 - 冷啟動問題 and 基于興趣内容的推薦
-
-
-
- 冷啟動 Cold Start
-
- 冷啟動主要類别
- 對應處理方案
- 基于興趣内容的推薦
-
- 是什麼
- 優點與缺點
- 重點
-
-
-
冷啟動 Cold Start
-
冷啟動主要類别
冷啟動問題一般歸為 3 個類别:- 系統冷啟動:由于新業務,新上線的推薦系統,沒有任何資料基礎;
- 使用者冷啟動:由于新注冊使用者,缺少點選、浏覽及購買等曆史資料;
- 物品冷啟動:由于新上線商家、物品等,缺少浏覽購買等曆史資料;
-
對應處理方案
-
對于系統冷啟動
∙ \bullet ∙ 整個推薦系統新上線,缺少基礎資料。對于系統冷啟動,應當引入外部資源,利用專家經驗,選用合适推薦架構、建立合适的推薦政策,并适當建立物品間關聯。
-
對于使用者冷啟動
∙ \bullet ∙ 拓展使用者畫像,注冊時收集資訊。比如年輕的都市女性,往往有較高的消費能力,在推薦政策上可以推薦高規格的一些内容;
∙ \bullet ∙ 利用社交賬号登陸,可從社交賬号中擷取使用者詳細資訊;
∙ \bullet ∙ 特征挖掘,例如利用身份證号擷取省、市、出生年月日、性别;利用出生年月可獲得星座、屬相等;
∙ \bullet ∙ 預采集,在初次登陸時讓使用者勾選感興趣标簽;
∙ \bullet ∙ 預推薦,記錄所有使用者在注冊後的興趣物品發展情況,将新注冊使用者在初始注冊的特征空間中進行聚類,将其他相似使用者的後續感興趣的物品進行推薦
∙ \bullet ∙ 熱門推薦,利用群體效應,将目前熱門内容進行推送,大機率被使用者接受;
∙ \bullet ∙ 随機推薦,将不同類别物品進行推薦,試探使用者喜好,根據回報做下一步推薦。
-
對于物品冷啟動
∙ \bullet ∙ 特征挖掘,聚類推薦。提取出物品特征,而後對物品進行歸類,之後利用基于物品相似度進行推薦;
∙ \bullet ∙ 給與新物品适度的曝光機會。
-
-
-
基于興趣内容的推薦
-
是什麼
針對新使用者沒有浏覽、點選以及購買等曆史資料,可以應用基于興趣内容的推薦。簡單來說就是計算使用者與物品的比對度,用于預測使用者的興趣。
在同一個特征空間内,對使用者與物品進行描述,特征可以是關鍵詞、打标簽等。
例如:
之後利用 one-hot 編碼進行向量化,而後計算比對度。将比對度高的進行推薦。使用者_1(興趣) 體育 足球 意甲 文章_1(屬性) 體育 足球 英超 item 體育 足球 意甲 英超 使用者_1(興趣) 1 1 1 文章_1(屬性) 1 1 1 -
優點與缺點
優點:
∙ \bullet ∙ 無需其他使用者、物品資訊,使用者、物品較少時也适用;适用于冷啟動情景;
∙ \bullet ∙ 可以推薦冷門或新物品,能夠針對使用者進行更個性化推薦;
∙ \bullet ∙ 可解釋性強,基于特征相似情況計算比對度,便于提供推薦理由;
缺點:
∙ \bullet ∙ 要求抽取出有意義的特征;
∙ \bullet ∙ 無法利用群體效應;
∙ \bullet ∙ 依據使用者的喜好進行推薦,很難出現新的推薦結果(驚喜);
-
重點
∙ \bullet ∙ 抽取特征方法;
∙ \bullet ∙ 比對度計算(相似度、利用決策樹、線性分類器判斷是否喜歡);
-