主要學是學習《推薦系統》為了加深記憶就手寫了一邊,同時也友善後期檢視。csdn不支援公式編輯,裡面涉及很多公式,隻能截(bei)圖(cui),發現截圖文字較小,不過看得清楚就行。
1. 協同過濾算法簡介
1) 協同過濾根據相似(或者近鄰)偏好推薦物品,分為基于使用者的近鄰推薦和基于物品的近鄰推薦, 其實最終都是推薦物品,隻是考慮的角度不一樣(類似一種投票方式)。
2) 基于使用者的最近鄰推薦:根據與使用者自身偏好比較相似的使用者喜歡的物品,推将該物品推薦給使用者。使用者看電影時,一般會問周圍與自己喜好比較相似的使用者,最近在看什麼電影?
3)基于物品的最近鄰推薦:找出與使用者曆史喜歡的物品比較相似的物品推薦給使用者。例如:視訊軟體上使用者一般會搜尋一些最近比較喜歡的明星演的電影觀看。
2. 協同過濾計算主要步驟
1) 計算相似偏好
2) 尋找最優近鄰
3) 推薦給使用者
3. 推薦回報
推薦回報即給使用者推薦物品後,使用者對該物品的回報。一般回報分為3種:1)分級回報,即所謂的評分(級)制,例如電影評分從1~5分等。2)二進制回報,即兩種對立的值表示,如喜歡/不喜歡等。3)一進制回報,即擷取使用者與物品的互動資訊,例如購買,浏覽等,沒有具體的使用者對物品的評價。
4. 推薦結果評價
最優項與最優N項是推薦系統兩個重要的問題,一般針對最優項可轉換為分類(或回歸)問題;
常用的推薦系統效果評價名額是準确性,MAE(平均絕對誤差),RNSE(均方根誤差).
其中, Rtest表示測試集。
5. 案例資料
注: 首列為使用者名,首行為電影名。單元值為使用者對電影的打分。
6.基于使用者的最近鄰推薦
-
(1) 基于使用者最近鄰推薦:
即尋找與自身喜好比較相似的使用者,把這些使用者的喜好的物品推薦給使用者(k近鄰對共有物品打分并排序,取topN推薦給使用者)。
- (2) 本節主要讨論問題:
預測使用者u對物品i的評分rui ,即利用和使用者u興趣相近且對物品i已評分的使用者,預測rui。該分越高則使用者越喜歡。(越高具體相近度計算在下一節)
- (3) 預測評分rui
1) 取相鄰使用者對物品i評分總和的平均值