天天看點

Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀

點選下載下傳論文

點選下載下傳電子書

1. 背景

近年來随着深度學習的發展,推薦系統大量使用使用者行為資料來建構使用者/商品表征,并以此來建構召回、排序、重排等推薦系統中的标準子產品。普通算法得到的使用者商品表征本身,并不具備可解釋性,而往往隻能提供使用者-商品之間的attention分作為商品粒度的使用者興趣。我們在這篇文章中,想僅通過使用者行為,學習到本身就具備一定可解釋性的解離化的使用者商品表征,并試圖利用這樣的商品表征完成單語義可控的推薦任務。

2. 什麼是解離化表征?

Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀

圖表 1 截圖取自[1]

學習解離化表征的原因和人類認知的Binding Problem (BP) [3]有關。如上圖所示,當我們看到一副上面四張圖檔時,我們可以識别兩種較為獨立的語義元素,即顔色、形狀和位置,這個過程對應Segregation Problem (BP1)。如果我們學到的表征向量中,不同的次元能夠分别代表不同的語義,我們稱這樣的表征是Disentangled的,反之如果某一維對應多種語義,則稱該表征是Entangled的;而我們通過這些識别獨立的語義元素進而可以組合生成下面四張新的圖檔,這個過程對應Combination Problem (BP2)。這裡假設我們有一個生成模型,能通過BP1學到圖檔的Disentangled的表征,我們通過調整表征中單個次元的值即可達到隻改變某個語義而不影響其他語義的生成,例如把綠色的方塊變成綠色的心形,顔色位置不變。除了和人認知過程比較切合,還可以提供可控制的生成之外,學習解離化的向量表征的魯棒性更好,對測試資料的分布相比而言敏感度較低,同時也有較好的解釋性。

使用者-商品解離化表征:

在電商系統中,擁有大量的使用者、商品标簽以及龐大的使用者行為資料,如果可以通過這些資料學習解離化的使用者和商品表征,将對推薦可解釋、認知推理、營銷等工作産生非常積極的影響。

而我們此次的工作,是使用者-商品解離化表征工作的一個開端,是以我們僅使用到使用者行為資料,并不涉及任何商品屬性以及使用者特征。我們探索,從使用者行為當中,能否得到一些認知相關的決策因素并以可解離的方式對商品和使用者進行表示。

具體來說,我們關注這樣的兩個和認知相關的子任務:

a) 商品在人的認知空間中,他們是如何表征的,這樣的表征是否具有可解釋性,例如是否能找到的對應的某一維就能夠代表一個獨立的“語義”。類似的,人在這個空間下的表征,是否也具有這樣的語義。聯系解離化表征(Disentangled Representation Learning)在圖像資料上的發展,我們探索其是否能從離散資料,特别是使用者行為資料上學習到類似的結果。

b) 基于這樣的表征,我們能否提出新型應用,并至少給出一種原型方案。

3. 我們的方法

Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀

針對電商平台上使用者行為的特點,我們的模型采用了階層化的設計:它在推理一個使用者的表征時将依次進行宏觀解離化(macro disentanglement)和微觀解離化(micro disentanglement)。

宏觀解離化: 宏觀解離化的啟發一方面來自于使用者在綜合類電商場景下的興趣确實較為分散,另一方面也來自于人類的傳統認知難題Binding Problem。首先,使用者興趣通常是非常廣泛的,一個使用者的點選記錄往往會涉及到多個獨立的消費意圖(比如點選不同大類下的商品)。而使用者在執行不同意圖時的偏好往往也是獨立,比如喜歡深色的衣服并不意味着使用者也喜歡深色的電器。哪怕是價格偏好也常存在不可遷移的情況,比如買高檔口紅、和買便宜好用的筆記本電腦這兩者并不互斥。另外,宏觀解離化也是微觀解離化的必要前提(見下)。是以,我們的将使用者的表征拆分成K個d維分量 ,用來表示使用者執行K種不同的意圖時的偏好(比如這K個分量可以對應K個商品大類)。同時,每個商品都有對應的one-hot向量 ,其中 表示商品i通常與第k種宏觀的消費意圖相關(或屬于第k個商品大類)。另一方面,給定一個資料整體(一副圖像、一組使用者行為),binding problem在講人是如何将整體分割成部分(圖像中不同的物體,行為中不同的興趣),并且從部分組合出新的資料。這方面的研究本身有難度,也比較有意思。

微觀解離化: 我們希望能把使用者在執行某個意圖時的偏好進一步地分解到更細的粒度。比如,設第k個意圖對應服飾,我們希望使用者在這個意圖下的偏好向量 的各個次元能夠對應不同的商品屬性,比如某一維和顔色相關,另一維和尺寸相關,等等。這裡我們看到,宏觀解離是微觀解離的前提:不同大類的商品屬性集合是很不同的,使用者表征向量的某一個次元如果已經被用于刻畫使用者對手機電量的偏好了,那麼這一維對服飾等商品就是沒有任何意義的——在預測使用者是否會點選某個服飾時、在通過使用者行為學習某個服飾的表征時,我們都應當忽略這些隻和手機相關的次元。

3.1. 從使用者行為學習解離化表征

我們的模型架構總覽如下:

Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀

我們的模型是一個深度生成模型,它假設資料的生成過程是這樣的:

Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀
Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀
Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀
Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀
Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀

3.2. 使用者可控制的互動式推薦

解離化表征在帶來一定的可解釋性的同時,也帶來了一定的可控制性。這種可控制性有望給推薦系統引入一種全新的使用者體驗。比如說,既然表征的各個次元關聯的是不同的商品屬性,那麼我們完全可以把使用者的表征向量提供給使用者,允許使用者自行固定絕大部分次元(比如對應的是衣服的風格、價格、尺寸等)、然後單獨調整某個次元的取值(比如顔色對應的次元),系統再根據這個回報調整推薦結果。這将幫助使用者更加精準地表達自己想要的、并檢索得到自己想要的。

我們從某個商品或使用者的表征出發,在固定住其它次元後,我們逐漸地改變表征第j維的取值。然後我們利用論文中提供的一種類似beam search的小技巧,檢索出了表征第j維大不一樣、但其它次元都很一緻的一批商品。

4.離線資料上的定量實驗

4.1. 定量評測解離化程度

我們在小規模資料集上定量測量了解離化程度(及其與推薦性能之間的關系)。我們初步發現:(1)解離化程度較高與推薦性能好這兩者之間有較強的相關性;(2)我們引入宏觀解離化後,确實大大改善了微觀解離化;(3)我們的方法無論是解離化程度還是推薦性能,都優于基線方法。

Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀

4.2. Top-N推薦任務上的性能

我們接着測量了我們的方法在幾個離線資料集(包括一個淘寶的資料集AliShop-7C)上的Top-N推薦表現。可以看出來我們的方法優于基線方法,尤其是在小規模或稀疏的資料集上。因為top-n推薦不是我們做這個問題的初衷,是以能做出這樣的效果我們認為已經是令人滿意的了。

Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀

4.3 使用者可控制的互動式推薦

我們在淘寶資料集上進行了單語義控制的case study。以下是我們在調控某個次元後檢索得到的兩批商品,可以看出這個被調控的次元和背包的顔色這一屬性比較相關:

Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀
Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀

以下是我們在另一個次元上檢索得到的兩批商品,可以看出這個次元和背包的大小這一屬性比較相關:

Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀
Learning Disentangled Representations for Recommendation | NIPS 2019 論文解讀

當然,并不是所有的次元都有人類可以了解的語義。而且,正如文獻[2]所指出的,在無監督的情況下,訓練出可解釋的模型仍然是需要運氣的——在加了beta-VAE的限制後,獲得可解釋模型的機率相比普通VAE大大提高,但仍然避免不了“反複訓練多個模型,然後挑出最好的模型”這一陷阱。是以,我們和文獻[2]一樣,建議未來的研究者們多多關注(弱/半)監督方法,引入标簽資訊。

5. 結語

随着現代電商推薦系統的技術發展,學術界和工業界在預估點選率,預測下一個點選商品這些單任務上的提高越發困難,而這樣的提高所帶來的離線資料上的增量效益也難以準确的對應線上上的名額。我們認為圍繞人的認知行為和過程,來探索新的推薦形态的可能性也是一個有前景的方向。未來我們将結合标簽、圖譜等資料進行更進一步的探索。

6. 參考文獻

[1] Beta-VAE: Learning Basic Visual Concepts with a Constrained Variational Framework. Higgins et al., ICLR 2017.

[2] Challenging Common Assumptions in the Unsupervised Learning of Disentangled Representations. Locatello et al., ICML 2019.

[3] The Binding Problem.

https://en.wikipedia.org/wiki/Binding_problem

[4] On using Very Large Target Vocabulary for Neural Machine Translation. Jean et al.., ACL 2015.

[5] Categorical Reparameterization with Gumbel-Softmax. Jang et al., ICLR 2017.

[6] Learning Disentangled Representations for Recommendation. Ma & Zhou et al., NeurIPS 2019.

繼續閱讀