天天看點

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

AAAI 經典論文獎會授予最具影響力論文的作者,這篇論文會來自某年會議論文。每一年,作為評選對象的會議都會往後推一年。

2017 年的獎項會授予 1999 年在佛羅裡達召開的第 16 屆 AAAI 會議最具影響力論文。

論文評選是以影響力為基礎的,比如:

  • 開啟了一個新的研究(子)領域
  • 導緻了重要應用
  • 回答了一個長期困擾人們的問題/議題或者澄清了之前模糊的地方
  • 做出了能夠載入子領域曆史的主要貢獻
  • 已經被視為重要的研究,已經被人工智能裡(或外)的其他領域使用
  • 已經被大量引用

本屆經典論文有兩篇:一篇經典論文獎,一篇經典論文提名獎(Honorable Mention)。

AAAI-17 經典論文獎(Classic Paper Award)

  • 論文标題:蒙特卡洛定位:移動機器人的有效位置估計(Monte Carlo Localization: Efficient Position Estimation for Mobile Robots)
  • 作者:Dieter Fox, Wolfram Burgardy , Frank Dellaert, Sebastian Thrun
AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

機器之心技術分析師 Elva Wang 對該論文進行了深度解讀:

蒙特卡羅定位(Monte Carlo Localization/MCL)使用了随機化的樣本(randomized samples)來表征一個機器人在環境中的位置的可信度(belief)。和之前的方法相比,這種方法在精确性、效率和易用性方面的表現是值得稱道的。MCL 最早是在 1999 年的國際機器人與自動化會議(International Conference on Robotics and Automation)上提出的,并在機器人領域的基于樣本的評估(sample-based estimation)中首次得到了應用,而現在它已經在種類廣泛的應用中得到了使用。

這種新的基于樣本的蒙特卡羅定位(sample-based Monte Carlo Localization)在計算上非常高效,同時還保留了它表征任意分布的能力。這種 MCL 應用了基于樣本的方法來逼近樣本數量所采用的機率分布,它是可以線上調整的,是以可以動态地調用樣本集,這是基于網格的方法(通過三維網格進行表征,在計算上非常繁瑣)所無法實作的。

引言

在移動機器人應用中,基于傳感器的定位一直以來都被認為是一個關鍵的問題。定位(localization)是一種線上時間狀态估計(on-line spatial state estimation),其中移動機器人需要在一個全局坐标系中估計其位置。定位問題有兩種:全局定位(global localizaion)和位置跟蹤(position tracking)。這篇論文指出全局定位問題難以解決,因為涉及到并不知曉其起始位置的機器人;而位置跟蹤問題則已經得到了很好的研究,其中機器人知曉起始位置,隻需考慮其運動過程所帶來的誤差即可。

機器人定位上的已有方法包括馬爾可夫定位(Markov localization)、卡爾曼濾波(Kalman Filtering)、粒子濾波(Particle Filtering)、即時定位與地圖建構(SLAM)和多機器人定位(Multi-robot localization)。

1. 馬爾可夫定位:

  • 中心思想:通過在可能位置上的機率分布來表征機器人的可信度(belief),并在機器人感覺或移動時使用貝葉斯規則和卷積來更新這個可信度。
  • 馬爾可夫假設:如果知道目前狀态,那麼過去和未來的資料是獨立的。

2.卡爾曼濾波:

  • 中心思想:将定位問題當作是一個傳感器融合問題(sensor fusion problem)
  • 假定:高斯分布函數

3.粒子濾波(蒙特卡羅定位)

  • 中心思想:由一個包含了 N 個權重的、随機的樣本或粒子的集合所确定的後驗可信度(posterior belief)
  • 即時定位與地圖建構(SLAM)

4.多機器人定位

在這篇論文中,作者思考了基于卡爾曼濾波的技術和馬爾可夫定位(包括拓撲馬爾可夫定位和基于網格的馬爾可夫定位)的局限性,然後又提供了基于樣本的密度近似蒙特卡羅定位(sample-based density approximate Monte Carlo localization)。這些方法的局限性包括:

  1. 基于卡爾曼濾波的技術基于一個假設:機器人位置的不确定性可以通過一個單峰高斯分布表示。基于卡爾曼濾波的技術已被證明在持續跟蹤機器人的位置上是穩健且精确的。但是,這種方法不能處理多模态的密度,而這在全局定位中很常見。其另一個局限是其最初的姿态必須是已知的,同時高斯不确定性要達到最大。
  2. 越來越豐富的方案使用拓撲馬爾可夫定位(Topological Markov localization)方法來表征不确定性,其已經避開了 vanilla 卡爾曼濾波中固有的高斯密度假設,并且可以通過狀态空間的表征所使用的離散化的類型而大緻區分開。但是,其狀态空間粗糙的分辨率限制了位置估計的準确度。
  3. 基于網格的馬爾可夫定位方法在處理多模态和非高斯密度上非常強大。但是,過度計算負載和表現先驗可信度的狀态空間大小和分辯率也影響該方法的性能。此外,其計算要求對準确度也有影響,因為并非所有的測量都可以被實時處理,是以有關該狀态的有價值的資訊就會被丢棄。

通過使用一種基于采樣的表征(sampling-based representation),相對于這一領域早期的成果,MCL 有幾個關鍵優勢:

  1. 與已有的基于卡爾曼濾波的技術相比,它能夠表征多模态分布,是以能夠全局地定位機器人。
  2. 相比于基于網格的馬爾可夫定位,它能極大地減少對記憶體的需求,并且可以以相當高的頻率內建測量。這個線上的算法非常适合任何時間的實作。
  3.  因為其樣本中所表征的狀态不是離散的,是以其在有固定的單元大小時比馬爾可夫定位更加準确。
  4. 其實作要容易得多。

蒙特卡羅定位

蒙特卡羅定位通常被稱為粒子濾波(Particle Filter),這是一種重要性重采樣(SIR),也被稱為自舉濾波(bootstrap filter)、蒙特卡羅濾波、凝聚算法(condensation algorithm)或适者生存算法(survival of the fittest algorithm)。其關鍵思想是通過一個有 N 個權重的、随機的樣本或粒子 S 的集合來表示後驗可信度 Bel(l)。

MCL 中的樣本表示成 <<x, y, theta>, p>,表示了機器人的位置(坐标 x,y,方向 theta)和數值權重因子 p,并假設 :

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

機器人移動

當機器人移動時,MCL 在移動指令之後生成 N 個近似該機器人位置的新樣本,其中每一個樣本都是從之前計算出的樣本集中随機取出的,取出機率由它們的 p 值決定。

然後使用觀察到的動作 a,根據 P(l | l』, a) 生成一個單個随機樣本,進而得到該新樣本的 l。該新樣本的 p 值為 N^{-1}。

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

一個非傳感機器人的基于采樣的位置可信度近似

注意這種采樣技術的效果——從一個已知的起始位置開始,然後按實線的訓示和不确定性不斷增加的樣本集近似分布來執行動作;其中不斷增加的不确定性代表了由于滑移和漂移所造成的位置資訊的逐漸損失。該運動模型必須為噪聲提供補償。這會不可避免地導緻運動更新過程中粒子發散。這是可以預見的,因為如果一個機器人不感覺環境地盲目移動,那麼它對自己的位置就不會很确信。

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

圖 1:機器人運動的機率模型:在如圖所示的運動之後積累的不确定度:(a) 40 米,(b) 80 米

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

圖 2:機器人感覺的機率模型:(a) 在感覺到 5 米距離内的一個地标後的不确定度,(b) 相應的地圖

傳感器讀數

傳感器讀數是通過重新權重樣本集而整合進來的,這種方式在馬爾可夫定位中實作了貝葉斯規則。這種加好的樣本對于機器人丢失其位置軌迹的罕見事件中的重新定位(relocalization)是很關鍵的。如果當 MCL 使用有限樣本集時沒有生成接近機器人正确位置的樣本,那麼通過加入數量很少的随機樣本,MCL 可以有效地重新定位機器人以解決該問題。

設 <l, p> 是一個樣本,p ← alpha P(s | l),其中 s 是傳感器的測量,而 alpha 是歸一化(normalization)。這些參數總的來說必須使:

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

一種能在 O(N) 時間有效執行這個重采樣過程的算法可見于 (Carpenter, Clifford, & Fernhead 1997)。

補充材料

為了幫助讀者更深入地了解,機器之心分析師在下面提供了一些補充材料,其中包括僞代碼和一個一維機器人的示例。

僞代碼

給定一個環境的地圖,該算法的目标是讓機器人确定其在該環境中的位置。每次該算法都會以之前的可信度 :

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

緻動指令 u_t 和從傳感器收到的資料 z_t 作為輸入;然後輸出新的可信度 X_t。

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

示例

這是一個一維機器人的示例。假設一個機器人在一維的帶有三個相同的門的圓形走廊中運動,它的傳感器會根據自己的位置是否有門而傳回 ture 或 false。在這三次疊代的最後,和預想的一樣,該機器人的實際位置上的大部分粒子都得到了覆寫。

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

實驗結果

在本論文中,研究者相對于基于網格的方法而對 MCL 進行了評估,測試了 MCL 在僅使用視覺資訊的極端情形下的表現,并評估了 MCL 的自适應采樣方法的可用性。

相比而言,基于網格的方法(分辨率為 20 cm)與使用 5000 個樣本的 MCL 相比,所需的記憶體量多達十倍。在全局定位過程中,使用基于網格的方法在整合單次傳感器掃描時需要多達 120 秒時間,而在相同條件下 MCL 隻需連續不到 3 秒。此外,基于網格的定位的結果不是實時生成的。

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

圖:(a) 使用不同的空間分辨率的基于網格的馬爾可夫定位的準确度,(b) 使用不同數量的樣本(對數标度)的 MCL 的準确度。

在基于視覺的定位,基于網格的定位不能準确跟蹤機器人,因為其計算上的負載使其不可能整合足夠的大量圖像。但是,MCL 在全局定位和位置跟蹤上取得了成功,該系統能夠跟蹤多個假設以從定位錯誤中恢複。

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

相對于固定的樣本集,MCL 在自适應采樣(adaptive sampling)的評估中表現更好。頂部曲線描繪了在不同的樣本集大小上誤差大的頻率,而底部的線則給出了自适應采樣方法的同樣結果。在固定的樣本集大小上,自适應采樣比最好的 MCL 的誤差還要小。

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

為了評估采樣在定位中的效用,該論文的作者在一系列真實世界環境中對 MCL 進行了透徹的測試,其應用了三種不同的傳感器(相機、聲納和雷射測距資料)。其中兩個主要結果為:

  1. 比大多數之前精确的馬爾可夫定位算法,MCL 給出了顯著更加精确的結果,同時記憶體和計算資源的消耗也低一個數量級。在一些案例中,MCL 能可靠地定位之前的方法無法起效的機器人。
  2. 大體來說,在固定的樣本集上,自适應采樣的表現和 MCL 差不多。但在涉及到許多有不同不确定度的場景(全局 vs 局部)中,自适應采樣比固定樣本大小更優。

未來

未來,這種基于樣本的定位的更高效将會被應用到多機器人場景上,其中不同機器人的樣本集可以在機器人檢測到其它機器人時進行同步。他們也在計劃将蒙特卡羅方法應用于地圖擷取問題,其中最近的研究工作已經實作了新的統計架構,這種架構已被成功應用于使用網格表示的大型圓形環境中。

評論

在 AAAI 2017 上,Sebastian Thrun 被授予了兩個獎項,AAAI 經典論文獎和 AAAI/EAAI 優秀教育家獎。他是 Udacity 的聯合創始人兼首席執行官,并創立了谷歌的自動駕駛團隊。去年,Udacity 開發了第一個自動駕駛汽車納米學位(Nanodegree)項目,在第一輪就吸引了超過 11000 個申請。

在實踐中,該 MCL 線上自适應采樣實作了比基于網格的馬爾可夫更高效、更精确的和更有價值的算法。補充材料部門的僞代碼也很容易實作。MCL 依照先驗機率中最可能的方式随機的猜測可能的位置,并調整樣本數量與傳感器資料中的不一緻數量比。

相比于 SLAM,包括 MCL 在内的所有定位方法都需要先驗地圖或預定義地圖,因為定位的目的是定位一些關于機器人的特征。我們需要這些特征确定機器人的位置。如果特征不确定,就适合使用 SLAM。

經典論文提名獎

經典論文提名獎(Honorable Mention)被授予了發表于 1999 年的論文:

  • 論文标題:Combining Collaborative Filtering with Personal Agents for Better Recommendations
  • 作者:Nathaniel Good, J. Ben Schafer, Joseph A. Konstan, Al Borchers, Badrul Sarwar, Jon Herlocker, John Riedl

理由:找到了将協同過濾與内容過濾結合起來的有效方式,能夠為使用者做出更好的推薦。

機器之心技術分析師李俊毅對此論文進行了深度解讀:

論文介紹

這篇論文展示了一種組合資訊過濾和協同過濾這兩種算法的方式。文章提出了一種能夠将個人資訊過濾(IF)智能體(agent)與産品社群使用者的意見結合起來以産生比單純的基于智能體或者基于使用者群更好推薦效果的協同過濾(CF)架構。文章也表明,使用 CF 創造一個個人智能體組合能夠得到更好的結果,比單獨智能體或其他機制的組合效果都要好。從這些結果種可以得到的一個重要的暗示是使用者可以讓 CF framework 來幫助使用者從所有的選項中選擇最優的結果而不用自己親自選擇。在那個年代,這是搭建這一架構的良好嘗試。

在這篇論文解讀中,除了介紹有關推薦系統的基本思想,我們也打算幫助讀者了解假設以及實驗設計,并基于 RSs 的目前發展給出我個人的看法。最後還會推薦些有價值的閱讀材料幫助讀者深入研究推薦系統。

一. 背景——資訊超載與推薦系統

時間的推移,我們正在進入一個被稱為資訊過載的時代。現在,人們發現去尋找他們想要的資訊變得越來越困難。使用者想要從大量繁雜的資訊中尋求最感興趣的資訊,而公司想要将他們的産品有效地推薦給使用者。然後這兩者在現在都很難實作。是以,推薦系統應運而生來解決這個問題。

Ricci 等人對推薦系統給出了定義:tools which can「recommend a set of items for a user or a set of users for an item」

推薦涉及到了很多的決策(decision-making)的過程,包括知識來源(訓練集)以及推薦算法。因為 RSs 是個性化的,并且是從已經被别人知道的且不是個性化定制的産品中進行推薦,是以 RSs 不僅僅可以幫助使用者有效的找到感興趣的東西,更可以幫助公司找到一個有效的方式來介紹他們的産品給潛在的使用者。

推薦系統,萌芽于 1970 年,從 19 世紀 70 年代開始發展并逐漸商業化,到現在已經發展了超過二十年。Martin 等人在 2011 年總結了兩次 RSs 的潮流,這将有助于初學者了解 RSs 的發展進化。我們以下将要 review 的論文被發表在 1999 年,算是第一次大潮的結尾和第二次大潮的開始。

第一次浪潮發生在 1990 到 2000 年,電子郵件和新聞報紙等一起帶來了第一次資訊過載,很多人開始重視這個問題,并且 RSs 出現了。這個是 RSs 的啟蒙階段。然而,dot-com 泡沫在 2000 年破裂,狠狠的打擊了 RSs 的發展。之後第二次浪潮出現在 2000 年間,這是 RSs 的快速發展階段。随着網際網路的使用者和産生的資料在急劇增長(例如 電子商務和社交網絡),RSs 在幫助公司傳遞消息給使用者的這個過程中逐漸扮演着一個越來越重要的角色。舉例而言,Netflix、Amazon、Yahoo!音樂以及 Pandora 都在使用 RSs 來推銷他們的商品。協同過濾以及内容過濾算法在這段時間變得越來越流行。在 2006-2009 年間,Netflix 釋出了一個包含數百萬電影評分資料庫,并且号召相關研究人員來根據它來開發一個新的能夠打敗他們自己的推薦系統,Cinematch [21]。這個競賽在當時掀起了一股 RSs 研究熱潮。在當時有許多傑出的研究者以及算法誕生,最後這個比賽以「BellKor's Pragmatic Chaos」的獲勝告終。

二. 應對資訊超載的常見解決方案

1.三種應對資訊超載的方法

這裡有三種通常應對資訊過載的方法。每個方法都對應處理不同的問題:

  • 資訊檢索: 完成瞬時出現的興趣查詢
  • 資訊過濾:将新的資訊流分化歸類
  • 協同過濾:我應該看哪個 items(總體或者從某個集合)或者我有多喜歡這些 items。

這三種方法每一種對于推薦系統來說都十分重要。我們可以簡單地把 IR 當作搜尋引擎,把 IF 看作基于基于内容過濾的方法(友善了解)。下面是一些對這三個技術的一些解釋:

資訊檢索是一個可以根據使用者的請求從一個資訊庫中檢索資訊的系統。如果你正在使用 google,那麼對你而言了解這個概念應該并不困難。在這篇 paper 中,作者認為由于 IR 并不能抓取到使用者的偏好,并不是很有價值因為他們并沒有抓取到除了使用者的精确的請求之外的偏好,是以作者并沒有在他的架構中使用 IR。

協同過濾系統建構一個資料庫容納着供使用者選擇的項目。舉例而言,Mike 和 John 都是學習計算機科學的學生,那麼 Mike 買了一本名叫機器學習的書而 John 沒有,那麼 RSs 就會将這本名叫機器學習的書推薦給 John,根據相似使用者。

協同過濾算法有很多優點:

  • 使用者和資料友好性:可以處理分結構化資訊,能夠發現新的興趣點,并沒有專業知識需求,并且可以個性化推薦;
  • 性能方面:自動化程度高,并且性能是會随着時間的推移變好的
  • 互動性好:協同過濾能夠讓使用者之間互相分享選擇,并且一小部分的使用者額選擇是會影響到推薦系統給别的使用者的推薦結果的

盡管 CF 有很多優點,但它依然存在稀疏性問題,冷啟動問題以及可解釋性差的問題。下面我們要介紹的 IF 可以在某些方面解決這個問題。

資訊過濾(IF)需要一個針對使用者需求和偏好地簡介。最簡單的系統需要使用者手動的或者在一定的協助下建立這個簡介。舉例而言,如果 Mike 買了一本叫做 C++ programming 的書,那麼 RSs 就比較傾向「認為」Mike 也會喜歡「Data Structure」或者「C programming」這本書因為這些書之間都十分的相似。現在,我們把協同過濾和基于内容的過濾當作兩種資訊過濾的方式,但是這篇 paper 把他們分開考慮。是以,如果你在了解這個概念的時候有困難,暫時将它當作基于内容的過濾會有幫助。

資訊過濾依舊不能應對所有的情況。盡管它能夠解決冷啟動的問題,并且也很有效率,但是依然有很多問題存在:在資訊挖掘方面缺乏全面性,推薦内容的限制和使用者回報的不足。

無論是 CF 還是 IF 都不是完美的,但是他們都有自己的優勢,是以有一些研究者會嘗試組合他們。

2.混合推薦系統

 一些混合推薦系統會組合兩個或者更多的推薦技術來得到一個更好的可以克服單一推薦技術的缺點的推薦系統。盡管我們已經有了兩個流行的并且也有一定效率的推薦算法,IF 以及 CF,但是他們都不能夠滿足所有的需求。是以有很多方法通過組合這兩種方法來避免 CF 或者 IF 的缺點:

  • 組合 CF 系統和 IF 系統的預測結果,比如使用投票政策或者評級政策。例如 Pazzani 的組合就是将每個系統的輸出作為一個投票集合,然後将他們組合
  • 基于協同過濾算法,添加一些 IF 算法的特點,就像我們這篇論文的思路。
  • 基于 IF 算法,添加協同過濾算法的特點。
  • 建構一個新的可以結構系統過濾算法和 IF 算法的特點的模型。例如,我們可以在使用協同過濾進行推薦之前使用基于内容的過濾先處理資料集。如果我們把整個決策過程分開的話,這看起來有點像是預處理,但實際上要複雜一些。

Sarwar, et al. (1998) 提出了一個将内容過濾評分整合協同過濾器系統的模型。它是一個簡單但是穩定的可以評估使用者網新聞文章的拼寫品質的智能體,它甚至可以作為一個協同過濾社群中有價值的一個參與者。在那篇研究中,他們表明這些過濾器機器人程式——作為協同過濾系統的參與成員的評分機器人——如何通過給與他們有類似偏好的人高的偏好相關性,來幫助這些使用者。而對于并不贊同自己的使用者,CF 會配置設定一個低的偏好相關性,并不會利用自己的評分來幫助他們。

我們正在 review 的這篇論文從三個重要的方面延伸了過濾器機器人程式的概念。首先,使用了一套更加智能的過濾器機器人程式,包括會學習的智能體,它能根據個體使用者定制化。第二,這篇研究被應用于小型社群,包括使用 CF 為單個人類使用者服務。第三,評估了同時使用多過濾器機器人程式的效果。另外,我們也探索了其他組合機制,作為 CF 的替代。我們證明,CF 是一個有用的架構,無論對于綜合智能體來說,還是用于結合智能體與人類。

三.資料集與評估名額

資料集

有許多能被用來訓練推薦系統的資料組,比如,Netflix dataset, CiteULike, Delicious 資料組以及 MovieLens 資料組。這篇論文基于 MovieLens 進行實驗【2,3】。用于實驗的使用者評分來自 MovieLens system (http://movielens.umn.edu),這個系統大概有 3 百多萬評分,來自 8 萬多名使用者。随機挑選 50 名使用者的 120 多條電影評分。針對每個使用者,不放回地随機挑選三套電影/評分對。第一套是 50 個評分,叫做訓練集合,用來訓練個性化資訊過濾智能體;第二套是 50 個評分,叫做關聯集合,在基于使用者組合,智能體組合以及使用者和智能體的組合的時候使用。最後一個集合有 20 個評分,作為測試集合。在每個試驗中,目标使用者的測試評分會被保留并且和系統産生的推薦結果做對比。

評估名額

  • 推薦系統研究者會用一些不同的評估方法來評估推薦結果的品質
  • 覆寫率:覆寫率是評估系統能夠提供的推薦結果中 items 的數量
  • 統計精度度:通過對每一個 item 比較數字化的評估 (預測) 值和使用者的評分(真實值)來評估系統的準确度。我們通常用 mean absolute error 或者 root mean squared error 來幫助評估這個名額。
  • 決策支援度:蘋果推薦結果對于使用者選擇高品質的 item 有多大額幫助。最常用的決策支援度評價名額有 reversal rate、weighted errors 和 ROC 敏感度。ROC 經常用來評估算法性能,也是這篇論文主要使用的名額之一。ROC 敏感度是從 0 到 1 在變化的,其中 1 代表完美,0.5 代表随機。
  • 統計重要性也可以用平均絕對誤差(mean absolute error)來進行評估
  • 評估假設:面對多個評價名額的話,評估假設(是否成立)是一個很困難的工作。我們認為統計精确度和決策支援度都很重要。當出現 A 和 B 在兩個名額上面表現不同但是又無法比較的時候,就是說當 A 假設在 x 名額上比 B 假設要好,但是 y 名額上卻相反,那麼我們就認為他們中的任意一個都是潛在的「最優智能體」,就用所有的智能體與别的模型進行比較;然而,如果 A 智能體在 x 名額上比 B 智能體要好,y 名額 s 卻相差不多,那麼我們認為 A 智能體遠勝于 B 智能體。

假設與實驗設計

這篇 paper 呈現了一種很有趣的實驗設計思路。首先,它給定四個假設然後根據這些假設進行實驗設計,之後通過實驗來驗證這些假設。這是我們可以從這篇 paper 中學習到的很棒的一點。基于四個假設,這個 paper 設計了兩個層次。第一比較每個模型的不同實作, 并且選擇最好的一個作為 (每個模型的) 代表. 第二, 通過比較每個模型的代表來比較不同的模型。下面是四個假設:

  • (基于)一組使用者(的實驗)可以提供比基于單個個性化的智能體更好的推薦效果
  • (基于)個性化智能體的組合(的實驗)可以産生比單個個性化智能體更好的效果
  • (基于)一組使用者(的實驗)可以提供比基于個性化智能體的組合更好的推薦效果
  • (基于)個性化智能體以及一組使用者的組合(的實驗)可以産生比單使用智能體組合或者使用者組合更好的效果

總的來說,對智能體和使用者的組合要優于單單使用他們中的任何一個;一組使用者的選擇要優于任何種類的個性化智能體。這篇論文使用 控制變量法來設計了四個子產品,如下圖所示:

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

基于我們所說的假設,四個子產品分别是:一組使用者的選擇,單獨的一種智能體,多種智能體組合以及智能體和使用者(的選擇)的組合。

1. 隻基于使用者選擇進行實驗

DBLens,是被包括作者在内的 GroupLens 的一個研究項目。它是一種基于 Orcle 的用來實作協同過濾的工具箱。并且它語序實驗者通過控制幾個參數來改變系統性能,覆寫率以及準确度。是以這篇論文使用了 DBLens 的協同過濾器引擎來探究協同過濾器算法。

2. 單種 IF 智能體

這篇論文探究了三種 IF 智能體:DGBots、RipperBot 以及 Genrabots。

  • Doppelganger Bots (DGBots) 使用 IR/IF 技術(一種改進 TFIDF 技術)基于電影的内容特征來建立一個可以反應使用者偏好的簡介,生成一個預測性的個性化機器人。本文中為廣播的資料,描述性的關鍵詞以及兩者的組合分别建立了 DGBots。
  • Doppelganger Bots (DGBots)是一種通過 IR/IF 技術基于電影内容特征來建立和預測使用者偏好的個性化機器人。IR/TF 技術改進自 Salton 和 Buckley 于 1987 年提出的 TFIDF。本文中為傳播的資料,描述性的關鍵詞以及兩者的組合分别建立了 DGBots.
  • RipperBot 是在 1995 年被 Willam Cohen 發明的歸納邏輯程式,而它在有限的類型标志符以及 200 個最常見的關鍵詞的資料集上表現最好。
  • Mega-GenreBot 通過使用線性回歸來在每個使用者的訓練集上面訓練實作,而且根據後期的實驗它确實提供了最好的推薦結果。

3. 這篇論文使用了四個不同的政策來組合智能體:

  • BestBot:通過在相關資料集測試每個 bot 然後選擇 MAE 最低的那個 bot 作為最好的 bot。
  • Agent Average:通過分别計算 5 個或者 23 個智能體的算術平均得到
  • Regression:我們使用線性回歸來針對一個給定使用者産生一個「最适應」的組合
  • CF Combination:我們使用 DBLens 協同過濾引擎來建立一個智能體的協同過濾組合

4. IF 智能體和使用者選擇的組合

因為使用者評分是不完整的,并且基于 23 個智能體的 CF 被證明是最有效的對 IF 的組合,我們使用 CF 來組合 23 個智能體以及全部的 50 個使用者。

結果與結論

在結果中,這篇論文分别讨論了四個假設的情況,并且對每個假設都得出了結論。最後,我們發現假設 1 和假設 3 是成立的,但是假設 2 和假設 4 是不成立的。由于分析方法類似,是以我們着力分析假設 1 的情況。

對于假設 1 來說,就像我們從這張表中看到的情況,低的 MAE 表示高的準确度,而高的 RCO 代表高的決策支援度。隻有 RipperBot,Mega-GenreBot,以及基于 cast 和 keywords(表格中)的 DGBot 沒有被别的智能體碾壓。但是他們表現都不完美。RipperBot 有高的準确度但是決策支援度不是很好;DGBot Comb 有最好的決策支援都但是卻有相對低的準确度;Mega-GenreBot 在兩個名額上面都排第二。是以我們用他們和 CF of Users 進行比較。結果發現,RipperBot 擁有最棒的準确度,而且要優于 CF of Users;而 CF of Users 盡管擁有最好的決策支援度,但是卻好的十分有限,相差不是很多。是以我們綜合而言,判定假設 1 不成立。

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

部分結果

分析和假設 1 十分類似,對于假設 2 來說,我們可以看到,CF 1 usr, 23 bots(應該是 bot,不過作為為了節省空間寫作 bts)要在兩項名額上面優于 Ripperbot, MegaGenreBot 以及 DG Combo Bot。對于假設 3 來說,CF 1 usr,23 bots 要優于 CF(users only);對于假設 4 來說,CF 50 usr, 23 bots 要優于 CF 1 usr, 23 bots。是以我們最後判定假設 2 和 4 成立,而 3 不成立。

AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統
AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統
AAAI-17獲獎論文深度解讀(下):蒙特卡羅定位和推薦系統

結論

這篇論文發現的最重要的結果是用 CF 來組合智能體的價值以及用 CF 來組合智能體和使用者的價值。這個意味着他們确确實實找到了一個可以用來組合 IF 智能體以及使用者的并可以産生更好的結果的 CF 架構。除此以外,實驗結果中還發現了 CF 作為智能體的組合機制要比線性回歸更好,這屬于意外收獲出乎意料的。實驗結果表明,CF 在資料的行數接近列數的時候可以避免過拟合資料并且可以處理不完全的資料集合。

或許因為作者的實驗是基于自己以往的正面經驗,是以 RipperBot 和 CF 在 50 個使用者的資料集上取得了很好的效果,但是進一步調整之後情況卻并不很好,這一點作者也無法給出解釋。

在未來,他們打算實作推薦系統中智能體與使用者的進一步結合。具體地說,他們有興趣開發一個有大量使用者與智能體共存的社群。他們希望回答的一個問題是相似情況額使用者,能夠從根據彼此的情況訓練出來的智能機中得到有用的資訊呢?

該論文示範了一個能夠結合個性化 IF 代理和使用者社群觀點的 CF 架構。随着時間發展,推薦系統會變得越來越成熟。大約從 1999 年起,許多研究團隊都在嘗試尋找改進推薦系統性能的好方法。該論文想出了結合 IF 和 CF 的好思路,盡管這種思路在現在來說很普遍,但在當時來說還是很有意義的。

在這一架構中,作者們沒有提到資訊檢索,因為除了特定查詢,它不會捕捉使用者偏好的其他資訊。在此論文中,這是合理的。因為它的架構适用于這種情況。然而,我認為它對改進推薦系統很有幫助,因為這是來自使用者的特定需求,可通過推薦系統調整結果。此外,如果使用者有明确的要求,推薦系統反而會難以給出結果。是以,我認為搜尋引擎和推薦系統的結合在未來會更加流行。

關于度量名額,我們如今也有更多的方式。新奇程度 [13]、驚訝程度 [14] 和可了解程度 [15] 都可作為推薦系統的名額。如果使用這些度量名額評估該實驗,可能會有新的發現。

閱讀推薦

  • Adomavicius, Gediminas, and Alexander Tuzhilin. "Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions." IEEE transactions on knowledge chachu'lnd data engineering 17.6 (2005): 734-749.
  • Ricci, Francesco, Lior Rokach, and Bracha Shapira. Introduction to recommender systems handbook. Springer US, 2011.
  • Martin, Francisco J., et al. "The big promise of recommender systems." chulchuI Magazine 32.3 (2011): 19-27.
  • Resnick, Paul, and Hal R. Varian. "Recommender systems." Communications of thchu'le ACM 40.3 (1997): 56-58.
  • Burke, Robin, Alexander Felfernig, and Mehmet H. Göker. "Recommender schulstems: An overview." AI Magazine 32.3 (2011): 13-18.
  • Bennett, James, and Stan Lanning. "The netflix prize." Proceedings of KDD cup and workshop. Vol. 2007. 2007.

第一篇解讀文章的參考文獻:

  • Dieter Fox, Wolfram Burgard, Sebastian Thrun, “Markov Localization for Mobile Robots in Dynamic Environments”, J. of Artificial Intelligence Research 11 (1999) 391-427

    Sebastian Thrun, “Probabilistic Robotics: Tutorial presented in AAAI 200” – available through S.Thrun Web page

  • Ioannis M. Rekleitis. "A Particle Filter Tutorial for Mobile Robot Localization." Centre for Intelligent Machines, McGill University, Tech. Rep. TR-CIM-04-02 (2004).
  • Frank Dellaert, Dieter Fox, Wolfram Burgard, Sebastian Thrum "Monte Carlo Localization for Mobile Robots." Proc. of the IEEE International Conference on Robotics and Automation Vol. 2. IEEE, 1999.
  • Sebastian Thrun, Wolfram Burgard, Dieter Fox  "A Probabilistic Approach to Concurrent Mapping and Localization for Mobile Robots "- Autonomous Robots, 1998, Springer
  • Sebastian Thrun, Wolfram Burgard, Dieter Fox. Probabilistic Robotics MIT Press, 2005. Ch. 8.3 ISBN 9780262201629.
  • Sebastian Thrun, Dieter Fox, Wolfram Burgard, Frank Dellaert. "Robust monte carlo localization for mobile robots." Artificial Intelligence 128.1 (2001): 99–141.
  • Dieter Fox. "KLD–Sampling: Adaptive Particle Filters." Department of Computer Science and Engineering, University of Washington. NIPS, 2001. 

第二篇解讀文章的參考文獻:

  • 1. http://nathangood.com/
  • 2. https://movielens.org/_ (https://movielens.org/)
  • 3. https://en.wikipedia.org/wiki/MovieLens_ (https://en.wikipedia.org/wiki/MovieLens)
  • 4. Pazzani, Michael J. "A framework for collaborative, content-based and demographic filtering." Artificial Intelligence Review 13.5-6 (1999): 393-408.
  • 5. Claypool, Mark, et al. "Combining content-based and collaborative filters in an online newspaper." Proceedings of ACM SIGIR workshop on recommender systems. Vol. 60. 1999.
  • 6. Balabanović, Marko, and Yoav Shoham. "Fab: content-based, collaborative recommendation." Communications of the ACM 40.3 (1997): 66-72.
  • 7. Soboroff, Ian, and Charles Nicholas. "Combining content and collaboration in text filtering." Proceedings of the IJCAI. Vol. 99. 1999.
  • 8. Basu, Chumki, Haym Hirsh, and William Cohen. "Recommendation as classification: Using social and content-based information in recommendation." Aaai/iaai. 1998.
  • 9. Popescul, Alexandrin, David M. Pennock, and Steve Lawrence. "Probabilistic models for unified collaborative and content-based recommendation in sparse-data environments." Proceedings of the Seventeenth conference on Uncertainty in artificial intelligence. Morgan Kaufmann Publishers Inc., 2001.
  • 10. Martin, Francisco J., et al. "The big promise of recommender systems." AI Magazine 32.3 (2011): 19-27.
  • 11. Resnick, Paul, and Hal R. Varian. "Recommender systems." Communications of the ACM 40.3 (1997): 56-58.
  • 12. Negroponte, N. "The Architectural Machine: Toward a More Human Environment." (1970): 5.
  • 13. Oscar Celma and Perfecto Herrera. A new approach to evaluating novel recommendations. In Proceedings of the 2008 ACM conference on Recommender systems, RecSys ’08, pages 179–186, New York, NY, USA, 2008. ACM.
  • 14. Mouzhi Ge, Carla Delgado-Battenfeld, and Dietmar Jannach. Beyond accuracy: evaluating recommender systems by coverage and serendipity. In Proceedings of the fourth ACM conference on Recommender systems, Rec-Sys ’10, pages 257–260, New York, NY, USA, 2010. ACM.
  • 15. Burke, Robin, and Maryam Ramezani. "Matching recommendation technologies and domains." Recommender systems handbook. Springer US, 2011. 367-386.
  • 16. http://www.aaai.org/Conferences/AAAI/aaai17.php
  • 17. Burke, Robin. "Hybrid recommender systems: Survey and experiments." User modeling and user-adapted interaction 12.4 (2002): 331-370.
  • 18. Negroponte, N. "The Architectural Machine: Toward a More Human Environment." (1970): 5.
  • 19. Burke, Robin. "Hybrid recommender systems: Survey and experiments." User modeling and user-adapted interaction 12.4 (2002): 331-370.
  • 20.Claypool, Mark, et al. "Combining content-based and collaborative filters in an online newspaper." Proceedings of ACM SIGIR workshop on recommender systems. Vol. 60. 1999.
  • 21.Bennett, James, and Stan Lanning. "The netflix prize." Proceedings of KDD cup and workshop. Vol. 2007. 2007.