天天看點

人工智能實戰2019 - 第7次作業(2) - 王铈弘

項目 内容
課程 人工智能實戰2019
作業要求 第7次作業
課程目标 學習人工智能基礎知識
本次作業對我的幫助 練習玩黃金點遊戲
參考文獻 創新的時機 - 黃金點遊戲,挑戰黃金點

個人見解

經過認真的分析可知,如果玩家們足夠理性、遊戲次數足夠多,黃金點會趨向于0。但在實際的黃金點遊戲中,并不是每個人都是理性的、做了長遠思考的(比如我自己,第一次玩時沒做出理性思考,每次都是猜着送出了一個數,最終成績倒數),是以當遊戲次數足夠多時,黃金點會先較快的下降,然後穩定波動。

在諸多因素影響下,黃金點的變化類似下圖。

人工智能實戰2019 - 第7次作業(2) - 王铈弘

基于學習的政策

對于此類博弈論的問題,強化學習的算法最受人期望,這樣模型就可以自我改進,更好的處理拐點後的預測。但我對于強化學習的了解目前隻在概念階段,沒有看懂強化學習的相關算法,無法實作。希望以後能夠嘗試。

基于時間序列模型和機器學習算法的政策

Facebook所開源的Prophet模型,值得一試(mark,沒能有時間去嘗試。。。)

基于簡單心理的政策

對于在房間1中進行遊戲,取過去10場遊戲黃金點的平均值。

對于在房間2中進行遊戲,可以送出2個數,一個作為幹擾,一個作為預測。對于玩家數較少的環境,自己産生的幹擾對全局的影響可定性為提高黃金點,但無法定量估計。對于玩家數多的環境,自己産生的幹擾對于黃金點的影響無法做定性和定量的分析。也可以送出兩個預測值,以期此區間内包含黃金點,一定程度上可以提高積分。

基于控制算法的政策

學習過自動控制原理,可能會想到卡爾曼濾波等控制算法。但是控制算法主要是作用于期望的運動,噪聲應遵循高斯分布。顯然不适用于黃金點遊戲。

轉載于:https://www.cnblogs.com/wangshihong/p/10843864.html