人工智能實戰2019 - 第7次作業（2） - 王铈弘

個人見解

經過認真的分析可知，如果玩家們足夠理性、遊戲次數足夠多，黃金點會趨向于0。但在實際的黃金點遊戲中，并不是每個人都是理性的、做了長遠思考的（比如我自己，第一次玩時沒做出理性思考，每次都是猜着送出了一個數，最終成績倒數），是以當遊戲次數足夠多時，黃金點會先較快的下降，然後穩定波動。

在諸多因素影響下，黃金點的變化類似下圖。

對于此類博弈論的問題，強化學習的算法最受人期望，這樣模型就可以自我改進，更好的處理拐點後的預測。但我對于強化學習的了解目前隻在概念階段，沒有看懂強化學習的相關算法，無法實作。希望以後能夠嘗試。

Facebook所開源的Prophet模型，值得一試（mark，沒能有時間去嘗試。。。）

對于在房間1中進行遊戲，取過去10場遊戲黃金點的平均值。

對于在房間2中進行遊戲，可以送出2個數，一個作為幹擾，一個作為預測。對于玩家數較少的環境，自己産生的幹擾對全局的影響可定性為提高黃金點，但無法定量估計。對于玩家數多的環境，自己産生的幹擾對于黃金點的影響無法做定性和定量的分析。也可以送出兩個預測值，以期此區間内包含黃金點，一定程度上可以提高積分。

學習過自動控制原理，可能會想到卡爾曼濾波等控制算法。但是控制算法主要是作用于期望的運動，噪聲應遵循高斯分布。顯然不适用于黃金點遊戲。

轉載于:https://www.cnblogs.com/wangshihong/p/10843864.html