項目 | 内容 |
---|---|
課程 | 人工智能實戰2019 |
作業要求 | 第7次作業 |
課程目标 | 學習人工智能基礎知識 |
本次作業對我的幫助 | 練習玩黃金點遊戲 |
參考文獻 | 創新的時機 - 黃金點遊戲,挑戰黃金點 |
個人見解
經過認真的分析可知,如果玩家們足夠理性、遊戲次數足夠多,黃金點會趨向于0。但在實際的黃金點遊戲中,并不是每個人都是理性的、做了長遠思考的(比如我自己,第一次玩時沒做出理性思考,每次都是猜着送出了一個數,最終成績倒數),是以當遊戲次數足夠多時,黃金點會先較快的下降,然後穩定波動。
在諸多因素影響下,黃金點的變化類似下圖。
基于學習的政策
對于此類博弈論的問題,強化學習的算法最受人期望,這樣模型就可以自我改進,更好的處理拐點後的預測。但我對于強化學習的了解目前隻在概念階段,沒有看懂強化學習的相關算法,無法實作。希望以後能夠嘗試。
基于時間序列模型和機器學習算法的政策
Facebook所開源的Prophet模型,值得一試(mark,沒能有時間去嘗試。。。)
基于簡單心理的政策
對于在房間1中進行遊戲,取過去10場遊戲黃金點的平均值。
對于在房間2中進行遊戲,可以送出2個數,一個作為幹擾,一個作為預測。對于玩家數較少的環境,自己産生的幹擾對全局的影響可定性為提高黃金點,但無法定量估計。對于玩家數多的環境,自己産生的幹擾對于黃金點的影響無法做定性和定量的分析。也可以送出兩個預測值,以期此區間内包含黃金點,一定程度上可以提高積分。
基于控制算法的政策
學習過自動控制原理,可能會想到卡爾曼濾波等控制算法。但是控制算法主要是作用于期望的運動,噪聲應遵循高斯分布。顯然不适用于黃金點遊戲。
轉載于:https://www.cnblogs.com/wangshihong/p/10843864.html