人工智能实战2019 - 第7次作业（2） - 王铈弘

个人见解

经过认真的分析可知，如果玩家们足够理性、游戏次数足够多，黄金点会趋向于0。但在实际的黄金点游戏中，并不是每个人都是理性的、做了长远思考的（比如我自己，第一次玩时没做出理性思考，每次都是猜着提交了一个数，最终成绩倒数），所以当游戏次数足够多时，黄金点会先较快的下降，然后稳定波动。

在诸多因素影响下，黄金点的变化类似下图。

对于此类博弈论的问题，强化学习的算法最受人期望，这样模型就可以自我改进，更好的处理拐点后的预测。但我对于强化学习的理解目前只在概念阶段，没有看懂强化学习的相关算法，无法实现。希望以后能够尝试。

Facebook所开源的Prophet模型，值得一试（mark，没能有时间去尝试。。。）

对于在房间1中进行游戏，取过去10场游戏黄金点的平均值。

对于在房间2中进行游戏，可以提交2个数，一个作为干扰，一个作为预测。对于玩家数较少的环境，自己产生的干扰对全局的影响可定性为提高黄金点，但无法定量估计。对于玩家数多的环境，自己产生的干扰对于黄金点的影响无法做定性和定量的分析。也可以提交两个预测值，以期此区间内包含黄金点，一定程度上可以提高积分。

学习过自动控制原理，可能会想到卡尔曼滤波等控制算法。但是控制算法主要是作用于期望的运动，噪声应遵循高斯分布。显然不适用于黄金点游戏。

转载于:https://www.cnblogs.com/wangshihong/p/10843864.html