项目 | 内容 |
---|---|
课程 | 人工智能实战2019 |
作业要求 | 第7次作业 |
课程目标 | 学习人工智能基础知识 |
本次作业对我的帮助 | 练习玩黄金点游戏 |
参考文献 | 创新的时机 - 黄金点游戏,挑战黄金点 |
个人见解
经过认真的分析可知,如果玩家们足够理性、游戏次数足够多,黄金点会趋向于0。但在实际的黄金点游戏中,并不是每个人都是理性的、做了长远思考的(比如我自己,第一次玩时没做出理性思考,每次都是猜着提交了一个数,最终成绩倒数),所以当游戏次数足够多时,黄金点会先较快的下降,然后稳定波动。
在诸多因素影响下,黄金点的变化类似下图。
基于学习的策略
对于此类博弈论的问题,强化学习的算法最受人期望,这样模型就可以自我改进,更好的处理拐点后的预测。但我对于强化学习的理解目前只在概念阶段,没有看懂强化学习的相关算法,无法实现。希望以后能够尝试。
基于时间序列模型和机器学习算法的策略
Facebook所开源的Prophet模型,值得一试(mark,没能有时间去尝试。。。)
基于简单心理的策略
对于在房间1中进行游戏,取过去10场游戏黄金点的平均值。
对于在房间2中进行游戏,可以提交2个数,一个作为干扰,一个作为预测。对于玩家数较少的环境,自己产生的干扰对全局的影响可定性为提高黄金点,但无法定量估计。对于玩家数多的环境,自己产生的干扰对于黄金点的影响无法做定性和定量的分析。也可以提交两个预测值,以期此区间内包含黄金点,一定程度上可以提高积分。
基于控制算法的策略
学习过自动控制原理,可能会想到卡尔曼滤波等控制算法。但是控制算法主要是作用于期望的运动,噪声应遵循高斯分布。显然不适用于黄金点游戏。
转载于:https://www.cnblogs.com/wangshihong/p/10843864.html