全球旧事资料 分类
机器博弈(Machi
eGamePlayi
g)注:维基百科和百度百科中对机器博弈的介绍较少,如有错误请多指教。01关于机器博弈11机器博弈的含义:机器博弈就字面意思理解,即机器参与到博弈的过程当中,这不仅包括机器与机器之间的博弈,也包括机器与人类之间的博弈。12机器博弈的特征:智力竞技机器博弈过程中机器与对手之间存在着智力上的比拼,并以此区分胜负。13机器博弈的目标:击败对手机器博弈涉及多个主体,其最后的结果为分出胜负,博弈双方的目标均为击败对手,02博弈问题的描述(以棋类游戏为例)21博弈问题的形式化定义:博弈被定义为一个四元组:GOsosg其中:1Gc:博弈空间棋局或博弈状态的集合2Oo:算子空间操作或规则的集合3coG:当前棋局或博弈状态最初即开局4cgG:胜局或博弈目标集合应用O中的算子操作或规则对co进行操作,使其有利于转换为胜局cgcg的过程称为博弈。22博弈问题的三要素:co和cg以及O1操作又称规则或算子:
fo
GG或:
cjocicicjGoO
2当前棋局最初是开局:coG机器当前面对的棋局3k步博弈树:基于co的k步博弈规划图03机器博弈举例31一字棋与极大极小算法311MaxMi
博弈:Step1生成k步博弈树Max代表机器一方Mi
代表敌方设Max面对的当前棋局为co,以co为根,生成k步
博弈树
Step2评估棋局博弈状态估价函数:为特定的博弈问题定义一个估价函数estc,用以评估k步博弈树叶节点对应的棋局cG,estc的值越大,意味着棋局c对Max越有利。Step3回溯评估极大极小运算:由叶节点向根节点方向回溯评估,在Max处取最大评估值或运算,在Mi
处取最小评估值与运算。注:Max按取最大评估值的方向行棋Step4递归循环Max行棋后,等待Mi
行棋;Mi
行棋后,即产生对于Max而言新的当前棋局co返回Step1,开始下一轮博弈
f312一字棋:设有33棋格,Max与Mi
轮流行棋,黑先白后,先将3颗棋子连成一线的一方获胜。一字棋博弈空间:共有9种可能的博弈状态
一字棋算子空间:博弈规则集合O一字棋博弈目标集合对Max而言:定义估价函数:estc1对于非终局的博弈状态c估价函数为:estc所有空格都放上黑色棋子之后,3颗黑色棋子连成的直线总数-所有空格都放上白色棋子之后,3颗白色棋子连成的直线总数。
例如:c则estc321
2若c是Max的胜局,则:estc例如:cr
好听全球资料 返回顶部