“非合作对策”的意思、由来-百科全书

词条

非合作对策

释义

feihezuo duice
非合作对策(卷名：自动控制与系统工程)
noncooperative games
　　对策论中局中人在选择各自策略时不结成任何联盟的对策问题。非合作对策按局中人数可分为二人对策和多人对策，按局中人的支付（或得失）之和可分为零和对策和非零和对策。
　　二人零和对策　对策论中理论最简单又最完善的部分是二人零和对策，它是其他各部分理论的基础。许多游戏都可看作是二人零和对策的例子。在一个二人对策问题中(例如两人进行对抗性竞赛)，参加者分别为局中人甲和乙,他们各自有自己的策略,即在对抗竞赛中所采取的行动方案。设甲有m个策略，乙有п个策略。当甲选取第i个策略而乙选取第j个策略时便形成一种局势。此时甲、乙双方会有赢得或损失。甲、乙双方得失之和为零，即一方所得等于另一方所失。若甲所得为ɑ_ij=f(i，j)(i=1,…,m;j=1,…,п)，乙所得为-ɑ_ij,则ɑ_ij为甲取第i个策略、乙取第j个策略时甲的支付（或赢得）。甲的支付可列成如下的矩阵表：

并可用矩阵方法进行处理。因此这类对策也称为二人零和矩阵对策。对策论的基本问题是局中人采取何种策略才能使自己赢得最多（或损失最少）。
　　局中人甲也可以概率α₁选取第一个策略，…，以概率 α_i选取第i个策略，…，最后以概率α_m选取第m个策略。这样得到一个概率向量α=(α₁,…，α_i,…，α_m)，其中α_i≥0，i=1,…,m，

α称为甲的一个混合策略，而原来的 m种策略称为甲的纯策略。同样可引进局中人乙的混合策略β=(β₁，…，β_j，…,β_n)。若用X₁、X₂分别代表甲、乙的混合策略全体的集，并分别称X₁,X₂为甲、乙的策略空间（以下在不产生误解的情况下称混合策略为策略）。当甲取策略α而乙取策略β时，甲的期望支付(赢得)是

，记作K₁(α，β),并称为甲的支付函数。显然乙的支付函数为-K₁(α,β)，其中α∈X₁，β∈X₂。
　　对二人零和对策,若有策略对(╋,娕)便形成一种局势。若对甲的一切策略α ∈X₁,总有K₁(╋,娕)≥K₁(α,娕)，则╋称为甲的一个优策略。同样，若对乙的一切策略β∈X₂，也总有-K₁(╋,娕)≥-K₁(╋,β)或K₁(╋,娕)≥或K₁(╋,β),则娕称为乙的优策略，而(╋,娕)称为对策的优策略对，或称为鞍点,这是二人零和对策的解。显然在鞍点(╋,娕)对一切α∈X₁，β∈X₂，均满足
K₁(α ,娕)≤K₁(╋,娕)≤K₁(╋,β)

此式称为诺伊曼鞍点定理或最小最大定理，它等价于方程

计算鞍点有多种方法，如利用线性规划中的单纯形法等。
　　多人非合作对策　与二人零和对策理论相似，多人非合作对策中讨论最多的是正规型的。若把几个参与者顺次记为局中人1，2，…，n，并设局中人i的策略全体的集为x_i(i=1,…,n)，则称x_i为局中人i的策略空间。当每个局中人各自选择一个策略x_i∈x_i(i=1,…,n),便形成一种局势（x₁,…,x_n）。此时局中人i的支付可用函数K_i(x₁，…,x_n)表示。它是定义在乘积空间

上的实值函数、若

（常数）,则称此对策为常和对策；特别当c=0时,称此 n人对策为 n人零和对策，若n=2,即为上述的二人零和对策。在非合作对策中，局中人在选择各自策略时，根据对策的规则，不应结成任何联盟；否则，就会变成“合作对策”。对一个非合作的多人对策，若有策略组（憫₁，…,憫_n）,对局中人i的一切策略x_i∈X_i，总有K_i(憫₁,…,憫_i_-1,憫_i,憫_i₊₁,…,憫_n)≥K_i(憫₁,…,憫_i_-1,憫_i,憫_i₊₁,…,憫_n)则憫_i对局中人i来说是宜取策略。若对i=1，…，n,均有宜取策略憫_i,则称(憫₁,…,憫_i,…,憫_n)为多人非合作对策的一个平衡点。J.纳什证明，在一定条件下有平衡点存在。n=2时,平衡点就是二人零和对策中的鞍点。多人非合作对策平衡点的计算尚无有效的方法。

随便看

百科全书收录78206条中英文百科知识，基本涵盖了大多数领域的百科知识，是一部内容开放、自由的电子版百科全书。