“队决策理论”的意思、由来-百科全书

词条	队决策理论
释义	duijuece lilun 队决策理论(卷名：自动控制与系统工程) team decision theory 　　全体决策者有一个共同的目标函数，但每个决策者作决策时却依赖各不相同而又相关的信息的决策理论，简称队论。队是全体成员有一个共同目标的一种组织。队中成员之间的关系是合作关系而不是对抗关系。队论是从信息结构的观点来研究决策问题的。其主要特征是，每一个决策者基于所接收到的各不相同而又相关的信息来作各自的决策。为了实现共同目标，所有决策者应协调他们的行动。　　发展简史　队论原是经济学家在不完全信息的约束下建立经济模型时提出来的，后来推广到工程技术和其他学科。1955年，J.马尔沙克奠定了队论的基础。他研究了在一个组织内如何协调各成员的工作。1962年，R.拉德纳把队论置于可靠的数学基础上。虽然他们两人的研究主要在静态方面，但他们得到的结果可在形式上确定决策问题的信息结构。1972年，何毓琦和祝开景把拉德纳的工作推广到动态情况，后又进行了许多研究，扩大了研究范围，提出了一些算法。　　队决策模型　队决策模型有自然状态、决策变量集合、观测信息函数集合、策略集合和损失函数等五个基本要素。　　自然状态　指问题的不确定成分，包括随机初始条件、测量噪声、不确定参数和随机扰动等信息。这些信息又称先验信息,用一个随机变量向量ξ=(ξ₁,…，ξ_i，…，ξ_n)表示，概率分布用P（ξ）表示。n是系统状态的维数。这种信息在开始制定决策时为每个决策者已知。　　决策变量集合　u屌{u₁,…，u_i,…，u_m}。其中元素u_i为第i个决策者的决策。u_i也可以是向量，这时可将它分解为多个决策者，但他们均占有同样的信息。当同一决策者在不同时间制定多个决策时，若基于不同的信息，就应看成不同的决策者。m是决策者数目。　　观测信息函数集合　z屌{z₁,…，z_i，…，z_m}。其中元素z_i为第i个决策者在制定决策时所接收到的信息,包括先验信息ξ和由通信传来的其他决策者的决策信息u_i。即z_i是ξ和u_j的函数，记为 z_i=η_i(ξ，u_j)，j=1，2，…，m，j厵i。一般来说，这一信息与第 k个决策者接收到的信息是不同的。集合η屌{η₁,…,η_i，…，η_m}称为信息结构。若z_i只依赖于ξ而与其他决策者所作的决策u_j无关，则z_i只是ξ的函数,记为z_i=η_i(ξ)。信息结构对全体决策者均为已知。　　策略集合　γ屌{γ₁,…,γ_i,…,γ_m}。又称决策规则，相当于控制问题的控制律。其中元素 γ_i为第i个决策者采用的策略。第i个决策者接收了信息z_i之后,必定据此作出某种决策u_i,因而u_i是z_i的函数，记为u_i=γ_i(z_i)。这里的γ_i(i=1,2,…,m)称为策略。　　损失函数　又称支付函数、价值函数,用来评价各种决策后果所遭受的损失。它是ξ和u的函数,记为L(ξ,u)。常假定L(ξ,u)可用适当的效用单位来表示。　　研究内容　根据信息结构形式的不同，队论研究的问题分为静态队决策、部分嵌套动态队决策和动态队决策。　　静态队决策　简称静队。指第 i个决策者作决策时用到的信息只依赖于ξ而与其他决策者的决策无关，即u_i=γ_i(z_i)=γ_i(η_i(ξ))。若一组策略已经给定，则损失函数可记为L（ξ，u）=L（u=γ（η(ξ)），ξ）。ξ是随机变量，对ξ取期望值,用符号E_ξ表示。于是,静队要解决的问题是求γ壟（i=1，2，…，m），使目标函数J(γ)=E_ξ[L(u=γ(η(ξ)，ξ)]为最小。这是一个确定型最优化问题，称为正常策略型。除非问题比较简单，例如损失函数为二次型，ξ是均值为零的高斯随机变量，η(ξ)为线性函数（简称线性二次型高斯问题），γ的维数较低,否则要从整体上直接解出γ壟(i=1,2,…,m)是十分困难的。　　一种限制较少的办法是假定第i个决策者已经知道所有其他决策者的策略_i，且已固定为_i呏（γ壒，…,γ壠,γ壡,…,γ奰）。这时要求对γ_i 项求解。于是要解决的问题是求γ壟，使J(γ,)=E_ξ[L(u=γ(η(ξ)),,ξ)]为最小。这是一个参数最优化问题，称为半正常策略型。因问题已被_i参数化了，半正常策略型的计算仍有一定的困难，不过这可按决策者逐个地用迭代法求解。相对于满足正常策略型的解的最优性条件而言，这种方法得到的只是必要条件而不是充分条件。R.拉德纳证明，线性二次型高斯静队问题存在线性最优决策，而且是唯一的。　　部分嵌套动态队决策　简称PN动队。动态指队中第i个决策者接收到的Z_i依赖于第j个决策者的u_j(j=1，2，…,m;j厵i)，而u_j的决策动作在前,Z_i的接收动作在后。“动”这一个词表示决策者的动作有一个次序关系。先后关系就是因果关系,用符号“劏”表示,j劏i表示j先于i，即j的决策能影响i收到的信息,但反之不然。若有一动队的信息结构，其中第i个决策者的Z_i包含了第j个决策者的Z_j,便认为Z_j嵌套于Z_i之中。这时第i个决策者能准确知道第j个决策者所知道的事件,因而可以从Z_i决定Z_j。至少对部分的i、j而言,j劏i成立，而其余的并没有因果关系，这样的信息结构称为部分嵌套的信息结构(PN)。可见,若动队的PN结构是线性的,有一个明显的特性，当决策规则γ一经确定,第i个决策者前面所有第j、k…个决策者的动作u_j、u_k…就完全能由Z_i确定。因此，如u_j、u_k…已分别由Z_j、Z_k…所确定,则在Z_i中包含的其他决策者的决策信息u_j、u_k…便属多余，可从Z_i中消去。等效的等于Z_i减去这些多余信息。对所有的i均作同样处理,结果在(i=1,2,…,m)中除ξ外均不包含其他决策者的决策信息。这样，线性PN动队就等效地转换为静队问题。何毓琦和祝开景证明，线性二次型高斯PN动队问题存在线性最优决策，而且是惟一的。　　动态队决策　简称动队。指第 i个决策者接收的Z_i，除ξ外还依赖于第j个决策者的决策信息u_j,而不具有PN性质，记为Z_i=η_i(ξ，u_j)，j=1，2，…，m，j厵i。动队信息结构引起两个困难。①各决策者的决策相互依赖，无限循环。即u_i=γ_i(Z_i)=γ_i(η_i(ξ，u_j)),j=1，2，…,m，j厵i,其中u_j又可记为u_j=γ_j(η_j(ξ,u_i))，i=1，2,…，m，i厵j。②策略依赖现象，使目标函数J中出现γ_i(γ_j(…))的多重复合函数项。这样，即使原给定的损失函数为二次型，也不能保证J为二次型,从而使求解困难。　　虽然难以求得动队问题的最优解，但对线性二次型高斯问题而言,总可求得最优目标值的上下界。对此,先构造一个具有PN结构的辅助问题墵,其信息由原结构的Z_i根据j劏i的每一个Z_j扩充而成。对所有的i均作同样处理，变成嵌套于之中,从而可将墵转换为静队问题来解。解出即可决定Z_i。由于给决策者增加一些信息并不会使最优化变坏，故由墵求得的最优目标值愭不会大于原问题的最优目标值J^。设问题存在线性最优解，就比原最优解有更多的限制，故求出的最优目标值必不会小于J^。综合得愭≤J^*≤。　　研究动队问题的另一途径是将一个复杂的动队问题分解为若干较易求解的简单的子问题。将全体决策者集合分为互不重叠的子集，把总目标函数分成若干子目标函数，并使总目标函数等于各子目标函数之和。若任何两个子集之间不存在先后关系，则各子问题最优解的集合就是原问题的最优解。若某些子集的信息嵌套于另一些子集的信息之中，情况便较复杂，但应用PN结构概念，也可分解为互有关联的子问题，原问题的最优解也可通过子问题的最优解来表示。　　队决策理论与分散控制理论有密切关系。分散控制在信息结构上与队决策相似。在这个意义下，分散控制可视为队决策的特定情况。但队论并不研究系统稳定性、极点配置、能控性、能观测性等系统理论的重要问题。
随便看	阿利斯塔克阿利格尔，М.И. 阿利索夫气候分类阿利雅，R. 阿利，W.C. 阿力麻里阿加西，A.E.R. 阿加西，J.L.R. 阿加西，J.L.R. 阿加里亚，B. 阿努伊，J. 阿努伊，J. 阿努拉达普拉阿努钦，В.А. 阿努钦，Д.Н. 阿劳加纳阿劳，C. 阿勃拉莫夫，Ф.А. 阿勒帕米斯阿勒泰市阿勒颇阿博维扬，Х. 阿博莱达，J. 阿卜杜·卡迪尔阿卜杜·卡迪尔·吉拉尼

百科全书收录78206条中英文百科知识，基本涵盖了大多数领域的百科知识，是一部内容开放、自由的电子版百科全书。