博弈论发展简史

luyuanhong · 发表于 2024-5-4 11:14

博弈论发展简史

原创尚大海尚万只老虎 2024-02-29 12:13 广东

博弈是世界上冲突的反映，这是一个古老的概念。在我国，博弈论的思想源远流长，古代人很早就认识了博弈问题，虽然没有形成一套完整的理论体系和方法，但博弈论的思想和实践活动，可以追溯到 2000 多年前。最早的博弈论思想产生于中国，早在 2500 多年前的春秋时期，《孙子兵法》中论述的军事思想和治国战略，就反映出其系统的博弈论思想。

孙武（约前 545 年－约前 470 年），字长卿，齐国乐安（今属山东）人，中国春秋时期军事家，著有《孙子兵法》，被后世尊为“兵圣”。

100 年后孙武的后代孙膑，演绎孙子兵法，用于齐国大将田忌与齐威王的赛马，可以说是最早的博弈论案例之一。田忌所进行的是“在给定齐王策略不变的情况下如何取胜”这一策略选择，实际上就是现代博弈论中的完全信息条件下的两人博弈问题。

孙膑潜心研究军事理论，终于写成了流传千古的军事名著——《孙膑兵法》。1972 年，山东临沂银雀山汉墓竹简出土，这部古兵法始重见天日。《孙膑兵法》具有不可忽视的重要价值，解开了历史上“孙武、孙膑其人有无、其书真伪”的千古之谜，轰动海内外。

银雀山《孙子兵法》《孙膑兵法》汉简

孙武被吴王阖闾重用为将，因此也叫“吴孙子”；百年之后，孙武的后代孙膑被齐威王任命为军师，辅佐齐国成就霸业，因此也叫“齐孙子”。现有《孙子兵法》源出孙武，完成于孙膑，是春秋末期到战国中期长期战争经验的总结，并不是一个人专著。而且《孙子兵法》与《孙膑兵法》之间存在内在的师承关系，前者是后者的依据和基础，后者是对前者的阐述和继承，两者都是战国时期不可多得的重要军事理论著作。

后人在研读《孙子兵法》过程中总结出来的《三十六计》，集“韬略”、“诡道”之大成，可以称作是一部活生生的军事博弈论教科书。

《孙子兵法》

《孙子兵法》、《孙膑兵法》和《三十六计》这几部兵书所揭示的各种情形下的谋略与策略，不仅对中国的军事和政治产生重要作用，而且其影响已广泛传播到国外。

《孙子兵法》第一次走出国门是在唐代，由日本遣唐使和留学生传至日本。18 世纪又由传教士翻译成法文，在巴黎出版，据说拿破仑经常阅读《孙子兵法》。20 世纪初期，《孙子兵法》被翻译成英文，开始在西方国家流传，并被各院校当作必读的军事教材。到 20 世纪 80 年代，《孙子兵法》已被翻译成日、英、法、德、俄等十几种文字，在世界各地广为流传，出现了全球性的“孙子热”。不过，现代人对《孙子兵法》的研究已不再局限于军事和政治领域，而上升到经济管理、人事关系、社会文化等各个层面。

在国外，博弈论的思想与实践活动也有较长的历史。巴比伦王国的犹太法典，记载了公元 1-5 世纪的古代法律及传统。犹太法典中讨论了一个所谓的“婚姻合同问题”，被人们认为是现代合作博弈理论的最早应用。1713 年 11 月，詹姆斯·瓦德格拉夫（James Waldegrave）在写给一位朋友的关于两人玩扑克牌方法的信中，对二人博弈提出了第一个著名的最小最大混合策略解。

然而，尽管博弈论的思想与实践在中外都有着悠久的历史，但现代博弈论的建立及其理论体系的形成，却直到 20 世纪四、五十年代才完成，而博弈论的发展、完善及其在经济学等方面的广泛应用，则是近二三十年的事。

1944 年以前，博弈论并没有形成完整的思想体系和方法论体系，人们主要集中于严格的竞争对策的研究，即通常所说的二人零和博弈。但这一阶段却提出了一些重要的基本概念和定理，这些基本概念和定理成为现代博弈论发展的基础。

法国经济学家安东尼·奥古斯丁·古诺（Antoine Augustin Cournot）在 1838 年提出关于产量决策的“古诺模型”，约瑟夫·伯特兰（Joseph Bertrand）在 1883 年提出关于价格决策的“伯特兰模型” ，这两个模型都是博弈论中的经典模型。

1921-1927 年间，E.波莱尔（Emile Borel）第一次给出了一个混合策略的现代形式，并找到了有 3 个或多个可能策略的二人博弈的最小最大解。

1928 年，著名数学家冯·诺伊曼（von Neumann）证明了最小最大定理（Minimax Theorem），该定理被认为是博弈论的精华，博弈论中的许多概念都与该定理相联系。这一阶段博弈论的早期思想和基本概念已经形成。

冯·诺依曼和摩根斯坦

1944 年，冯·诺伊曼和奥斯卡·摩根斯坦（Oskar Morgenstern）合著的《博弈论与经济行为》一书出版，标志着现代博弈论的诞生。该书在总结以往关于博弈的研究成果的基础上，提出了博弈论的概念术语、一般框架和表述方法，创立了较系统的博弈理论。该书对二人零和博弈进行了详细的阐述，完全解决了这个问题。该书的开创性贡献还包括：合作博弈、可转移效用、联盟形式、冯·诺伊曼-摩根斯坦稳定集，以及后来在经济学中广泛使用的公理化效用理论。

《博弈论与经济行为》极大地促进了博弈论和经济学研究的联系。从此，博弈论不再只是数学家的研究课题，也开始被经济学家所接受，这对博弈论的发展起了巨大的推动作用。当然，这个时候的博弈论还是比较幼稚的，研究的范围比较小，主要集中在少数类型的合作博弈和零和博弈，总体影响也很小。

20 世纪 50 年代是博弈论蓬勃发展的时期，在这段时期，涌现了许多著名的博弈理论家，他们提出了一系列重要概念和方法，形成了现代博弈论的理论体系。

约翰·纳什（John Nash，1928-2015)，美国数学家，提出非合作博弈理论的核心概念“纳什均衡”，1994 年荣获诺贝尔经济学奖。

1950 年，普林斯顿大学数学系的约输·纳什在他的博士论文《非合作博弈》中，提出了“纳什均衡”的概念，并证明了纳什均衡存在性的“纳什定理”，从而将博弈论扩展到了非合作博弈理论。纳什均衡是对古诺模型和伯特兰模型中均衡概念的一般化，是非合作博弈理论中最核心的概念，后来的子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡等概念都是以纳什均衡为基础发展出来的。

除此之外，纳什还建议将合作博弈简化为非合作博弈的形式来进行研究，这被称为 “纳什方案”；纳什还创立了公理化讨价还价理论，证明了纳什讨价还价解（Nash bargaining solution）的存在性。纳什为非合作博弈的一般理论以及合作博弈的讨价还价理论奠定了基础。

1950 年，阿尔伯特·塔克（Albert Tucker）在斯坦福大学的一次演讲中形象生动地揭示了 “囚徒困境”。1953 年，哈罗德·库恩（Harold Kuhn）提出了扩展型博弈及其形成；同年，罗伊德·夏普利（Lloyd Shapley ，2012 年诺贝尔经济学奖获得者）定义了联盟博弈解的概念，即著名的 “夏普利值”。1959 年，罗伯特·奥曼（Robert Aumann ，2005 年诺贝尔经济学奖获得者）引进了“强均衡”的概念。以纳什非合作博弈理论为核心的现代博弈论体系，在 20 世纪 50 年代已经形成。1959 年，M.舒比克（Martin Shubik）出版了《策略与市场结构：竞争、垄断与博弈论》一书，标志着博弈论在经济学中应用的开始。

进人 20 世纪 60 年代，博弈论的研究取得了一系列重大的突破和发展。

1965 年，莱茵哈德·泽尔腾将纳什均衡的概念引入到动态分析，提出了“子博弈完美纳什均衡”（Subgame perfect Nash equilibrium）的概念。

莱茵哈德·泽尔腾（Reinhard Selten，1930-2016)，德国经济学家，波恩大学教授，子博弈精炼纳什均衡的创立者，1994 年荣获诺贝尔经济学奖。

奥曼和 B.皮莱格（B.Peleg）（1960）、M.马希勒（M. Maschler）（1965）、夏普利（1969）等人系统研究了非转移效用的联盟博弈问题。

1966 年，约翰·海萨尼对合作博弈与非合作博弈的不同，给出了现在使用最普遍的定义。海萨尼在《管理科学》杂志上分三部分发表了其著名论文《由贝叶斯对弈者进行的不完全信息博弈》（1967—1968），从而建立了不完全信息博弈论体系，为信息经济学的发展打下了理论基础。

约翰·海萨尼（John Harsanyi, 1920-2000)，生于匈牙利布达佩斯，美国伯克利加州大学教授，提出了不完全信息博弈的概念，1994 年荣获诺贝尔经济学奖。

然而，尽管博弈论在这段时期得到了长足的发展，但仍然主要是纯理论意义上的，在经济学中的应用还很少。

1970-1990 年间，博弈论取得了空前的发展。一方面，博弈理论本身在几乎所有领域内都取得了重大突破，如重复博弈、随机博弈、策略均衡、谈判理论、信誉模型、多人博弈等，完善了博弈理论体系，也为博弈论的广泛应用奠定了理论基础。另一方面，博弈论已广泛应用到经济学、生物学、计算机科学、哲学等学科中，在实践中得到广泛传播，并为人们尤其是经济学家所普遍接受。

1972 年，奥斯卡·摩根斯坦创立了《国际博弈论杂志》，为博弈论的推广和应用做出了不可磨灭的贡献。同年，在美国康奈尔大学召开了博弈论国际讲座第四届年会，各主要的经济学杂志刊登有关博弈论的论文篇幅越来越大，博弈论已渗透到经济学研究的各个领域。

1974 年，奥曼提出了“相关均衡”（correlated equilibrium）的概念，这是比纳什均衡更灵活的一种非合作博弈均衡。在多方博弈中，如果参与人根据其共同观测到的信号做出决策和选择行动，就会出现“相关均衡”，使所有参与人都受益。

1975 年，泽尔腾引人了 “颤抖手完美均衡” （trembling hand perfect equilibrium）的概念，此概念是对子博弈完美纳什均衡的改进。

他们的工作使博弈论在策略均衡概念的研究方面进一步深化和改进。

这一时期在不完全信息博弈和重复博弈方面的研究，丰富了博弈论的研究内容及理论体系，并使博弈论研究更接近实际。

1981 年，奥曼发表了名为《重复博弈的一个考察》的论文，研究了有约束的对弈者的相互作用行为。

1982 年，D.M.克里普斯（David M. Kreps）和R.威尔逊（Robert Wilson）把子博弈完美均衡的思想推广到了扩展形式的子博弈中，称为“序贯均衡” （sequential equilibria）。A. 内曼（A. Neyman）（1985）和 A. 鲁宾斯坦（A. Rubinstern）（1986）则系统阐述了重复博弈中的有限理性的思想，研究并讨论了重复的囚徒困境问题。

这期间，一大批关于博弈论及其在经济中应用的著作问世，使博弈论在经济学的应用研究方面得到了极大的发展。至 20 世纪 80 年代末，博弈论已形成了完整的科学体系，同时博弈论在经济学领城得到了非常广泛的应用。

自 20 世纪 90 年代以来，博弈论已和现代经济学融为一体，成为主流经济学的一部分，并对经济学产生了革命性影响。短短十几年时间，就出版了大量有关博弈论及其在经济学中应用的专著，各主要经济学和经济理论杂志中所刊登的有关博弈方面的文章随处可见。经济学家们已把博弈论当作最为合适的分析工具。人们谈论经济学时，自然会谈到和涉及博弈论，研究博弈论及其应用或者用博弈论方法分析经济问题在 20 世纪 90 年代成为一种潮流。

1994 年，约翰·纳什、约翰 ·海萨尼、莱茵哈德·泽尔腾三位博弈论专家和经济学家被授予诺贝尔经济学奖，他们在非合作博弈的均衡分析理论方面做出了开创性的贡献，对博弈论和经济学产生了重大影响。

1996 年，詹姆斯·莫里斯和威廉·维克瑞获得了诺贝尔经济学奖，莫里斯在信息经济学理论领域做出了重大贡献，尤其是对不对称信息条件下的经济激励理论的论述；维克瑞在信息经济学、激励理论、博弈论等方面都做出了重大贡献，提出了著名的维克瑞投标法，又称“次高价投标法”。

詹姆斯·莫里斯（James Mirrlees，1936-2018），出生于苏格兰的明尼加夫，与亚当·斯密是同乡，激励理论的奠基者，在信息经济学理论领域做出了重大贡献。

威廉·维克瑞(William Vickrey，1914-1996)，生于加拿大，美国哥伦比亚大学教授，在信息经济学、激励理论、博弈论等方面都做出了重大贡献。

2001 年，诺贝尔经济学奖被授予乔治·阿克尔洛夫、迈克尔·斯宾塞和约瑟夫·斯蒂格利茨，以表彰他们应用博弈论在不对称信息市场分析方面所做出的开创性研究。

乔治·阿克尔洛夫（George Akerlof ），1940 年生于美国的纽黑文，美国加州大学伯克利分校经济学教授。他引入信息经济学研究中的一个著名模型“柠檬市场”，对市场的不对称信息研究具有里程碑意义。

迈克尔·斯宾塞（Michael Spence)，1943 年生于美国新泽西州的蒙特克莱尔，美国斯坦福大学商学院研究生院原院长、名誉院长。他的主要研究成果是提出劳动力市场上的信号传递机制，解决逆向选择问题，防止“劣币驱逐良币”。

约瑟夫·斯蒂格利茨（Joseph Stiglitz），1943 年生于美国印第安那州一个叫做加里的小城，与保罗·萨缪尔森是同乡。斯蒂格利茨为信息经济学的创立作出了重大贡献。他所倡导的一些前沿理论，如逆向选择和道德风险，已成为经济学家和政策制定者的标准工具。他还是世界上公共部门经济学领域最著名的专家。

2005 年，诺贝尔经济学奖被授予托马斯·谢林、罗伯特·奥曼，以表彰他们通过博弈论分析在促进人们对冲突与合作的理解方面所作出的贡献。

罗伯特·奥曼运用数理方式破解了古犹太人的千古之谜，建立了博弈均衡中的“相关均衡”理论；托马斯·谢林运用非数理方式分析现代社会中的冲突与合作问题，建立了博弈均衡中的“聚点均衡”理论。

托马斯·谢林（Thomas Schelling，1921-2016)，美国著名经济学家、战略学家，是外交事务、国家安全、核战略以及军备控制方面的研究专家，也是有限战争理论的奠基人之一。

罗伯特·奥曼（希伯来语：；英语：Robert Aumann），生于 1930 年，美国和以色列双重国籍的数学家和经济学家，以色列耶路撒冷希伯来大学合理性研究中心教授，犹太人。

2007 年，诺贝尔经济学奖被授予埃里克·马斯金、罗杰·迈尔森和利奥尼德·赫尔维茨，以表彰他们在应用博弈论创立和发展机制设计理论方面的突出贡献。

埃里克·马斯金（Eric Maskin)，1950 年生于美国纽约，被誉为国际经济学最受尊敬的经济学大师，培养了大批一流经济学人才。

罗杰·迈尔森（Roger Myerson)，1951年出生在美国波士顿，现任芝加哥大学教授，博弈论大师。

利奥尼德·赫尔维茨（Leonid Hurwicz，1917-2008)，俄罗斯裔美国经济学家，机制设计理论之父。

2012 年诺贝尔经济学奖被授予埃尔文·罗斯及罗伊德·夏普利。他们得奖的原因是“在稳定配置理论及市场设计实践上所作出的贡献”。

埃尔文·罗斯（Alvin E.Roth），生于 1951 年，美国经济学家，现任哈佛大学教授，在博弈论、市场设计和实验经济学等领域都做出杰出贡献。

罗伊德·夏普利（Lloyd Shapley，1923-2016）生于美国麻省剑桥，与约翰·纳什和哈罗德·库恩同为普林斯顿大学 1950 届博士毕业生，被称为“普林斯顿博弈论学派三巨星”，提出“盖尔-沙普利”算法和稳定匹配理论，是现代合作博弈论的奠基人和市场设计理论的开拓者，被很多专家称作博弈论的具体化身。

从 1994 年约翰·纳什被授予诺贝尔经济学奖开始，30 年来至少有 6 届诺贝尔经济学奖与博弈论的研究有关，这充分说明了博弈论对经济学的重要性和强大的创新能力。

而且也反映出一个重要趋势，即现代经济学的发展，越来越重视深入分析人类的经济行为及其对社会经济的影响。这显然是在纠正以往新古典经济学分析方法的弊端，即在理性经济人假设、完全市场、完美信息的基础上，对人类经济行为的完全忽视所造成的差错。

以古典数理分析方法和计量经济学为两大支柱的经济学大厦，正在由博弈论重新打造一个更坚固更强大的基础。博弈论的研究范式和各种精妙复杂的策略互动模型，为经济学乃至整个社会学的研究注入一股新的生命力，人类文明将翻开新的篇章。

主要参考文献：

《博弈论——思想方法及应用》，焦宝聪等编著，中国人民大学出版社，2013

		自动登录	找回密码
密码			注册

博弈论发展简史

本帖子中包含更多资源