网站导航

模型思维

#书名

视觉笔记

|600

版权信息

书名:模型思维
作者:[美]斯科特·佩奇(Scott Page)
译者:贾拥民
出版社:浙江人民出版社
出版时间:2019-11
ISBN:9787213095436

作者简介

广受欢迎的“模型思维课”主讲人密歇根大学复杂性研究中心“掌门人”圣塔菲研究所外聘研究员研究复杂性与多样性的专家

佩奇以对社会科学的多样性和复杂性的研究和建模而闻名。具体研究方向包括路径依赖、文化、集体智慧、适应和社会生活的计算模型。研究领域涉及多个学科,包括经济学、政治学、计算机科学、管理学、物理学、公共卫生、地理学、城市规划、工程学和历史学。

他在Coursera平台上线了“模型思维课”,该课程包括一百多个视频和阅读资料。

如果人生的动力源泉是固定的,努力的百分比就是固定的,那么短期内努力或者不努力并不会有什么影响。也就是说,问题的根本不在于你的状态,而在于源动力!所以,在瓶颈期遇到困难实在不想努力的话,多去找一找自己的源动力,想想当初为什么出发。

佩奇于1999年被圣塔菲研究所聘为研究员,开始了在圣塔菲研究所十几年的研究生涯,主要研究方向依然是复杂性和多样性。

推荐语

不应否认,任何理论的终极目标都是尽可能让不可简化的基本元素变得更加简单且更少,但也不能放弃对任何一个单一经验数据的充分阐释。阿尔伯特·爱因斯坦

不应否认,任何理论的终极目标都是尽可能让不可简化的基本元素变得更加简单且更少,但也不能放弃对任何一个单一经验数据的充分阐释。

序言 这本书是怎样写成的

对我来说,成功意味着我在这个世界上的有效性:我能够把我的思想和价值观带给这个世界,我能够以积极的方式改变它。
汤亭亭

对我来说,成功意味着我在这个世界上的有效性:我能够把我的思想和价值观带给这个世界,我能够以积极的方式改变它。

我一直在寻找这样一门课程:既能够向学生介绍复杂系统领域的知识,同时又不脱离他们的日常生活和未来的职业规划。通过讲授一门关于模型的课程,我可以向学生展示各种相关的工具和思想,提高他们推理、解释、设计、沟通、行动、预测和探索的能力。

美国著名现代诗人华莱士·史蒂文斯(Wallace Stevens)曾经这样写道:“也许,真理取决于在湖边散步的时间。”

有些深洞永远无法填满,它们会提醒我们珍惜生命所提供的宝贵机会。

01 做一个多模型思考者

要想成为一个有智慧的人,你必须拥有多个模型。而且,你必须将你的经验,无论是间接的,还是直接的,都放到构成这些模型的网格上。

模型是用数学公式和图表展现的形式化结构,它能够帮助我们理解世界。掌握各种模型,可以提高你的推理、解释、设计、沟通、行动、预测和探索的能力。

本书所讨论的模型可以分为三类:对世界进行简化的模型、用数学概率来类比的模型以及人工构造的探索性模型。

对世界进行简化的模型、用数学概率来类比的模型以及人工构造的探索性模型。无论哪一种形式,模型都必须是易处理的。

在拥有多个模型的情况下,我们能够避免每个模型本身所固有的局限性。多模型方法能够消除每个单个模型的盲点。

如果没有模型,人们就会受到各种认知偏差的影响:我们会对近期发生的事件赋予过高的权重、会根据“合理程度”分配概率、会忽略各种基本比率。

所有模型都有三个共同特征。第一,它们都要简化,剥离不必要的细节,抽象掉若干现实世界中的因素,或者需要从头重新创造。第二,它们都是形式化的,要给出精确的定义。模型通常要使用数学公式,而不是文字。

信息用来给数据命名并将数据归入相应的类别。

柏拉图将知识定义为合理的真实信念。更现代的定义则认为知识就是对相关关系、因果关系和逻辑关系的理解。知识组织了信息,呈现为模型的形式。

层次结构的基础就是智慧。智慧就是指识别和应用相关知识的能力。智慧需要多模型思维。

智慧包括选择正确的知识或模型。

所有模型都是错的,但是同时运用多个模型确实非常有用。

构建模型是一门艺术,只能通过不断实践才能熟练掌握,这不是一项以观赏为目的的活动,需要刻意地练习。在建模中,数学和逻辑扮演着专家教练的角色,它们会纠正我们的缺漏。

02 模型的7大用途

模型可以是对世界的简化,但是模型也可以采用类比的形式,或者,模型本身可能就是为探索思想和总结观点而构建的虚拟世界。

模型的价值还体现在,它们能够把特定结果所需要的条件清晰地揭示出来。我们所知道的大多数结论都只是在某些情况下成立。

模型的7大用途:推理(reason)、解释(explain)、设计(design)、沟通(communicate)、行动(act)、预测(predict)和探索(explore)。

构建模型的第一种方法是具身法(embodiment approach)。用这种方法构建的模型包括重要部分,同时对于不必要的维度和属性,要么剥离,要么将它们整合在一起考虑。

“奥卡姆剃刀”原则:如无必要,勿增实体(Plurality must never be posited without necessity)。爱因斯坦则把“奥卡姆剃刀”原则进一步阐释为:事情应该力求尽可能简单,但是不可过于简单化。

模型的7大用途(REDCAPE)推理:识别条件并推断逻辑含义。解释:为经验现象提供(可检验的)解释。设计:选择制度、政策和规则的特征。沟通:将知识与理解联系起来。行动:指导政策选择和战略行动。预测:对未来和未知现象进行数值和分类预测。探索:分析探索可能性和假说。

基于模型的解释必须包括正式的假设和明确的因果链条,而且这些假设和因果链条都要面对数据。

由于创造了一种共同的表示方法,模型能够有效地改进交流。模型要求对相关特征及其关系给出正式的定义,这使我们能够精确地进行交流。

弗朗西斯·培根曾经这样写道:“人生的伟大目标,不在于知,而在于行。”

03 多模型思维

。选择取决于用途:在预测时,我们经常需要大模型;而在解释时,小模型则更好一些。

选择取决于用途:在预测时,我们经常需要大模型;而在解释时,小模型则更好一些。

孔多塞陪审团定理:多数投票正确的概率比任何人(模型)都更高;当人数(模型数)变得足够大时,多数投票的准确率将接近100%。

模型的7大用途:推理、解释、设计、沟通、行动、预测和探索。其中有4种用途——推理、解释、沟通和探索都要求我们进行简化。通过简化,我们可以应用逻辑来解释现象、交流思想,并探索各种各样的可能性。

创造过多的类别会导致对数据的过度拟合,而过度拟合会破坏对未来事件的预测。

为了避免过度拟合,可以避免使用高阶项。不过,一种更巧妙的解决方法是,可以采取自举聚合法(bootstrap aggregating)或装袋法(bagging)来构建模型。

04 对人类行为者建模

我们怎样对人建模,归根到底取决于问题的背景和想要实现的目标

人是多样性的、易受社会影响的、容易出错的、有目的的、有适应能力且拥有自己主体性的。

人是多样性的、易受社会影响的、容易出错的、有目的的、有适应能力且拥有自己主体性的,也就是说,我们有行动的能力。

双曲贴现意味着,人们对近期的贴现更强。

爱尔法鲁模型:适应性规则有100个人,每个人每个星期都要独立地决定是否前往爱尔法鲁酒吧。如果决定前往,且只有60个人或更少的人到场,那么这个人的收益为1,否则收益为-1,决定不前往爱尔法鲁酒吧的人收益为0。每个人都有一套规则来决定是否参加。这些规则可以是固定的,也可以依最近一段时间以来的参加人数而定。每个星期,每个人都要按照遵循他的规则集合中曾产生过最高收益的规则行事。

05 正态分布

中心极限定理告诉我们,只要把随机变量加总或求其平均值,就可以期望获得正态分布。

了解系统是否由于多种原因产生正态分布或长尾分布是非常重要的。

分布为事件或价值分配概率

均值之外的第二个重要统计量是方差,可以衡量一个分布的离散程度,也就是数据与均值之间距离的平方的平均值

只要各随机变量是相互独立的,每个随机变量的方差都是有限的,且没有任何一小部分随机变量贡献了大部分变差,那N≥20个随机变量的和就近似一个正态分布。2

06 幂律分布

幂律分布就是通常所称的长尾分布或重尾分布。

产生幂律分布要求非独立性,通常以正反馈的形式出现。

机会的增加可以创造风险激励,这个逻辑可以应用到很多领域。

07 线性模型

在线性关系中,由于第二个变量的变化而导致的第一个变量的变化量不依赖于第二个变量的值。

线性回归模型的目标是找到能够最小化到各数据点的直线。

在社会环境和生物环境中,我们不能期待会有完美的线性拟合。结果通常取决于多个变量,但是根据定义,单变量回归只能包含一个变量。由于这些被省略的变量,预测值可能会偏离实际值。

大系数与新现实
线性回归揭示了自变量与我们感兴趣的(因)变量之间的相关程度。如果这种相关是因果关系,那么具有大系数变量的变化就会产生很大的影响。基于大系数的政策在保证能够带来改进的同时,排除了涉及更多根本性变化的新现实。

线性模型只是一个开始,大多数有趣的现象都不是线性的。

要对这些数据进行分类,需要先利用某个深度学习算法(如神经网络算法)找到一个非线性模型。神经网络模型包含多个变量,因此它们几乎可以拟合任何曲线。

树木的集合称为森林。机器学习算法会在一个训练集上随机构造出树,然后将那些在检验集上准确分类的树保存下来。

08 非线性模型

我们阐明了增长和正反馈是如何产生凸性的,收益递减和负反馈又是如何产生凹性的。在绝大多数学科中,都包含了这两类模型。

72法则如果一个变量在每个周期内以R(增长率小于15%)的百分比增长,那么下面提供了一个很好的近似:

本章的一个核心结论是,一旦包括了非线性,直觉就变得不够用了。

09 与价值和权力有关的模型

第一个标准是“最后上车者价值”(last-on-the-bus value,简称LOTB),它等于一位行动者在团队已经形成的情况下加入团队时的边际贡献。第二个标准是夏普利值(Shapley value),它等于行动者遍历所有可能的加入团队的序列,加入团队时的边际贡献平均值。

这里需要注意的是,“最后上车者价值”不一定是博弈的总价值相加。特别是,如果价值函数表现出了规模收益递减的性质,那么“最后上车者价值”的总和将小于博弈的总价值;如果增加的价值表现出了规模收益递增的性质,那么“最后上车者价值”的总和将超过博弈的总价值。

夏普利值给定合作博弈{N,V},夏普利值的定义如下:N个博弈参与者加入联盟的次序有N!个,让O代表这所有N!个次序。对于O中的每一个次序,将博弈参与者i增加的价值定义为当博弈参与者i加入时价值函数发生的变化。博弈参与者i的夏普利值等于他在O中所有次序上增加价值的平均值。

夏普利值的公理基础夏普利值唯一满足以下公理:零性:如果博弈参与者为任何联盟增加的价值都等于零,那么该博弈参与者的价值等于零。公平性/对称性:如果两个博弈参与者对任何联盟都具有相同的增加价值,那么这两个博弈参与者具有相同的价值。完全分配性:博弈参与者价值的总和等于博弈的总价值V(N)。可加性:给定两个定义在相同博弈参与者集合之上的博弈,它们的价值函数分别为V和[插图],那么在博弈(V+[插图])中,一个博弈参与者的价值等于该博弈参与者在V和[插图]的价值的总和。

夏普利-舒比克权力指数适用于任何席位或投票权分配不均等的情况,比如欧盟或美国的选举团,但这并不意味着它在所有情况下都是适当的方法。

在这些情况下,联盟会希望减少“最后上车者价值”。通过扩大联盟规模,可以创建出一个具有很高的总价值、同时“最后上车者价值”又足够低的联盟。不断加入新成员,会使现有成员变成“可以放弃的”,从而使“最后上车者价值”趋向于零。

10 网络模型

网络对于理解社会关系一直都很重要。

网络统计量度:节点的邻居数(即边数)。路径长度:从一个节点到另一个节点必须遍历的最小边数。介数:经过某个节点连接两个其他节点的最短路径数量。聚类系数:一个节点的邻居对当中,同样也由一条边连接的邻居对所占的百分比。

我们的弱关系,也就是网络中的随机朋友,由于连接了具有不同兴趣和信息的社区,从而发挥了重要的信息作用。因此,社会学家很强调弱关系的力量。12

三度朋友的数量很重要,他们的多样性以及相对接近性使他们成了你的重要资产,他们可以提供新的信息和工作机会。这些人最有可能帮助你找到工作,促使你搬到新的城市,或者成为生活中、商业上的伙伴。

缺乏局部聚类的稀疏网络更容易出现故障

由于能够从多个社区获取信息和思想,这些填补了结构洞的人拥有很大的权力和影响力。当然,要想去填补结构洞,你得有相当高的才华和能力才行。看到一个洞就跳下去并不算填补结构洞。要填补结构洞,你必须让社区的每一个人信任和理解你,你必须熟悉每个社区的知识库。

11 广播模型、扩散模型和传染模型

所有这三类模型都将整个人口划分为两个群组:知道或拥有某种东西的人与不知道或不拥有某种东西的人。随着时间的推移,个人会在这两个群组之间移动。

广播模型
It+1=It+Pbroad×St
其中,Pbroad表示广播概率,It和St分别等于时间t上的感染者(知情者)和易感者的数字
初始状态为I0=0,且S0=NPOP。

将扩散概率(diffusion probability)定义为接触概率(contact probability)和分享概率(sharing probability)的乘积。我们可以根据扩散概率来构建模型,但是在估计或应用模型时,必须独立地跟踪接触概率和分享概率。

对于中心辐射型网络,R0携带的信息量很有限,因为如果中心节点患上了传染病,传染病就会传播开来。流行病学家们将位置在度很高的中心节点上的人称为“超级传播者”(superspreaders)。

12 熵:对不确定性建模

熵是用来度量与结果的概率分布相关的不确定性的。

13 随机游走

幂律分布结果还有一个意想不到的应用领域。如果我们将企业的销售水平或员工规模建模为随机游走,那么企业的生命周期就会成为一个幂律分布。

事实已经证明,股票价格接近正态随机游走,带有正漂移,以获得市场收益。

简而言之,正如格罗斯曼和斯蒂格利茨悖论(Grossman and Stiglitz paradox)所强调的,如果投资者相信有效市场假说,他们就会停止分析,从而导致市场效率低下;而如果投资者认为市场效率低下,他们就会应用模型进行分析,从而提高市场效率。

长期资本管理公司给我们的教训是深刻的,也是显而易见的,那就是不要过分相信一个模型。

挑选一些看上去很好的公司出来,列出它们的特征,这并不是模型思维。模型思维的要求是,推导出能够导致成功的那些特征,例如才华横溢的工人,然后再根据数据来检验相关结论。如果可能的话,最好寻找一些自然实验,也就是相关特征随机变化的实例。

14 路径依赖模型

人不能两次踏进同一条河流,因为无论是这个人,还是这条河,都已经不同了。赫拉克利特(Heraclitus)

波利亚过程一只瓮里面装着一个白球和一个灰球。每一周期,都随机抽取出一个球并将这个球与和它颜色相同的另一个球一起放回到瓮中。抽取出来的球的颜色表示结果。

路径依赖是对结果的逐渐影响,临界点则意味着结果的突然变化。

具有临界点的过程出现大幅度的转折,而路径依赖的过程则变化缓慢。

15 局部互动模型

生命游戏与局部多数模型的关键区别在于,在这里,元胞的更新规则有两个阈值,并且所有的元胞都同步更新自己的状态。

物理学家斯蒂芬·霍金(Stephen Hawking)就这样写道:“我们完全可以想象,像生命游戏这样的东西,只有少数几个基本定律,就可以产生高度复杂的特征,甚至可能产生智能。”10

16 李雅普诺夫函数与均衡

玛丽安·米尔札哈尼(Maryam Mirzakhani)

逐底竞争博弈有N个博弈参与者,每个博弈参与者在每个时期都要提出一个支持水平,其取值范围为{0,1,…,100}。提出了最接近平均支持水平2/3的博弈参与者可以获得那个期间的奖励。

自组织活动模型
一个城市里,有A种活动可以参加,每一天都由L个时间段组成。在人口规模为M的城市中,每个人都要选定一个日程安排。在这里,日程安排是指这个人在L个时间段内分配L种活动(从一个更大的K种可能性的集合中)。一个人要面对的拥挤水平则设定为等于同时选择同一种活动的其他人的数量。

模型所能提供的,只是证明结果的可能性。我们无法保证肯定可以推导出它们,很多时候,我们提出了一个模型之后,最终却发现要证明结果非常困难(如果不是不可能的话)。

模型的7大用途——推理、解释、设计、沟通、行动、预测和探索

17 马尔可夫模型

谷歌公司如何运用马尔可夫模型构造谷歌最初的网页排名(PageRank)算法

马尔可夫模型是通过区分以下两类政策来指导行动的:一类政策能够改变转移概率,而改变转移概率可以产生长期影响;另一类政策只能改变状态,并且只能产生短期影响。如果转移概率无法改变,那么我们必须定期重置状态才能改变结果。沉溺于辛劳工作可能会产生导致好强、自私和压抑的心理状态转移概率,而每天锻炼、冥想或参加宗教活动则可能帮助人们以一个感恩的、富有同情心的、放松的心理状态迎接每一天。周末休息也有类似的功能,已婚夫妇不时过一过约会之夜也有很好的效果。这两者的共同作用是,能够暂时使一个人的状态远离均衡。

18 系统动力学模型

系统动力学模型通常要包括源(source)、汇(sink)、存量(stock)、流量、速率和常数等组成部分。源产生对系统的输入,汇吸收输出,存量跟踪变量的水平,流量刻画各存量水平之间的反馈,速率和常数用于流量,流量可以是随时间变化的,也可以是固定不变的。

征。直觉在这里“失败”了,因为我们只锁定了直接影响而未能思考整个逻辑链。即便增加(或减少)速度或流量的直接影响是增加(或减少)存量,系统以正反馈和负反馈的形式产生的影响也意味着,其他存量的值也会发生改变,因此速度或流量变化的净效应可能会减少、会被抵消,甚至可能会被逆转。

系统动力学模型的巨大价值部分在于,它们能够帮助我们深入思考自己行动的影响。我们通常都能够考虑到政策的直接影响:对窗口征税能够增加收入;安装防抱死制动器能够挽救生命。但是我们并不一定随时都会考虑到间接影响,也就是各种正反馈和负反馈。这些模型恰恰能帮助我们更清晰、更深入地进行思考。

19 基于阈值的模型

由此增加的自由度当然可以带来一些优势,但是我们必须记住,过多的细节会与要建模的原因相冲突。例如,在构建一个用来讨论人们如何选择参加某项社交活动的模型时,就不应该对人们大脑中的每个神经元进行建模。最优粒度水平取决于模型的目的。

在基于阈值的模型中,个体根据某个总量变量是否超过阈值而决定采取两种行动中的哪一种。如果变量的值超过阈值,个体就采取一个行动,否则,就会采取另一个行动。

阈值的总体分布是非常重要的,而不仅仅只有阈值的均值才重要。因此它也说明,要预测哪些社会活动将会成功有很大的困难。

N个人参加一个派对,每个人都有一个可观察的类型A或B。每个人随机选择两个房间中的一个。在每个时刻,每个人都有p的概率走到另一个房间去。第i个人的宽容阈值为Ti。对于这个人,如果他所属的类型的人在当前房间内所有人当中所占的比例低于这个阈值,他就离开这个房间。

多样化阈值产生了两种不同的影响:它们使隔离更容易发生,同时又使完全隔离的可能性降低,因为非常宽容的人在任何一个房间都不会觉得有问题。

即使是宽容的人,也会产生隔离的居住模式,这就是托马斯·谢林的开创性名著《微观动机与宏观行为》一书最根本的洞见。

乒乓球模型规模为N的种群中的每一个实体随机采取一个初始行动,或者为正(+1),或者为负(-1)。系统的初始状态S0设置为零。系统的所有未来状态St则等于平均行动再加上一个随机变量,即:[插图]每个实体i都有一个响应阈值(response threshold)Ti>0,它从[0,RANGE]中均匀抽取出来。如果状态的绝对值大小|St|小于它的阈值,该实体就采取与以前相同的行动,否则,就采取减少状态绝对值大小的行动。即:如果|St|≤Ti,那么Ai(t+1)=Ai(t),否则Ai(t+1)=-signSi(t)其中,εt是从{-1,+1}中随机抽取出来的。

乒乓球模型有多种应用。人们可能会将时间和资源分配给多个慈善项目。如果某个慈善项目得到了太多的关注或金钱,人们就会开始向其他项目捐钱以保证平衡。

在具有负反馈的系统中,阈值多样性会导致稳定性,但是在具有正反馈的模型中则具有恰好相反的效果。

反馈的基本逻辑很简单:正反馈强化行动,负反馈抑制行动。只有正反馈的系统会爆炸或崩溃,只有负反馈的系统将稳定或循环,同时具有正反馈和负反馈的系统则可能会产生复杂性。

于是在这里就有了一个经典的正反馈循环:抛售导致价格下降,价格下降导致更多抛售。

20 空间竞争模型与享受竞争模型

我们的理论是,如果你需要用户来告诉你,你正在销售的是什么,那么你其实不知道你正在销售的是什么,而且这不可能给客户留下好的体验。玛丽莎·梅耶尔(Marissa Mayer)

在对人类行为进行建模的时候,理性行为提供了一个基准,基于理性假设构建的模型不仅容易处理,能够给出符合唯一性要求的预测,并且这种预测在事情重复发生且利害关系很大时与经验相符。

空间(属性)竞争模型(spatial competition model)和享受(属性)竞争模型(hedonic competition model)在经济学和政治学中早就得到了广泛应用,部分原因在于它们便于用数据检验。

从企业的地理位置和产品属性,转换为政治意识形态,意味着从诸如位置和乳脂含量等物理属性,转换为更抽象的思想观念。

当现状具有极端值时,提案者拥有最大的权力。

这个模型揭示了拥有否决权的投票者的数量和意识形态多样性与出现政治僵局的可能性之间的紧密联系。这是一个具有普遍意义的深刻洞见。拥有多样性否决权的组织很可能无法采取任何行动。

在享受竞争模型中,各备选项(通常是各种产品)也是用属性来表示的。但是,在这种模型中,属性包括了质量、效率或价格,而且更多或者更少总是更受欢迎的。为了刻画异质性,享受竞争模型允许个体给不同维度赋予不同的权重。

在空间竞争模型中,每个人对每种属性都有一个更偏好的水平,而且某个备选项在哪些维度上与他的理想点接近,对他来说价值就越大。而在享受竞争模型中,每个属性越多(或越少),人们就越喜欢。

这个模型的预测是,拥挤的市场中的价格竞争比稀疏的市场中的价格竞争影响更大;同时,大宗商品[插图]市场上的价格竞争则可以称得上是“极端的竞争”,其影响最大。这个模型还预测,高端时尚商品的价格竞争将很少出现,因为产品的高维性能够创造出一个稀疏的市场,设计师可以维持大幅度的价格加成。

模型本身并不是目的,只是提供了一个框架来构建我们的思维。

享受模型:这个模型根据商品的内在属性解释商品的价值。估值的差异取决于对商品属性的不同潜在偏好。

协调模型:这种模型将价格解释为社会建构的。戈雅画作的价值取决于其他人相信它真的有那么高的价值。

五香熏牛肉三明治的价值很可能来自其内在性质,戈雅画作的价值则可能在很大程度上是社会建构的——只要人们认为他的画作有价值,那么它们就有价值。对佛罗里达州土地价格的估计则可能取决于对未来房地产价值的预测。

21 博弈论模型

利用时间序列数据,我们就可以分辨出人们到底是在改变自己的行为(同伴效应),还是在更换他们的朋友(分类效应)。在许多情况下,这两个因素都有。2

22 合作模型

合作的程度取决于具体环境

我们最好将细胞和植物建模为遵循固定规则的,将乌鸦、蚂蚁和狮子建模为运用更多依赖于环境或过去结果规则的,将人、企业和国家建模为有前瞻能力并会进行成本收益计算的。

合作可以通过多种机制、在多种环境下涌现出来并维持下去。我们讨论了四种促进合作的机制:重复、声誉、局部聚类和群体选择。

收益矩阵下面的不等式确保了选择背叛是一个占优策略,而选择合作则能够产生有效率的结果。

我们随机地向每个博弈参与者分配如下五种遵循行为规则的策略中的一种:始终合作(C)、始终背叛(D)、冷酷触发(GRIM)、针锋相对(TFT)、欺负好人(TROLL)

一开始背叛策略的表现很好,但是不久之后,合作也能扎下根来。我们可以把这些情况下发生的这种事情,称为合作的涌现和合作的演化。

合作出现或发展的一个必要条件是,合作带来的收益超过了背叛者能够获得的收益。

合作行动模型一个种群由N个人组成,他们或者是合作者,或者是背叛者,连接于一个网络中。在每一次互动中,合作者都要承担合作成本C,而其他人则可以获得合作收益B。背叛则不会产生任何成本和收益。合作优势比率B/C刻画了合作的潜在收益。

如果合作有赖于运用声誉机制的老练的行为者维持,那么连接更多的网络将更有利于合作。如果合作是在不成熟的行为者(如树木或蚂蚁)中自我引导或演化的,那么连接较少的网络应该更能促进合作。

这些计算结果揭示了一个矛盾:在每个群体内部,背叛者对合作者有优势,但是表现更好的群体却必须包含更多的合作者。这里的张力是非常明显的:个体选择有利于背叛,但是群体选择却有利于合作。这种张力在各种各样的生态、社会、政治和经济环境下都会出现。

因此如果个人背叛的动机很高,那么相应地,群体选择就必须以很高的速度进行。

当我们研究合作的时候,还应该记住,合作不一定是为了共同利益,例如野生水牛并不会受益于狮子之间的合作。

23 与集体行动有关的问题

我们可以把集体行动问题视为一个多人囚徒困境博弈:每个人都有动机去背叛,但是从集体的角度来说,每个人都能够通过合作使自己的境遇得到改善。

员工有很强的动机去“搭便车”——自己偷懒卸责,让别人去努力工作,他们也会对共享工作空间提出过度需求,以确保自己的团队有足够的工作空间。

集体行动问题在集体行动问题中,N个人中的每个人都要选择是搭便车(f)还是为集体行动做贡献(c)。个人的收益取决于自己的行动和合作者的总数。个人可以通过搭便车获得更高的收益,即,收益(f,C)>收益(c,C+1),但是当每个人都做出贡献时,所有人的收益总和实现最大化。

公共物品供应问题有N个人,每人要将自己的收入I(I>N)配置到一种公共物品(PUBLIC)和一种私人物品(PRIVATE)上,每个单位的成本为1美元。每个人都有以下形式的效用函数:效用[插图]社会最优配置:PUBLIC=N(如果N=100,那么每个人捐献100美元)。均衡配置:PUBLIC=1/N(如果N=100,每个人捐献0.01美元)。4

拥塞模型在N人中,M人选择使用一种资源。其效用可以写成如下形式:效用(M)=B-θ×MB表示最大收益,θ是拥塞参数。其余(N-M)人不使用这种资源,并且效用为零。9社会最优解:[插图],且效用[插图]纳什均衡解:[插图],且效用[插图]

当一个模型产生的结果与常识相反时,就需要对结果细加思量。

收费其实是将资源配置给那些愿意为使用资源付出更多钱的那些人,但是这些人也许不是能够从资源中得到最高效用的人。

集体行动问题三:可再生资源开采模型

可再生资源开采模型令R(t)表示第t期开始时的可再生资源数量,再令C(t)表示第t期内耗用的资源的总量,g表示资源的增长率。那么,第t+1期的资源数量量由以下差分方程给出:11R(t)=(1+g)[R(t)-C(t)]均衡消费水平:[插图]

可再生资源开采模型表明,资源的耗用水平有一个临界点。任何高于均衡开采率的资源开采率都会导致崩溃

最优开采政策要求,当某一年出现了资源增长乏力的情况后,下一年必须减少开采,以防止崩溃。

在集体行动问题中,自利行为导致的结果与个人的目标是不一致的。

能够就某些明确的界限达成一致、同意明确界定的规则、授权实施渐进式制裁、拥有解决纠纷的机制。16

24 与机制设计有关的模型

制度的目的在于改变人类行为。为了保证制度不会随着时间流逝而归于无效,制度必须适应制度所要规范的环境或社会的变化。珍娜·贝德纳

这个框架强调了真实制度的如下四个方面:信息,指参与者知道些什么及应该向他们揭示什么;激励,即采取特定行动的利益和成本;集结,个人行为如何转化为集体结果;计算量,这是对参与者认知能力的要求。

我们希望机制满足哪些性质?答案必须“因地制宜”。我们在这里只描述其中五个性质。第一,我们会希望这种机制的均衡结果与社会选择对应一致(帕累托有效)。第二,在理想情况下,参与者将会采用占优策略,即他们的最优行动不依赖于他人的行动。如果是这样,就说有效的结果是占优策略可实施的。第三,我们不想强迫人们参与这种机制(自愿参与)。第四,如果这种机制涉及资源的转移或支付,我们不希望增加额外成本或破坏资源(预算平衡)。在本章的后面,当我们分析决定某个公共项目的机制时,会发现这个性质往往很难满足。第五,在许多情况下,我们希望参与者讲真话。我们希望人们发送的消息能够揭示他们的真实信息或真实类型。博弈理论家把这个性质称为激励相容(incentive compatibility)。在大多数有趣的情况下,通常没有任何一个机制可以满足所有这些要求。因此,机制设计理论的一个重要贡献就在于证明什么是可能的、什么是不可能的。

在第一价格拍卖和第二价格拍卖中,竞买人只有一个出价机会,因而无法在拍卖期间通过感情因素来影响他们的决定。

公共项目决策问题V1,V2,…,VN表示N个人赋予一个公共项目的货币价值,并假设该公共项目的成本为C。那么当且仅当C<V1+V2+…+VN时,这个项目才会启动。

多数投票平均分担机制个人投票表示赞成或反对启动某个公共项目。如果多数人投票支持该项目,那么该项目启动,并且每个人都承担C/N的成本。如下面的例子所表明的,这种机制可能会违背效率条件和自愿参与原则。

市场、民主、等级制度和集体行动这四个机制中的每一个,都只在某些环境下运行良好,而在另外一些环境下则表现不佳。

25 信号模型

炫耀性消费由来已久,部分原因在于人类很在意别人对自己的看法。这种消费行为之所以经久不衰,还因为消费可以起到信号的作用

要让信号发挥作用,它们就必须是昂贵的(有成本的)或可验证的。

为了减少发送信号的社会成本,我们应努力使信号尽可能有效地发挥作用。

26 学习模型

强化学习模型通过更高的奖励来强化行动。随着时间的推移,学习者会学会只采取最优行动。

在社会学习模型中,个体能够从自己的选择和他人的选择中学习。个体会复制最流行的或表现高于平均水平的行动或策略。

之所以更频繁地做某件事情,只是因为我们在过去已经做过这件事情。而且,即便将渴望水平设定得很低,会带来最高水平奖励的那个备选方案也会以最快的速度增加权重,因此从长远来看,最优备选方案将会胜出。但是,要收敛到最优备选方案上,所需的时间可能会很长。另外,当我们增加了更多的备选方案时,收敛时间也会变长。

强化学习的效果
在学会选择最优备选方案模型的框架中,当渴望水平被设定为等于平均获得的奖励时,强化学习(最终)几乎总是会选择最优备选方案。

复制者动态能够学会最优行动在学会从一个有限的备选方案集中选择最好的备选方案的过程,无限种群复制者动态几乎总是收敛到整个种群都选择最优备选方案。

从众效应极大地放大了奖励效应,使社会学习比个体学习更快。

慷慨/妒忌博弈在这个博弈中,有N个博弈参与者,每一个博弈参与者都要选择:是慷慨(G),还是妒忌(S)。收益(G,NG)=1+2×NG收益(S,NG)=2+2×NG

这些结果突显了个体学习与社会学习之间的关键差异。个体学习会引导人们选择更好的行动,因此人们会学会采取占优行动(如果占优行动存在的话)。而社会学习则引导人们选择相对于其他行为来说表现更好的行动。

,我们不会因为假想采取了某个行动会带来很高的收益,而提高采取这种行动的概率。

理论组织家强调,文化——即现有的既定规则和信念的力量实在太强大了。经济学家的观点则相反:推动行为的,只能是激励。

如果人们不相信新战略,如果人们很快就放弃了新战略,如果新战略的拥护者相互之间的连通性不够好。

27 多臂老虎机问题

伯努利多臂老虎机问题
一个备选方案集{A,B,C,D,…,N}中的每一个备选方案都能够产生一个成功的结果,但是各自的概率{PA,PB,PC,PD,…,PN}都是未知的。在每一个时期,决策者选择一个备选方案K,并以概率PK得到一个成功的结果。

第一种启发式是取样并择优启发式(sample-then-greedy),即先对每个备选方案都尝试固定的次数M,然后选择具有最高平均收益的备选方案

要确定最优行动,需要经过如下四个步骤。首先,要计算出每个备选方案的即时期望收益。其次,对于每个备选方案,都要更新关于收益分布的信念。再次,在得到的关于收益分布的新信念的基础上,根据我们所掌握的信息确定所有后续时期的最优行动。最后,我们将下一期行动的期望收益与未来的最优行动的期望收益相加。最后得到的这个结果就是通常所称的吉廷斯指数。在每一个时期,最优行动的吉廷斯指数都是最大的。

28 崎岖景观模型

因此,崎岖性导致了对初始条件的敏感性和路径依赖的可能性。而这些都意味着,景观的崎岖性有助于结果的多样性。崎岖性也意味着出现次优结果的可能性,在崎岖景观中,次优结果表现为局部高峰。

交互作用的属性数量的增加,在产生了更高的全局峰值的同时,也产生了更多的(更低的)局部峰值。

NK模型的一个重要含义是,我们需要适度的相互依赖性,因为这种互动能够产生更高的峰值。

我们之所以会观察到如此多的复杂性,一个很重要的原因可能是,我们这个世界在很大程度上是由自适应的、有目的的行为者组成的,它们有能力操纵舞动的景观。为了理解这种复杂性,我们需要多模型思维。

结语 像芒格一样智慧地思考——多模型思维的实际应用

相对较小的成瘾率是如何导致了大量成瘾者的。

海洛因成瘾之路——系统动力学模型

用多模型法分析经济不平等问题

信息和社会影响放大了马太效应。富人变得更加富裕了,而穷人则变得相对更穷了。

社交网络的正反馈效应导致不平等的可能性部分取决于人们所购买东西的性质。

资本回报率总是会超过经济增长率。只要这个关系成立,那么高收入者从资本回报中获得的收入部分就会随着时间的推移而不断增加。

这个模型的含义是,只要资本在增加,资本家就会从经济蛋糕中获得越来越大的份额。只要继续应用72法则,任何人都能看到资本家的收入将使工人的收入相形见绌。对于这种原因导致的收入不平等,似乎有一个非常简单的解决方案:向富人征收财富税。作为征税的替代方案,有的人可能会期待战争和革命,也就是以暴力的方式重新分配财富;或者,等待能够产生很多新资本家的技术突破的出现。

不平等的原因:社交技能、隐性知识、对风险和教育的态度以及遗产,减少了收入阶层之间的流动性。

克拉克计算了1888年所有名叫撒切尔的人的平均收入,并将之与1917年所有名叫撒切尔的人的平均收入进行了比较。30年的时间基本相当于一个人一辈子的工作时间。结果,克拉克发现姓氏的平均收入存在显著的相关性,这是表明收入缺乏流动性的一个证据。

我们还可以将溢出效应解释为一种社会传播行为,例如学习或工作所花费的小时数。如果收入包含了随机成分,那么低收入社区的人就会观察到,花费在自我完善、自我提高上的时间不会带来多少回报(这种观察结论是正确的)。

不平等的原因:在低收入社区长大的儿童获得的教育机会较少、受益于经济溢出效应的可能性也更低。

我们看到,在不平等的产生和维持中,有许多不同的过程都起到了作用。我们还可以观察到,这些不同的过程之间存在重叠和交叉。当我们对不平等的复杂性和自我强化的因果关系有了更深刻的理解之后,我们就会对任何声称能够“快速”解决不平等问题的简单方案持怀疑态度。

新模型将使用不同的数据并依赖于不同的假设,它们将做出不同的预测。