躺平 or 内卷，或许这条数学定律能帮你选择最优解

luyuanhong · 发表于 2022-6-21 18:46

躺平 or 内卷，或许这条数学定律能帮你选择最优解

在大自然中，动物为了摄食或者繁衍后代，往往面临着收益与体力的抉择。比如大山雀在灌木丛中捕食，开始它会很容易找到毛毛虫，一段时间后则越来越难以找到，甚至最后找到食物却不足以弥补寻觅过程的体力消耗。那么，什么时候应该离开这片区域，另寻他路？人们惊奇地发现，动物往往会本能地选择最优解决方式，即将所得收益最大化。而在数学上，这就是边际价值定理所展现的。

撰文 | James V. Stone（英国谢菲尔德大学名誉副教授）

翻译 | 施昊

懂得何时适可而止是我们人生中的一大难题。当面对收益递减时，选择坚持，还是放弃当下，以期将来获得更丰厚的回报，这样的困境比比皆是。对于每一座金矿来说，都会到达一个节点——继续开采所得到的黄金不能抵上所付出的成本，一旦这个时间点到了，就是时候放弃开采，开始寻找新的金矿了。

相似的，对于在灌木丛中以毛毛虫为食的鸟来说，当它们获得的卡路里不足以继续寻找更多毛毛虫的时候，也是时候放弃在这里捕食，应转而去另一片灌木丛。同样，对于蜜蜂而言，收集花粉的重量与其所需能量不相匹配的时候，此时应停止收集，该飞回蜂巢了。

幸运的是，数学上有个解决方案——边际价值定理（Marginal value theorem，1976 年由美国生态学家 Eric Charnov 提出）。边际效益理论明确指出了何时放弃以获得最大的回报。更重要的是，从最初的最佳觅食理论到大脑如何处理信息，边际价值定理已经有了很广泛的应用。本质上，无论你所付出或收获是什么，边际价值理论提供了一种一般的策略，即将每份付出所得最大化。

捕食中的瓢虫

瓢虫和蚜虫丨图片来源：Greyson Orlando

瓢虫以蚜虫为食，但是看瓢虫吃蚜虫就像看人类吃龙虾，因为蚜虫的外骨骼对于瓢虫来说就像龙虾的外壳对于人类一样，难以直接穿透进食。一开始吃完最多汁的部分之后，往往需要越来越多的努力来获取越来越少的食物。人类面临这个难题往往懂得适可而止，转而享用别的美食。同样的，当瓢虫面临这样的问题，也知道什么时候放弃转而去找另一只蚜虫。

如果瓢虫过早的放弃眼前这只，它将会浪费掉容易获得的一部分食物。相反，如果过迟放弃，大费周章却得到的越来越少，而这三三两两本可以从另一只蚜虫身上轻松获得。显然，有一个既不过早也不太晚、“恰到好处”的时间来放弃。为了弄清楚这个“恰到好处”的时间点何时到来，我们需要更加详细地了解瓢虫的进食行为。

蚜虫类似于龙虾的解剖学性质意味着，如果让一只瓢虫只吃一只蚜虫，那么累计进食的重量会随着喂食时间 t 的增加而增加，如下图所示。（这个数据来自与 R. M. Cook 和 B. J. Cockrell 发表于 1978 年一篇经典的关于觅食理论的文章[1]，这篇文章启发了我们举了瓢虫的示例。）

黑色的点表示 t 分钟时刻瓢虫进食的食物质量，黑色曲线表示拟合的收益曲线 E(t) 。

图中黑色的曲线是收益函数 E(t) ，曲线的斜率是即时收益率 r(t) 。红色虚线表示移动平均收益率 R(t) 。这个图反映了瓢虫过早放弃蚜虫的情况。

在蚜虫被发现之后的点 t ，我们可以定义一个底边长为 T+t ，高为 E(t)（黑色的垂直虚线）的直角三角形。这个直角三角形的斜边是一条红色的虚线，这条虚线的斜率等于图片，即移动平均收益率 R(t) 。这意味着我们可以将移动平均收益率最大化的问题表述为最大化红色虚线的斜率。具体来说，哪一条红色的虚线拥有最大的斜率呢？

在上图中，进食的时间为 t=10min ，红色的虚线的斜率比较小；如果瓢虫延迟放弃进食，斜率将会变大，它放弃得太早了。如果进食时间超过 10 分钟，移动平均收益率 R(t) 将会变大。

瓢虫过迟放弃蚜虫

同样地，如上图所示，进食的时间为 t=55min ，红色虚线的斜率也比较小，如果瓢虫提前放弃进食，斜率将会变大，它离开得太迟了。如果进食小于 55 分钟，移动平均收益率 R(t) 将会变大。

瓢虫在恰好的时间放弃进食。

最后，进食时间 t=35min 产生了一个可能最大的斜率。这是最优的进食时间，如果此时放弃进食，移动平均收益率 R(t) 将会最大。

注意到“恰到好处”的进食时间发生在收益曲线的斜率 r(t) 等于红色虚线的斜率，也就是移动平均收益率 R(t) 的时刻。换句话说，恰到好处的进食时间发生在即时收益率等于移动平均收益率的时候：r(t)=R(t) 。

可以用几何验证，即时收益率 r(t) 在下图用红色的虚线表示，移动平均收益率 R(t) 用黑色的实线表示。

红色虚线表明即时收益率，黑色实线表示移动平均收益率

正如我们预料那样，这两条曲线在“恰到好处”的时间相交（也就是 r(t)=R(t) ）。从这种几何角度的分析有效证明了边际价值定理，也就是最佳的退出时间是当即时收益率等于移动平均收益率的时候，也就是当 r(t)=R(t) 。

数学证明如下：

瓢虫懂得边际价值定理

上述的分析假设了一个恒定不变的搜索时间 T 。但是，对边际价值定理一个妥当的检验应涉及到可变的搜索时间。本质上来讲，较长的搜索时间表明食物比较稀缺，因此相应地增加进食每只蚜虫的时间是有道理的。换句话说，在一只蚜虫身上花费的进食时间应该随着寻找到这只蚜虫所花费的时间增加而增加。然而，相比于这个正确但是模糊的结论，边际价值理论精准地预测了进食时间该如何随着搜索时间增加而增加，如下图所示。（再次使用了建立在 Cook 和 Cockrell 1978 年实验数据的收益函数）。

如果用 40 分钟找到一只蚜虫，瓢虫将会花费 50 分钟来进食这只蚜虫（红色的虚线）；如果用 10 分钟找到了一只蚜虫，瓢虫将会花费 28 分钟来进食这只蚜虫（蓝色虚线）。

从上图中我们可以看出，边际价值定理预测以蚜虫为食的时间会随着寻找蚜虫的时间增加而增加。如果找到一只蚜虫需要 40 分钟，那么瓢虫应该花费大约 50 分钟来进食（上图中的红色虚线）。如果找到一只蚜虫需要 10 分钟，那么瓢虫应该只花费大约 28 分钟来进食（蓝色虚线）。

问题是，瓢虫会按照边际价值定理预测的时间放弃进食蚜虫吗？为了回答这个问题，Cook 和 Cockrell 将蚜虫随机散放在一个托盘里，然后测量瓢虫幼虫找到每只蚜虫所花费的时间 T 以及进食每只蚜虫所花费的时间t。（Cook 和 Cockrell 使用了瓢虫幼虫，不过这个并不是很重要。）

瓢虫幼虫平均进食时间如何随着找到一只蚜虫的时间变化：点表示实验中观察值，黑色的线表示由边际价值理论预测的进食时间。

上图显示了 Cook 和 Cockrell 观察到的瓢虫幼虫的平均摄食时间如何随着搜索时间变化的：点代表着他们在实验中观察到的结果，黑色的曲线代表着边际价值定理预测的进食时间。经过多次实验，蚜虫的数量渐渐减少，使得搜索新的蚜虫的时间相应地变长。如预测的一样，随着搜索的时间增加（蚜虫的密度降低），每只蚜虫平均被食用的时间也会增加。更重要的是，这样随着搜索时间增加而进食时间增加的方式，在某种程度上和边际价值定理预测的一致，正如上图所示。

在这个特定的例子中，数据和理论之间的拟合不是那么令人印象深刻，这可能因为移动平均收益函数 R(t) 没有一个尖峰，因此提前一点或者推迟一点放弃进食所损失的收益相对来说比较小。相反，如果收益函数上升的十分陡峭，那么移动平均收益率曲线会有一个更高的锋，那么实验的数据和边际价值定理预测值可能会更加匹配。

动物懂得何时适可而止

瓢虫捕食蚜虫的过程，只是动物在合适的时间放弃进食以达到最大效益的众多例子中的一个。同样的道理也适用于获取宝贵资源所需高昂成本的情况下。

大山雀的伟大智慧

大山雀捕食丨图片来源：Rosember

假设一只大山雀花费了一些时间寻找到有大量毛毛虫的灌木丛。找到灌木丛后，大山雀开始每分钟可以吃到的大量的毛毛虫，但是过了一会儿，可以找到的毛毛虫数量下降了，因此每分钟可以吃到的毛毛虫数量也下降了。鉴于边际收益的递减，大山雀该何时放弃这片灌木丛而选择去寻找新的灌木丛呢？

正如上述的瓢虫例子一样，答案由边际价值定理得出。通过做类似于瓢虫实验的实验，科学家 Richard Cowie在 1977 年发现边际价值理论可以正确预测大山雀放弃灌木丛的时间。

放弃交配

对一只雄性粪蝇来说，知道自己和一个雌性粪蝇交配多久代表一种典型的权衡，即当前有保障的回报，和一个不确定、但可能会获得更大的收益。（译者注：粪蝇生殖过程存在精子竞争（Sperm competition），雌性会与多个雄性交配，每只雄性要尽可能地置换其他雄性的精子。）雄性粪蝇与雌性粪蝇交配的时间越长，那么之前与这只雌蝇交配的其它雄蝇的精子会被替换的越多，并且这只雌蝇与其它雄蝇交配的机会会越少。换句话说，这只雄性交配的每一分钟，都本可以用来和其他雌蝇交配的。

我们可以发现，寻找新的雌蝇所花费的时间，和前面例子中寻找新的食物来源（新蚜虫和新灌木丛）是类似的，和一只雌蝇交配的时间对应一个增加但是增量减少的收益。因此，边际价值定理能够预测一个雄性的粪蝇应当和每个雌性交配多久以保证尽可能多的后代，对此结果我们不应感到惊讶。1976 年，科学家 G. A. Parker 和 R. A. Stuart 观察到雄性粪蝇和每只雌性粪蝇的交配时间为 36 分钟，和边际价值定理预测的 41 分钟相当。

蜜蜂会因太忙而效率低下吗？

随着蜜蜂收集越来越多的花粉，将花粉带回蜂巢所消耗的能量也会增加。每只蜜蜂都会面临的困境是：蜜蜂什么时候应该停止采集花粉返回蜂巢呢？

在一个极端的情况下，如果蜜蜂仅仅采集了一粒花粉后就返回，那么几乎肯定的往返蜂巢所消耗的能量会超过从花粉粒中获得的能量；另一个极端情况是，如果蜜蜂收集了大量的花粉，那么花粉会收集得很快，但是在飞回蜂巢的路上所消耗的能量将会占据从花粉中获得能量的很大一部分比例。两个极端情况之间有一个恰到好处的承载量——它为飞行中消耗的每一卡路里提供了（因采集花粉而获取的）最大能量。值得注意的是，蜜蜂连续采集花朵导致负载变多，收益是递减的。

科学家 Paul Schmid-Hempel , Alejandro Kacelnik 和 Alasdair Houston 在 1985 年的实验中观察到蜜蜂花粉的负载量和边际价值定理预测的相符合。简而言之，就每克收集的花粉所消耗的能量而言，蜜蜂在尽可能有效地收集花粉。相比之下，在一个基于每分钟收集速率最大化的模型下，与负载花粉的量拟合非常差。这表明，蜜蜂更偏向能源的效用化而不是花粉的收集速率。

大脑和边际价值理论

神经元主要职能是处理信息，但是维护神经元的成本非常高，用于传输信息的成本甚至更高，因此它们以最高效率运行是有必要的。

根据香农的信息论，信息的常用单位是比特（bit），它提供了足够的信息来在两个等可能的事件中进行选择，例如抛掷一枚硬币。但是，香农的信息定义了一个普遍的收益递减的规律，这意味着处理每一个比特信息所需要的能量随着每秒处理比特数增加而增加。因此，信息可以慢速低成本地处理或者高速高成本地处理，但是不能高速低成本地处理。

这个收益递减定律和瓢虫每秒吃的食物量的收益递减问题是类似的。不同之处在于，瓢虫想要最大化每秒平均吃掉的食物量，而神经元想要最大化每焦耳能量消耗能处理的平均信息量。鉴于这些相似之处，瓢虫问题和神经元问题都可以使用边际价值定理来解决。

能量效率随着神经元发放的速度变化。曲线的高峰预测了神经元的平均发放频率，与神经元最大化能量效率的想法一致。

边际价值定理可以根据能量消耗（代替进食时间）和信息处理（代替进食收益）来重新定义。由此得出的效率曲线表明，由边际价值理论预测的最大效率（以比特/焦耳为单位）出现在每秒约 2 个神经元峰值的发放频率下。重要的是，1996 年科学家 William Levy 和 Robert Baxter 发现这一预测与对神经元的平均发放频率的观察结果是一致的。

因此，无论是用寻找蚜虫花费了多少时间，或者是神经元放电消耗能量，以及用每小时吃掉蚜虫还是每焦耳处理信息比特来衡量，边际价值定理具体说明了付出多少使得收益最大化。

参考资料

[1] https://www.jstor.org/stable/3799

本文译自 James V. Stone, Knowing when to quit 原文链接：https://plus.maths.org/content/knowing-when-quit

		自动登录	找回密码
密码			注册

躺平 or 内卷，或许这条数学定律能帮你选择最优解

本帖子中包含更多资源