活动投票
一个创业公司组织周末活动,老板征求大家意见,去玩密室逃脱或者去吃某个新开的自助餐。老板做出决定很简单,大家在群里投票,哪个票多就哪个。但有员工提出,最近某部才上映的电影也不错,可以一起加入活动待选项,老板同意了。
假设现在公司就只有3位员工,每个员工有6票,他们的投票得出了如下的结果:
员工1 密室:3 | 自助:2 | 电影:1
员工2 自助:3 | 电影:2 | 密室:1
员工3 电影:3 | 密室:2 | 自助:1
这个时候老板头疼了,因为结果中活动的总分都是一样,选择任何一个活动好像都不太合适。
通过这个例子可以看出,“尊重大多数”这种投票模式在一些的社会选择问题中是有毛病的。接下来我们就来简单聊聊社会选择问题。聊这个之前,我们先来看看两个定义,社会福利函数(social welfare function)和 社会选择函数(social choice function)。
社会福利函数与社会选择函数
我们经常可以看到社会福利函数和社会选择函数,那么它们到底是什么意思,我们花个2分钟来了解下。
社会福利函数的定义是 :。其中 表示选项集合 (候选项) 的线性排序集合, 是参与投票人的数量。也就是说,社会福利函数是 到特定选项排序的线性映射。这么听上去可能有点绕,我们可以理解为社会福利函数是一个获取群体的偏好结果的函数,比如:
员工1= 密室:3 | 自助:2 | 电影:1
员工2= 密室:3 | 电影:2 | 自助:1
员工3= 电影:3 | 密室:2 | 自助:1
社会选择函数的定义是:。社会选择函数是 到选项集的一个线性映射。我们可以把它看成是一个获取最终选择结果的函数,比如老板看了下投票,然后宣布:
走,去吃自助
策略操纵
搞清楚这两个函数概念后,我们接着再看另一个公司投票的例子,现在公司有4个员工,每个员工有10票,现在每个员工投票的真实评分(投票)如下:
员工1= 密室:4 | 自助:3 | 电影:2 | 卡丁车:1
员工2= 密室:3 | 自助:4 | 电影:1 | 卡丁车:2
员工3= 密室:2 | 自助:3 | 电影:2 | 卡丁车:3
员工4= 密室:2 | 自助:2 | 电影:3 | 卡丁车:2
可以发现,密室和自助的得票数都是12票,但员工2是个吃货,他太想去吃自助了。这个时候,他就动起了歪脑筋,为了保证密室的得票数低于自助,他在投票的的时候并没有按照自己的真实偏好(自助>密室>卡丁车>电影),而是将自己的投票数变为了:
员工2= 密室:1 | 自助:4 | 电影:3 | 卡丁车:2
这样,员工2就可以确保自助活动的票数最多,我们把这种投票方式称为策略操纵(strategic manipulation)。策略操纵行为的原因是对选项的偏好(密室>电影)受到了选项 自助 的影响。如果社会福利函数中,投票者对选项的偏好不会受到影响,那么我们称其社会福利函数满足独立性,定义如下:
独立性:一个社会福利函数满足独立性,仅当任意两个选项a和选项b的社会偏好仅取决于a,b本身的时候。
也就说,满足独立性的社会福利函数没有被策略操纵的空间。
独裁者
在来看另一个公司投票例子,现在还是4个员工,每人10票对活动进行投票,投票结果如下:
员工1= 密室:4 | 自助:3 | 电影:2 | 卡丁车:1
员工2= 密室:1 | 自助:4 | 电影:2 | 卡丁车:2
员工3= 密室:2 | 自助:3 | 电影:2 | 卡丁车:3
员工4= 密室:2 | 自助:2 | 电影:3 | 卡丁车:2
奇怪的是,最后大家一致决定去玩密室逃脱。原因是员工1是公司一位漂亮的单身女员工,其他员工都想参加她最喜欢的那个活动。在这个例子中,这位漂亮的女员工就是“独裁者”。在社会选择中,独裁者的定义如下:
独裁者:如果不管其他人的偏好,最终结果都与投票人 的偏好一致,那么我们说投票人 在社会福利函数 中是一个独裁者,并且社会福利函数为独裁关系。
Arrow 定理 与 Gibbard-Satterthwaite定理
明白独裁者和独立性的概念后,我们就可以来看一个大名鼎鼎的Arrow定理:
超过3个候选项()的社会福利函数,如果满足一致性和独立性,那么该社会福利函数一定是独裁关系的(有独裁者存在)。
其中一致性的意思是,如果大家都有一致的偏好,那么社会偏好也应当和大家的偏好保持一致的。
其证明可以参考:https://www.rochester.edu/college/faculty/markfey/papers/ArrowProof3.pdf
这个定理的确让人很失望,因为我们总是希望我们设计的产品机制没有独裁者,并且同时满足独立性和一致性。没有关系,因为我们还有更绝望的Gibbard-Satterthwaite定理。
结合前面所说,如果一个投票者可以通过改变自己的投票行为来获取想要的结果,我们就说社会选择函数 可以被该投票者操纵。但如果一个社会选择函数有如下性质,那么投票人将没有操纵的空间:
当社会选择函数 是单调的时候,那么投票人没有办法通过转换其投票策略来获取想要的结果。这种社会选择函数被称为是激励相容(incentive compatible)的(可以把激励理解为动机,也就是没有操纵的动机)。
有了这个概念后,最后我们来看看令人绝望的 Gibberish-Satterthwaite定理:
Gibberish-Satterthwaite定理: 如果社会选择函数 对于选项集 是激励相容的,那么当选项的个数大于3时(),其社会选择函数为独裁关系。
Gibberish-Satterthwaite定理另人绝望的原因是,它告诉我们:如果选项大于3,设计出不会被操纵,没有独裁的选择机制是不可能的。但是,我们真的就没有办法了吗? 也不是,在下几篇内容中,我们来看看还有什么骚操作。
ps:如果您有好的建议,欢迎交流 :-D,也欢迎访问我的个人博客 苔原带:tundrazone.com
网友评论