前言
这是「模型」系列的第一篇文章。在这个系列中,我计划写一些自己在思维/认知/决策模型方面的体会。一是自己重新整理一下思路,同时,也希望能得到读者的互动,交流相似的思考,实现彼此的打磨与提升。
题目说是写「概念」和「概念体系」,其实可以牵扯到的内容很多,因为认清二者的意义、效率与局限,对于“求真”——描述现象、挖掘规律,求善——判断是非善恶,都有着诸多益处。这背后的一个重要事实在于:几乎我们要认识的所有东西都离不开概念,甚至,有些就是从认识相关概念开始的。
本文并不会过多探讨求真、求善方面关系的思考,单从思维模型的角度,借用统计学的概念和方法,谈谈自己在「概念」和「概念体系」的意义、效率与局限方面的体会。
一、从“聚类”到概念及其效率
假设我们观察到一群共100只动物,其中50只长得很像,体态较大,四蹄着地,黑短毛,长脖子长脸长耳朵;另外50只长得也很像,体态小巧,时而直立时而四脚着地,金黄色短毛,能上树,有的在吃桃子,红屁股上有尾巴。这时,如果我们将每只动物视为一个样本点,并取其体重、毛色、脸长、耳朵长为四个变量用来刻画,之后,将所有样本点投影到由这四个变量为坐标轴的空间中,我们会发现,100只动物会出现明显的两个“聚类”。那么,面对这两个聚类,我们给第一个聚类中所有动物起了一个共同的名字,叫“驴”,虽然它们任意两只都不完全一样;我们又给第二个聚类中所有动物起了一个共同的名字,叫“猴”,虽然它们任意两只也都不完全一样。
“驴”和“猴”两个概念,就这样产生了。关于这个过程,我们可以总结几点:
第一,客观的事实是一大群动物在形象上出现的聚类现象,“驴”和“猴”两个概念并不存在,它们是被构造出来的。
第二,关于概念的构造,有三层基本的效果。首先,概念起到了“区别”的作用——叫“驴”和“猴”还是叫“苹果”和“橘子”并不重要,关键是叫两个不同的名字;其次,概念的存在“简化”了描述,方便了交流——从聚类到概念的过程,就好像统计中从样本到均值的过程,概念或均值都只是样本的“代表”,概念的“效率”取决于聚类有多明显,或者说“代表性”有多强;最后,概念降低了认知成本,让人有限的认知资源可以“产出”更多——比如在各种概念的基础上探索/构造出更多概念及概念之间的关系。
第三,即便聚类现象再明显,个体间的差异也依然存在,就像方差中的信息无法体现在均值中一样,所以,使用概念时需要注意“表达精度”的要求。例如,“驴”这个概念对应整个物种,如果要具体到某头驴,可能需要加上更多描述,比如“那头驮着麻袋站在河边的驴”,这样才能达到足够的“表达精度”。所以,概念虽然可以提高沟通的效率,但为了达到足够的精度,还需要注意我们是要在什么层面上进行描述。
二、概念体系的建立:主成分分析的启发
如“驴”和“猴”这样的概念,只是一个定义或描述,是独立的。但如果概念构成体系,则可以实现“解释现象”的目的。关于一个「概念体系」的形成,统计学依然能够给我们一些启发。
最早从模型的角度思考「概念体系」,是学统计学中“主成分分析”的时候。主成分分析告诉我们,在研究高维数据时,可以通过求样本的主成分的方法,来实现对数据的“降维”处理,以简化模型、更好地挖掘数据中的信息。当时不理解的有三点:
(1)什么是“维”?
(2)为什么要有“维”?
(3)为什么要“降维”?
以“学生成绩”这个样本为例,假设样本中每个样品为一名学生的成绩,用一个长度为9的向量代表,对应九门功课的分数,包括:语文、数学、外语、物理、化学、生物、政治、历史、地理。显然,对于这个样本来说,每个“维度”,就是一门“科目”——换句话说,在统计学中,每个“维度”对应着一种“含义”,我们又叫它“变量”。
那么,下一个问题就是,为什么要有“变量/维”呢?
在我的理解中,“变量”有两个功能:首先是“刻画”——当我们要认识某样事物时,总要通过找到一些“特点”来刻画它,比如在上面的例子中,如果我们要认识的是学生的“学习水平”,选学生的成绩作为“特点”,就比较合适。此外,在关心班级总体情况的同时,我们也会关心某个学生的情况,比如排在班级总体的什么位置,跟其他同学成绩差异怎样,这便体现了“变量”的第二个功能:“区别”。
另一方面,“刻画”和“区别”,既是变量的两个功能,也是选择变量的两条原则:首先,选择的变量要是研究目的/对象的较为直接的表现,其次,变量还要能够体现出样本中各样品之间的差别。
以前面提到的问题为例:我们希望了解学生的学习水平,那么,选择各门功课的成绩作为“变量”,显然满足了第一条原则“刻画”。那如何理解第二条原则“区别”呢?这也带来了第三个问题:为什么要“降维”?
显然,我们想要认识的对象“学习水平”,是一个“综合的指标”,这使得用九门功课的成绩来代表,一方面“不够”,另一方面又“太多”。首先,说“不够”是因为:从“刻画”的角度来看,只用考试成绩来代表其实是有遗漏的——比如,还应该考虑学生上课回答问题、课后作业的完成情况等等,此处是在尽量保证操作简便的情况下,选了九门功课的成绩来代表。其次,说“太多”是因为,从“区别”的角度来看,九门功课中,有的功课学生分数差异比较大,有的功课学生分数差异很小,对于“学习水平”这个综合的指标来说,学生分数差异越大的功课,越能体现更多的信息,或者说,越能“说明问题”,也就有更有代表性。相反,如果一门功课学生分数差异很小,则这个变量包含的信息也就越少,亦即不那么具有代表性。
事实上,当我们用很多变量来刻画一组样本时,因为变量之间互相交叉、重叠,彼此牵扯,会带来“噪音”和“冗余”,使我们真正关心的信息淹没在数据中。所以,这里的问题是:如何选择用哪些变量来“刻画”研究对象,以及,为了减少变量数目让模型清晰、易于处理,我们该如何确定最具代表性的变量呢?而这就是“降维”的目的,“主成分分析”是一种基本的降维方法。
主成分分析方法认为,“噪音”和“冗余”问题产生的根源,在于选择的变量不合适。它给出了一个选择变量的原则,即:所有样本点在一个变量所代表的维度上“离散程度”越大,这个变量就越有效。然而,主成分分析的方法并非重新“筛选”一组变量,而是在原有数据的基础上,用线性变换的方法,重新“构造”出一组满足以上规则的变量,并按样本的“离散程度”从大到小排序,依次称为“第一主成分”、“第二主成分”、“第三主成分”……
经过主成分分析处理之后往往可以看到,只要保留最前面几个主成分,就足以包含相当大比例的“信息”,在丧失非常有限的信息量的情况下,让模型得到了相当大的简化。
三、从概念体系的角度看学科
如果把统计学中的“变量”,对应到一般意义上的“概念”,那么,主成分分析的方法,可以帮助我们理解一套概念体系的建立。其中包含的对应关系有:“变量”或“主成分”,就是概念体系中的概念;“样本”,就是概念体系要描述或解释的现象;“样本在主成分上的离散程度”或“信息量”,就是概念的代表性或解释力。
常见概念体系的典型代表是学科。以经济学为例,其绝大多数内容都可以抽象为概念和概念之间的关系。在本公号之前发布的微观讲义第一讲中,我先后介绍了“经济”、“稀缺”、“价格机制”、“成本”、“收益”、“剩余”等一系列概念,事实上,如果从概念体系的角度看经济学这门学科,我们可以尝试回答以下问题:经济学中为什么“产生”或者说“选择”了这些概念,它们又为什么没有出现在其他学科比如物理、生物中?学科或者概念体系的建立,是否存在好/坏的标准,如果存在的话,它的标准是什么?
首先,这些概念之所以产生于经济学中,是因为经济学专注于解释的现象,在这些概念所代表的维度上离散程度最大,或者说,这些概念对于解释经济学所关注的对象来说最接近要害,最具有解释力,以及显然,物理、生物等其他学科关注的现象与经济学不同,自然也就不会选择这些概念了。其次,如果一门学科关注的所有现象视为一组样本,那么,从主成分分析的观点来看,一套“好”的变量,应当是能够以尽可能少的个数,解释尽可能多的现象的——用尽可能少的主成分,来容纳尽可能多的信息。
经济学只是众多学科中的一个例子,从概念体系的角度看各个学科,会发现它们一定程度上都存在上述特点。这里可以用一个比喻来描述:不同学科关注的现象不同,每个学科就像一个“坐标系”一样,精心选择了尽可能少的轴,让所有“样本点(现象)尽可能离散开”,让每个“点”(现象)在这个坐标系中找到自己的“位置”(解释)。所以说,学习不同学科,实际上就是在建立自己的“坐标系仓库”,以便看到更多、理解更多。
四、概念和概念体系的局限
概念的形成和概念体系的建立,极大降低了人们的认知成本,使得人们能够描述、掌握、揭示更多的现象及其背后的规律。但同时,概念和概念体系也有着先天的信息缺失,或者说是一种“模糊性”,这种模糊性虽然是其效率的基础,但也往往是其局限所在。
概念和概念体系的局限,可以概括为以下三个方面:
第一,跟“均值无法体现方差中的信息”一样,概念凌驾于所有个体之上,用概念描述现象,或者用概念体系解释现象时,难免因为信息缺失造成偏差,尤其是在用一个更宏观的概念或概念体系,去描述或解释更微观的现象时。比如,一个社会宏观层面上得到的规律,在解释具体某个人的行为时,往往存在很大偏差。所以,在通过降维构建概念体系的过程中,具体降维到什么程度,也取决于我们想在什么层面上寻找规律。
第二,与描述和解释相反的方向,是向内的对现象的判断和理解。如果用一个更宏观的概念或概念体系,去判断或理解一个更微观的现象,也容易陷入自以为是实际上谬以千里的状态——对事件非黑即白的“降维打击”,以及用贴标签的方式认识一个人,都是典型的例子。
第三,除了概念和概念体系本身带来的偏差,还有人在使用它们时带来的偏差。这本质上也是概念的模糊性导致的,即对于不同人来说,同一个概念所指代的东西有所不同。对于不同类型的概念,这种差异的大小也不同:现实中有可见实体对应的概念差异小,比如苹果、橘子、周杰伦等等;现实中没有可见实体的抽象概念差异大,比如理性、善良、成功等等。
那么,已知如上三方面的局限,我们该怎么运用概念和概念体系?
第一,要弄清自己是要在什么层面上描述或解释现象,寻找精度合适的概念进行描述或构建体系。
第二,在用概念体系判断或解释现象的时候,要时刻提醒自己:概念体系是通过降维得到的,存在信息缺失,此外,构成概念体系的概念本身,还可能存在过于宏观而精度不够的问题。
第三,本文中一直在提概念体系,事实上在我的理解中,体系中的所有概念加上它们之间的逻辑关系,就是所谓的“理论”。理论看起来漂亮,但在具体情境中未必好用,它的实践意义更多在于帮助我们在面对问题是迅速形成框架,找到关键,不至于犯方向性错误,它可以作为一个思考的起点或是参考系,等待丰富更多的细节。所以,要具体情况具体分析,注重细节,正所谓“细节决定成败”。
五、总结
理解「概念」和「概念体系」是认识世界、寻找规律、明辨善恶的第一步,也是非常关键的一步,弄清并理解它们的效率与局限,可以帮助自己少走很多弯路。本文首先讲述了「概念」的形成过程,说明了概念是对“聚类”的描述,降低了认知成本,提高了交流效率,但同时也先天地具有模糊性。之后,本文又借用主成分分析的思想,讲述了概念体系的建立,并以经济学为例,提出了一个粗略的评判概念体系优劣的角度。最后,本文强调了概念和概念体系的局限,并就如何运用总结了三点建议。
网友评论
并不懂这个坐标系的含义是什么,横轴代表什么?纵轴代表什么??