美文网首页哲思想法简友广场
【数据趣说】七、你是“杂种”吗?

【数据趣说】七、你是“杂种”吗?

作者: 字衍之 | 来源:发表于2019-11-14 20:20 被阅读0次

    你是“杂种”吗?

            异配优势(heterosis/ heterozygote advantage,又译为“杂种优势”)是一种遗传学现象,指同一物种内基因型差异较大的个体相结合,其后代会表现出优于双亲的遗传适应表型特征。生物学家已经发现了许多动物和植物中存在异配优势的证据,但现有对人类异配优势的研究多集中在分子生物学和细胞层面的探讨,缺乏个体层面的研究。我们利用2000年中国人口普查微观样本数据以及中国健康和营养调查(CHNS)数据实证检验了个人层面是否存在异配优势效应。

            由于人类历史中长久以来地理隔离的存在,不同人群间的地理距离与遗传距离间存在正相关关系,我们由此提出“距离-表现”假说(“distance-performance” hypothesis),即来自不同省份的夫妻(跨省婚姻)所产生的后代们可能会在在智商、身高及容貌吸引力等方面更具优势。

    数据与实证方法

            研究主要使用的数据为来自国家统计局2000年人口普查微观数据的0.95‰样本,调查范围覆盖31个省、自治区与直辖市,数据集有1,180,111条记录,包含了被调查者当前注册地及出生地信息。在剔除了无配偶的样本后,得到了553,538(276,769对夫妻)个记录。在实证分析中,我们将样本严格限制为已成年(大于18岁),在调查期间已完成学业且其父母出生地信息完整的后代,最终用于实证分析的样本量为85,972条。由于人口普查数据库未包含后代身高信息,我们使用CHNS数据作为补充,以考察跨省婚配对后代身高的影响。

            实证分析中,我们采用高维固定效应模型(high-dimensional fixed effects model,HDFE)以控制无法观测的地区社会经济因素影响。普遍认为个体的受教育水平很大程度上与其智力水平相关,受教育水平因而可作为遗传适应性较好的代理变量。

            我们首先分析父母遗传多样性差异对后代学业表现的影响,模型形式为:

    公式1

            模型中被解释变量为后代的受教育年限,用以作为智力遗传适应性的代理变量。

            Ψ为父母遗传距离或基因差异程度的代理变量,我们用三种变量对其进行测度:

            (1)跨省婚姻二元变量(即父母是否出生于不同省份,是为1,否为0);

            (2)跨省婚姻中父母双方出生省的测地距离(按省会城市经纬度坐标计算);

            (3)依据基因频率得到的由FST测度的中国不同人群间基因距离。

            X代表一组个人社会经济特征向量,包括年龄、性别、民族、是否在城市居住、婚姻状况、迁移历史、兄弟姐妹人数及父母迁移人数等;为控制父母的遗传影响,还包含了父母的受教育年限。模型还加入了被访省份、被访城市、出生地、出生年份、父母出生地等共计1,537个固定效应。

      考虑到潜在的内生性问题,我们构建了两个工具变量。一是父母迁移原因的虚拟变量,若父母是因为工作分配或升学而进行迁移,则此值为1。在1952年至1984年(甚至延续到90年代中期)的“计划经济”时代,个人的工作几乎是由政府分配的,因而此种迁移决定是外生的。第二个工作变量为省级水平的每年平均婚配距离。我们使用了高维固定效应-两阶段最小二乘模型(HDFE-2SLS)进行了工具变量法的分析。

      为了进一步增强结果的稳健性,我们还用身高作为另一个遗传适应性的代理变量进行检验。相比于学业成就,身高被认为是一个更为外生的遗传适应性指标,受社会经济背景的影响较小。我们使用CHNS数据考察了父母遗传距离对后代身高的影响,分析模型如下:

    公式2

      其中被解释变量为CHNS数据中由专业人员测量的被访者身高,其他变量与模型(1)类似。

    实证结果

    (1)父母遗传距离对子代学业成就影响

      标准HDFE模型和工具变量HDFE-2SLS模型估计结果都显示父母基因差异变量对子代受教育年份的影响是正向且显著的。具体的,跨省婚姻使后代平均受教育年限增加了0.11年。父母双方出生地地理距离每增加1000公里,后代的受教育年限增加0.21年。父母基因距离增加0.01,子女受教育年限提高0.22年。

    (2)父母遗传距离对子代身高影响

      HDFE模型回归结果显示跨省婚姻的后代身高较省内婚配后代高0.88厘米。父母出生地每增加1000公里,其后代身高将增高0.94厘米。父母间遗传距离每增加0.01,后代身高将增高0.38厘米。

    (3)性别差异

      对男性与女性后代分开进行上述估计,结果显示跨省婚姻产生的男性后代平均受教育年限较之省内婚姻男性后代增加0.13年,身高高1.15厘米。对跨省婚姻产生的女性后代而言,其受教育年限较省内婚姻产生的女性后代增加0.08年,身高高0.35厘米。此外,父母出生地地理距离每增加1000km,男性后代受教育年限增加0.30年,而女性后代仅增加0.19年。上述结果意味着男性子代中的异配优势效应更明显,这可以被性别选择理论(Sexual selection theory)所解释,与生物学相关研究的结论一致。

    简要结论

      我们使用丰富的微观数据考察了跨省婚姻对后代遗传适应性的影响,并采用工具变量、身高回归等方法尽量控制内生性问题,提高结果的稳健性。由于存在空间、时间和文化上的隔离与差异,我国传统的婚配圈通常仅发生于同省、同市、甚至同村等相近范围内,表现为以熟人网络构成的相对封闭狭小的社会空间。而近年来,伴随着经济发展与技术进步,人口流动日益频繁,就近婚配模式逐渐向外扩张,跨省婚姻比例日益增加。我们探讨的异配优势效应意味着人口流动与跨地区婚姻会对宏观层面的人力资本积累有促进作用。此外,异配优势的存在意味着父母基因对后代的影响可进一步被分解为传统的遗传效应与异配优势效应。


    数据趣说,用科学的数据来解读,告诉你一些社会现象背后的原理。

    相关文章

      网友评论

        本文标题:【数据趣说】七、你是“杂种”吗?

        本文链接:https://www.haomeiwen.com/subject/zurdictx.html