我所说的一切都可能是错的!
即使你赞同我的观点,你的生活也不会因此有任何改变!
除非——你采取了相应的行动。
引子
今天妇女节,首先祝所有女性读者节日快乐。
今天分享一个文本里面性别代词和所有格分布的小研究。这是我以前上统计学课程时的一个小作业。当时这个作业的要求,就是用简单的描述性统计展示一些生活中有趣的现象。我是做语料库研究的,所以就对COCA(美国当代英语语料库)里性别代词和所有格的分别做了个简单的统计和对比。
虽然无论从统计学角度还是从语料库分析角度,这个小研究都是很粗浅的,但它揭示的现象很有意思,所以值得分享一下。
关于COCA和研究方法
这个小研究用的语料库是COCA,它是目前最大的美国英语语料库,有超过5亿词。COCA按语体分了几个子库,以前只有spoken, academic, fiction, newspaper和magazine五个子库,今年Mark Davies又添加了TV/movie, blog和web-genl三个子库。
COCA是一个很有用的语言分析资源,有兴趣的可以到它的官网去转一转:
https://www.english-corpora.org/coca/.
今天介绍的小研究呢,只涉及里面的三个子库:fiction(小说), newspaper(报纸)和academic(学术)。考察的对象是人称代词he/him, she/her和物主代词her/hers,his在这三个子库里的分布。
结果和讨论
整体印象
下面这张图是上面提到的人称代词和物主代词在三个子库中的整体分布规律:
从图上可以看出,无论是用作主语的he还是用作宾语的him,其出现频率都显著高于其对应的she和her。做主语的情况更为明显,he比she的频率高出90%。作宾语时,him比her高出67%。物主代词也是同样的规律,his的频率比her/hers高80%。
很显然,性别在文本里的分别是不均衡的,男性被提到的概率远高于女性。虽然仅凭这些数据,提到这些代词的语境还不清楚,但我们至少可以肯定,在我们所考察的文本类型中,男性更受关注。
不过,是不是三个文本类型都是一样的分布,还得往下看。
文本类型差异
我们先来看报纸里面的分布:
数据表明,在报纸里面,做主语的情况,he占75%,she占25%,前者是后者的3倍。作宾语的情况,him占57%,she占43%,差别还不算大。做物主代词的情况,his占74%,her/hers占26%,前者也是后者几乎3倍。
这说明,在新闻报道中,女性只有作为动作的接受者时,才会获得很男性同等的关注度,因为无论是女性做的事儿还是女性“拥有的东西”,受到的关注都远低于男性。这趋势在学术文体里更为显著:
上图是学术文体中目标词汇的分布。注意中间那个饼图,her的占比是68%,超过him的32%。这说明,在学术文体中,女性作为动作接受者的概率更高。学术界可能更感兴趣的是女性身上发生了什么事情,而不是女性做了什么事情。
唯一能给女性安慰的是小说了:
从上图可以看出,虽然在小说里女性的代表性还是低于男性,但至少差距不像前两种文体那么大。所以,我们是不是可以半开玩笑的说:男女平等可能真的只存在于小说中。
他/她的什么
下面我们来看点更细节的东西——形容词新物主代词后面接的什么名词。也就是说,我们来看一下,当提到男性和女性拥有的东西或者属性时,人们更关注什么。这里我们统计的方法不是简单的频率,而是互信息值(mutual information),这样做,可以把男性和女性物主代词搭配的典型名词区分开,因为如果只简单看频率,排在前面的可能是两者通用的名词,比如face,eyes, hair等。但同时我也对频率做了限制,只有频次在100以上,才纳入考虑。
现在我们来看结果。
在报纸里,按照互信息值从高到低,和his搭配的名词,前十位分别是:wife, ex-wife, passes, fastball, boyhood, regime, presidency, fiancee, girlfriend, football。而和her搭配,且满足上面提到条件的,仅有5个,分别是husband, ex-husband, pregnancy, purse和boyfriend。
可以看出来,典型的搭配往往都和男女关系中的互称有关,这没有什么值得深究的。倒是这个purse很有意思,我很想知道her purse身上到底发生了什么事情,所以又深挖了一下。
结果让人捧腹,和her purse搭配最强的就是snatch和steal。原来,在新闻报道里,女生的包不是被抢了(snatched)就是被偷了(stolen)。这告诉我们,女生在外面真的要注意安全。
为了更说明问题,让我们把his和her后面的名词按照语义分类,结果如下:
男性的可以分为五大类:人际,体育,身体,军事和政治。而女性的只有三类,分别是人际、衣着饰品和身体。这样一分,我们就可以立刻看出,在新闻报道中,女性在军事、体育和政治方面的代表性都很弱。这恐怕部分反映了现实。
下面我们来看一下在学术语体中的情况。
在学术语体中,女性更惨,学者们只关心他们的丈夫和男朋友。而对于男性,人们还关心他的学生(his disciples),他的继任者(his successors)。按照语义分类,结果如下:
可见,在学术语体中,女性还是没有“参政”的机会。而男性的选举(election),执政(presidency)和统治(rule)都是典型搭配。
女性最后的希望恐怕还是只能放在小说上了。
果不其然,在小说里,女性后面的典型搭配就和男性至少数量上差不多了。不过,当我们按照语义分类后,情况还是不太乐观。
在小说里,his后面的典型搭配可以分为七类:人际、身体、政治、服饰、军事、体育、兴趣。而女性只有四类:人际、服饰、身体和兴趣。可见,即使在小说里,女性在政治、军事和体育中仍然缺位。小说里,女性的服饰显然比男性的服饰更受关注,相关的词有一堆:
handbag手提袋,skirts短裙,bra胸罩,blouse女士衬衣,nightgown睡袍,lipstick唇膏,panties女士短裤,perfume香水,purse包,shawl围巾,pocketbook钱包,gown长袍,dress衣服。
而男性的服饰只有区区四个:tie领带,trousers裤子,shirts衬衣和overcoat外套。
结论
这个小小的研究就告一段落。最后,我们不得不得出一个悲伤的结论:男女平等只是部分地存在于小说之中。
在这女性的节日里,作为一个语言学研究者,我衷心希望,不久的将来,人们再分析当代文本时,会看到不同的分布。为了这一条早点来到,男性和女性需要一同努力。
网友评论