美文网首页工具癖语言·翻译
学习Tips|英文阅读小工具——词频统计

学习Tips|英文阅读小工具——词频统计

作者: 温泉堡 | 来源:发表于2019-04-23 15:00 被阅读14次

英语学习少不了阅读材料,而如何挑选适合自己的阅读材料是门学问。一个重要的依据就是词汇量——通过阅读扩充认知词汇是个好选择,一些篇幅短小而词汇丰富的书就是上好的菜品。

在线英语词频统计 是个非常方便的在线词频统计网站。我们以乔伊斯的短篇小说集Dubliners(都柏林人)为例介绍一下使用方法。

首先,我们打开网站。(点击蓝字超链接

主界面

网站很简单明了,我们可以把文字直接复制到文本框内,或者选择文件。从网上找到份Dubliners的txt文档后,我们把文字全选复制进去,然后点击COUNT TEXT按钮。

初步统计结果

我们可以看到上面的统计栏列出了字母,单词,句子,行等信息。但我们需要的是它不重复单词的统计,也就是词频。这时候点击右边的WORD FREQUENCY按钮。

然后左边会出现一栏词频统计。

左方词频统计

我们把词频统计拉到最下面。

它给出了不重复单词的统计数——10254。当然,这个统计不是非常精确,但用来参考足够了。我们可以看到Dubliners总共65097个单词,而不重复的就有一万余个,可以说是性价比极高的阅读材料。更不用说乔伊斯的写作本身就文笔优美,韵味深远,值得研读。

用这个工具可以分析很多书本的词频。比如,统计通俗小说American Gods(美国众神)的不重复词汇,达到了11764个。而如果把DublinersAmerican Gods放一起统计的话,两本书20余万字大概有一万八的词汇量。如果认真读这两本小说,无论是单词量还是阅读能力都能得到充足的提升。

你也可以对自己喜欢的英文材料进行统计。附带一提,2017年诺贝尔文学奖获得者石黑一雄的两本代表作The Temians of the Day(长日留痕)和An Artist of the Floating World(浮世画家)使用的词汇都只在7千以内。作为五岁从日本移居英国的日裔,石黑一雄的英文平淡之中却细腻无比,意蕴无穷,可谓非母语英语学习者的典范。

相关文章

  • 学习Tips|英文阅读小工具——词频统计

    英语学习少不了阅读材料,而如何挑选适合自己的阅读材料是门学问。一个重要的依据就是词汇量——通过阅读扩充认知词汇是个...

  • 开启自学人生

    day6 姓名:邓超 学号:1901010076 学习:封装统计英文词频的函数+封装统计中文词频的函数。 总结:1...

  • 英文词频统计

    该案例以莎士比亚的四大悲剧之一《哈姆雷特》为例,来统计该文章中的词语出现的频率。总体的步骤为读入文本,大小写转换,...

  • 文本挖掘

    1文本词频分析(中英文各一份)及列表的sort()使用2如何利用python统计英文文章词频3主题模型 LDA 入...

  • 统计英文文章中词频

    import refrom collections import Counterpath='E:\etest.tx...

  • 用Py做文本分析3:制作词云图

    1.词频统计 在词频统计之前,需要先完成分词工作。因为词频统计是基于分词后所构建的list进行的。 1.1使用Pa...

  • 词频统计

    通过Linux命令实现词频统计 现在有一遍英语文档The_Man_of_Property.txt通过Linux命令...

  • 词频统计

    词频统计 请设计一个高效的方法,找出任意指定单词在一篇文章中的出现频数。 给定一个string数组article和...

  • 学习Tips|如何阅读英文原著

    英语,或者更广泛的外文,已经不像几十年前那样是少数人才掌握的技能。但,即使是考过四六级的大学生,拿起一本英语原著看...

  • python 中文,英文做词频统计小计

    作为一个爬虫工程师,词频统计还是要有所了解的,对于舆情的文本处理,统计每个词出现的次数,亦或是统计文本出现top1...

网友评论

    本文标题:学习Tips|英文阅读小工具——词频统计

    本文链接:https://www.haomeiwen.com/subject/nttvgqtx.html