美文网首页
衡量文章词汇复杂度Type Token Ratio (TTR)

衡量文章词汇复杂度Type Token Ratio (TTR)

作者: ltochange | 来源:发表于2021-08-13 23:27 被阅读0次

Type Token Ratio (TTR): 一种有用的衡量复杂性的方法,它记录词汇丰富程度或词汇的多样性。

Token 形符:文章所用单词总数,包括标点的字数
Type 类符:文章中不重复单词的数量
TTR: 类符数 / 形符数

参考: https://carla.umn.edu/learnerlanguage/spn/comp/activity4.html

相关文章

  • 衡量文章词汇复杂度Type Token Ratio (TTR)

    Type Token Ratio (TTR): 一种有用的衡量复杂性的方法,它记录词汇丰富程度或词汇的多样性。 T...

  • 语料库191106

    TTR type/token ratio 反映的是在一千词里面有多少不同的单词,看文本词汇密度。lexical r...

  • 1. tokenizer

    input_ids: 对应词汇表id token_type_ids: token 对应的句子id,值为0或1(0表...

  • 量化投资学习之【4】计算创业板平均市盈率

    文章来源: 量化小课堂 市盈率(Price Earning Ratio),英文缩写为PE或P/E Ratio,指在...

  • 更新日志

    2016/6/20更新: TTR 作出更新,具体如下: 流程说明: 1. 对于来访/来电顾客,前台创建TTR并分配...

  • 圈复杂度

    圈复杂度(Cyclomatic Complexity)是一种代码复杂度的衡量标准。它可以用来衡量一个模块判定结构的...

  • 时间复杂度分析-上

    参考文章来源:极客时间 链接地址:时间复杂度分析-上 时间和空间复杂度是衡量一个算法执行效率的标准。 数据结构与算...

  • 数据结构-0-时间复杂度和空间复杂度

    1. 算法的复杂度: 算法的复杂度分为时间复杂度和空间复杂度。时间复杂度,是衡量算法执行时间的长度;空间复杂度,是...

  • 算法1:概述与排序算法

    1.概述 1.1 简介 1.2 算法效率的衡量 1.2.1 时间复杂度 1.2.2 空间复杂度: 1.3 常见...

  • 复杂度分析

    什么是复杂度? 算法的复杂度是粗略衡量一个算法执行效率的方法,分为时间复杂度和空间复杂度。 时间复杂度:估算程序指...

网友评论

      本文标题:衡量文章词汇复杂度Type Token Ratio (TTR)

      本文链接:https://www.haomeiwen.com/subject/djcsbltx.html