TF-IDF

作者: reeuq | 来源:发表于2018-08-02 11:11 被阅读0次

    词频TF

    TF = 某个词在文章中的出现次数
    TF = 某个词在文章中的出现次数 / 文章总词数
    TF = 某个词在文章中的出现次数 / 拥有最高词频的词的次数

    逆文档频率IDF

    语料库(corpus)模拟语言的使用环境。
    IDF = log(语料库的文档总数 / (包含该词的文档总数 + 1))

    TF-IDF

    TF-IDF = TF * IDF

    相关文章

      网友评论

          本文标题:TF-IDF

          本文链接:https://www.haomeiwen.com/subject/djnfvftx.html