美文网首页
文本计算

文本计算

作者: 叫兽吃橙子 | 来源:发表于2019-11-06 21:16 被阅读0次

2.2 中文分词

分词模式
2
import jieba
# 精准模式
print("|".join(jieba.cut("今天天气不错,我来到北京野生动物园,在野生动物园看到有很多凶猛的动物",cut_all=False)))
# 全模式
print("|".join(jieba.cut("今天天气不错,我来到北京野生动物园,在野生动物园看到有很多凶猛的动物",cut_all=True)))
# 搜索引擎模式
print("|".join(jieba.cut_for_search("今天天气不错,我来到北京野生动物园,在野生动物园看到有很多凶猛的动物")))

从结果上,我们看到在文本分析场景下,使用精准模式是比较适合的,其他两种模式对于词的切分上都太过于细致了。

2.3 文本的表示

1
2
3
# 词库
word_vector_list = ["我们","来","贪心","学院","学习","人工智能","和","Python"]
# 要转成词向量的词
word1 = "我们"
word2 = "学习"

# 定义词向量转换方法
def get_word_vector_result(word):
    word_vector_result = []
    for i in word_vector_list:
        if i == word:
            word_vector_result.append(1)
        else:
            word_vector_result.append(0)
    return word_vector_result

# 打印word1的词向量
print(get_word_vector_result(word1))

# 打印word2的词向量
print(get_word_vector_result(word2))
4
import jieba
# 词库
word_vector_list = ["我们","来","贪心","学院","学习","人工智能","和","Python"]
# 用户输入的语句
s1 = "我来贪心学院学习Python"
s2 = "我学习人工智能"

# 转化成向量的方法
def get_vector(data):
    vector_list = []
    for i in word_vector_list:
        if i in list(jieba.cut(data)):
            vector_list.append(1)
        else:
            vector_list.append(0)
    return vector_list

# 打印向量
print(get_vector(s1))
print(get_vector(s2))
1
2
3

2.4 文本的相似度计算

1
2
3

相关文章

  • iOS 动态计算文本高度

    富文本计算方法 普通文本计算方法 HTML文本若用普通文本计算高度的方法(第二种方法)计算,会导致计算高度偏小,文...

  • 文本计算

    2.2 中文分词 2.3 文本的表示 2.4 文本的相似度计算

  • 文本计算

    ModelFrame.m放大button的frameCGFloat textW = textSize.width ...

  • 计算文本高度的俩种方法

    通过字符串计算和文本属性计算文本高度。- (NSRect)boundingRectWithSize:(NSSize...

  • iOS性能优化

    CPU 加载资源,对象创建,对象调整,对象销毁,布局计算,Autolayout,文本计算,文本渲染,图片的解码, ...

  • cpu

    CPU 造成的资源消耗有以下几种: 对象创建 对象调整 对象销毁 布局计算 Autolayout 文本计算 文本渲...

  • 计算文本高度

  • 计算文本宽度

    1.在 前加入 test 2.在css中写入 3.在js中写入 4.调用方法 本文仅方便自己使用文章来源:http...

  • 计算文本高度

    计算本文高度

  • 计算文本高度

    NSMutableParagraphStyle *muStyle = [[NSMutableParagraphSt...

网友评论

      本文标题:文本计算

      本文链接:https://www.haomeiwen.com/subject/atjpbctx.html