美文网首页
04 文本预处理

04 文本预处理

作者: 席地而坐_2a9a | 来源:发表于2020-02-14 19:51 被阅读0次

    基础步骤

    读入文本

    分词

    建立字典,将每个词映射到一个唯一的索引(index)

    将文本从词的序列转换为索引的序列,方便输入模型

    预处理例子

    spaCy和NLTK工具进行分词

    相关文章

      网友评论

          本文标题:04 文本预处理

          本文链接:https://www.haomeiwen.com/subject/kpvjfhtx.html