美文网首页gensim玩转大数据大数据
自然语言文本分析实例:深度学习、分类和回归丨数析学院

自然语言文本分析实例:深度学习、分类和回归丨数析学院

作者: Datartisan数据工匠 | 来源:发表于2016-09-18 14:16 被阅读562次

    课程简介:

    本节提供了自然语言文本分析的实用方法,通过深度学习、分类、回归简单的组合,利用博客文章准确地预测博主的性别、年龄。具体来讲,就是利用 Gensim库中的Word2Vec深度学习模型创建文本特征,进而用 GraphLab Create中的机器学习工具进行分类和回归分析。

    本节分为以下几个部分:

    • 设置
    • 准备数据集
    • 训练Word2Vec模型
    • 创建&评估分类器

    每一部分都可以独立执行,所以可以按兴趣挑选并执行操作。

    课程目标

    • 了解 Word2Vec 并学会使用 Gensim 相关包训练 Word2Vec 模型
    • 利用 Word2Vec 实现文本分类及相关回归预测分析

    相关准备

    所需要的Python包:

    • BeautifulSoup - 用于解析原始博客文章。
    • NLTK (包括下载stopwords and punkt ) - 用于文本预处理。
    • Gensim - 用于 Word2Vec 深度学习。
    • GraphLab Create - 用于分类、回归、数据工程和评估。

    数析学院:http://datacademy.io/
    我们致力于打造更加精要的课程,如果小伙伴们在工作和学习中遇到什么问题,可以给我们留言。

    相关文章

      网友评论

        本文标题:自然语言文本分析实例:深度学习、分类和回归丨数析学院

        本文链接:https://www.haomeiwen.com/subject/klxgettx.html