《自然语言处理学习笔记》专题

专题列表页

glove全称是Global Vectors for Word Representation，它是基于全局词频统计...[作者空间]

在nlp的世界里，词向量占据了重要的位置，它分布式的表示了单词的语义信息，大幅度的提升了下游任务的效果。 Word...[作者空间]

看到一篇数据预处理很全面的文章，所以将链接贴了过来 https://www.jianshu.com/p/37e52...[作者空间]

XGBOOST是GBDT模型的升级版，同样也用到了adboosting的思想一预备知识 XGBOOST是前向加...[作者空间]

在之前的章节里，学习了集成学习的两个代表方式：bagging和boosting，现在来看如果将bagging和bo...[作者空间]

集成学习通过构建并结合多个学习器来提高泛化性能。思想就是三个臭皮匠，顶个诸葛亮。例如在分类中，将多个弱分类器通过...[作者空间]

决策树是一种基本的分类与回归方法。从名字上看，决策树是一种树形结构，包括结点和边。结点分为内部结点和叶结点，内部结...[作者空间]

在之前的笔记中记录了L1与L2正则化，现在我们来看为什么拉普拉斯先验等同于L1正则化，高斯先验等同于L2正则化。 ...[作者空间]

逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法，运用梯度下降来求解参数，来达到将数据二分类的目的。模型...[作者空间]

生成模型生成模型又叫概率模型，其主要学习的是输入和输出的联合概率分布，函数形式为, 目的是希望接近于真实数据的联...[作者空间]