glove全称是Global Vectors for Word Representation,它是基于全局词频统计...[作者空间]
在nlp的世界里,词向量占据了重要的位置,它分布式的表示了单词的语义信息,大幅度的提升了下游任务的效果。 Word...[作者空间]
看到一篇数据预处理很全面的文章,所以将链接贴了过来 https://www.jianshu.com/p/37e52...[作者空间]
XGBOOST是GBDT模型的升级版,同样也用到了adboosting的思想 一 预备知识 XGBOOST是前向加...[作者空间]
在之前的章节里,学习了集成学习的两个代表方式:bagging和boosting,现在来看如果将bagging和bo...[作者空间]
集成学习通过构建并结合多个学习器来提高泛化性能。思想就是三个臭皮匠,顶个诸葛亮。例如在分类中, 将多个弱分类器通过...[作者空间]
决策树是一种基本的分类与回归方法。从名字上看,决策树是一种树形结构,包括结点和边。结点分为内部结点和叶结点,内部结...[作者空间]
在之前的笔记中记录了L1与L2正则化,现在我们来看为什么拉普拉斯先验等同于L1正则化,高斯先验等同于L2正则化。 ...[作者空间]
逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法,运用梯度下降来求解参数,来达到将数据二分类的目的。 模型...[作者空间]
生成模型 生成模型又叫概率模型,其主要学习的是输入和输出的联合概率分布,函数形式为, 目的是希望接近于真实数据的联...[作者空间]