前言 前面已经初步介绍了推荐系统,同时作者也介绍了机器学习算法KNN,那么本文着重介绍如何具体将KNN算法应用于推...[作者空间]
本文简述KNN算法的理解。 定义 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某...[作者空间]
08 特征工程 - 特征降维 - IDA 数据清洗常见流程 异常数据处理 案例 - 车辆数据预处理 每个样本具有7...[作者空间]
线性判断分析(LDA): LDA是一种基于分类模型进行特征属性合并的操作,是一种有监督的降维方法。 LDA原理 L...[作者空间]
06 特征工程 - 特征选择 特征降维必须在特征选择做完以后才能进行。 当特征选择完成后,可以直接可以进行训练模型...[作者空间]
05 特征工程 - 缺省值填充 当做完特征转换后,实际上可能会存在很多的特征属性,比如:多项式扩展转换、文本数据转...[作者空间]
04 特征工程 - 特征转换 - 文本特征属性转换 缺省值是数据中最常见的一个问题,处理缺省值有很多方式,主要包括...[作者空间]
03 特征工程 - 特征转换 - 分词、Jieba分词 机器学习的模型算法均要求输入的数据必须是数值型的,所以对于...[作者空间]
02 特征工程 - 数据不平衡 特征转换主要指将原始数据中的字段数据进行转换操作,从而得到适合进行算法模型构建的输...[作者空间]
如果参加一个比赛,我们会在模型训练的时候将数据分成训练集和开发集。模型提交后,比赛方会提供测试集对结果进行预测。一...[作者空间]
01 特征工程 - 概念 数据清洗过程: PS:工作中可能遇到的最大的问题是数据不均衡。怎么去解决的? 上采样、下...[作者空间]
实际上特征工程是一个面向十分广的概念,只要是在处理数据就可以认为是在做特征工程。个人理解中,真正意义上的特征工程还...[作者空间]
08 主题模型 - LDA 九、LDA参数学习-Gibbs采样 对于一个n维的概率分布π(x1,x2,...,xn...[作者空间]
07 主题模型 - 知识补充 - 概率知识、二项\多项\Beta\Dirichlet分布 八、LDA 隐含狄利克雷...[作者空间]
02 主题模型 - SVD矩阵分解、LSA模型03 主题模型 - LSA案例04 主题模型 - NMF05 主题模...[作者空间]
04 主题模型 - NMF 六、坐标轴下降法 回顾: 当加入L1正则项后,由于没法求解出正常的导函数出来(导函数不...[作者空间]
02 主题模型 - SVD矩阵分解、LSA模型03 主题模型 - LSA案例 五、NMF 参考:https://w...[作者空间]
02 主题模型 - SVD矩阵分解、LSA模型 LSA案例 假设有10个词、3个文本对应的词频TF矩阵如下: 1、...[作者空间]
01 主题模型 - 大纲 主题模型 克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量的数据中找出文字间...[作者空间]
一、大纲 主题模型是机器语言在自然语言处理中的一个应用,主要做的是无监督的任务。 一般情况下,如果我们拿到一篇文章...[作者空间]