第15章 大数据与MapReduce(代码) MapReduce:分布式计算的框架MapRedece分布式的计算框...[作者空间]
第14章 利用SVD简化数据(代码) SVD的应用图像压缩噪声滤波模式识别生物,物理,经济方面的一些统计模型的处理...[作者空间]
第13章 利用PCA来简化数据(代码) 降维技术降维的意思是能够用一组个数为d的向量zi来代表个数为D的向量xi所...[作者空间]
第12章 使用FP-growth算法来高效发现频繁项集(代码) FP优点因为 FP-growth 算法只需要对数据...[作者空间]
第11章 使用Apriori算法进行关联分析(代码) 关联分析关联分析是一种在大规模数据集中寻找有趣关系的任务。这...[作者空间]
第10章 K-均值聚类算法(代码) K-均值算法的优缺点K-均值是发现给定数据集的 K 个簇的聚类算法, 之所以称...[作者空间]
第九章 树回归(代码) 树回归算法的优缺点优点:可以对复杂和非线性的问题建模.缺点:结果不容易理解.适用数据类型:...[作者空间]
第八章 预测数值型数据:回归(代码) 线性回归算法的优缺点优点:结果容易理解,计算上下不复杂缺点:对非线性问题数据...[作者空间]
第七章 利用AdaBoost元算法提高分类性能(代码) AdaBoost算法的优缺点优点: 泛化错误率低,易编码,...[作者空间]
第六章 支持向量机(代码) SVM算法优缺点优点:泛化错误率低,计算开销不大,结果易解释。缺点:对参数调节和和核函...[作者空间]
第五章 Logistic回归(代码) Logistic算法优缺点优点:计算代价不高,易于理解和实现。缺点:容易欠似...[作者空间]
第四章 基于概率论的分类方法:朴素贝叶斯代码 基于贝叶斯决策理论算法优缺点优点:在数据较少的情况下仍然有效。可以处...[作者空间]
第三章 决策树(代码) 决策树算法优缺点优点:计算复杂度不高,输出结果易于理解,对中间值不明干,可以处理不相关特征...[作者空间]
第二章 K-近邻算法(代码) K-近邻算法优缺点-. 优点:精度高,对异常值步敏感,无数据输入假定。缺点:计算复杂...[作者空间]
第一章 机器学习基础(代码) 熟悉Python即可。 开发机器学习应用程序步骤收集数据制作网络爬虫从网站上抽取数据...[作者空间]
本书重要讲述了机器学习算法,并介绍那些使用这些算法的应用和工具,以及如何在实际环境中使用它们.这本书和其他书不同,...[作者空间]