在自学机器学习的过程中,自己尝试实现了许多算法,包括线性回归、逻辑回归、决策树c4.5/cart、随机森林、Adaboost、梯度提升决策树(GBDT)、支持向量机(分类+回归)、全连接神经网络、朴素贝叶斯、协同过滤、k均值、dbscan。主要使用numpy、pandas、matplotlib这三个类库,有少量实现方式参考了开源库sklearn和libsvm。
这些代码实现尚未达到工程应用所需的性能和可靠度,但对于初学者理解算法的原理和实际运作方法应该有帮助,在此分享出来。
github地址:https://github.com/jiedawang
之后有时间会开设专题介绍这些算法的原理和实现思路。
网友评论