本学习记录是记录我在参加知识圈的机器学习训练营的整个过程,旨在记录总结,同时方便以后查阅回顾。
第一周:
1. 随机梯度下降和批量梯度下降的区别:
随机梯度下降:随机这里的意思是用一个样本代替所有样本来调整参数,实现起来就是调整参数一次只计算一次梯度
批量梯度下降:其实批量的梯度下降就是一种折中的方法,他用了一些小样本来近似全部的样本,更新参数需要计算批量数m次梯度
2.kaggle房价预测案例:
作为kaggle入门三大经典题目,本以为就是简单的线性回归,结果打开发现是有1460行的70多个特征的庞大数据,还都是英文版的,一时之间有点迷茫。看了大佬们的代码,发现涉及到的算法可以说是很全面了,作为一个理论知识学得多于实际代码的人,有的算法名都没听说过,看了个大概,总结几点,同时自己拙劣的分析用了pca主成分分析综合数据集成为5个特征,然后利用线性回归解决,在kaggle排名4000多名,也算是自己的一点成果吧。代码如下:
PCA+Linearegression
网友评论