本文是斯坦福机器学习课程2-1节的笔记,主要内容是对机器学习问题,如何进行建模表述?
在房价预测案例中,我们有一个数据集,包含某地住房价格。如下:
历史交易数据
根据该数据集,我们可以在坐标图上画出相应的数据集。很自然的,我们要想预测该地区的房价,就是在该坐标图上求解一条直线或者曲线,而这条线会尽可能多的穿过历史交易数据的点。
在上述问题表述中,有几个常见的术语需要明确一下:房屋面积是数据的特征(feature),某一条历史交易数据都是一个训练样本(training example),所有的历史交易数据叫做训练集(training set)。
训练集
通过把训练集输入给学习算法,进而学习得到一个假设的 h,然后将要预测的房屋尺寸作为输入变量输入给 h,预测出该房屋的交易价格作为输出变量输出为结果,如下图所示:
问题需要用数学的方式表述出来,其中:
-
m代表训练集中样本数量;
-
x代表特征/输入变量;
-
y代表目标变量/输出变量;
-
(x,y)代表训练集中的样本实例;
-
(x(i), y(i) )代表第 i 个观察样本;
-
h 代表学习算法的解决方案或函数,也称为假设(hypothesis) 。
那么我们如何来找到这个h呢?房价预测的例子比较简单,h 表示一个函数,输入x是房屋尺寸大小,因此h根据输入的x值来得出y值,y值对应房子的价格,h是一个从x 到y的函数映射。
房价预测函数
因为这个函数只含有一个特征/输入变量,这样的问题叫作单变量线性回归问题。现在要做的便是为我们的模型选择合适的参数(parameters)θ0 和θ1 。很明显,在房价预测这个例子中,θ1便是直线的斜率,θ0则是在 y 轴上的截距,求解这两个参数是后续成本函数所要解决的问题。
-- THE END --
网友评论