线性回归是基于输入值预测实值输出。 我们这里讨论线性回归在房价预测中的应用,提出成本函数的概念,并介绍学习的梯度下降方法。
Linear regression predicts a real-valued output based on an input value. We discuss the application of linear regression to housing price prediction, present the notion of a cost function, and introduce the gradient descent method for learning.
这里是y关于x的线性函数 hθ(x)=θ0+θ1*x ,这个模型被称为线性回归(linear regression)模型 , 这实际上是关于单个变量的线性回归 这个变量就是x, 对于这种模型有另外一个名称: 单变量线性回归
模型表示
为了建立未来使用的符号,我们将使用
表示“输入”变量(本例中的生活区域),也称为输入特征,和
表示我们试图预测的“输出”或目标变量(价格)。一对
被称为训练示例,以及我们将用于学习的数据集 - m个训练样例的列表
称为训练集。请注意,符号中的上标“(i)”只是训练集的索引,与取幂无关。我们还将使用X来表示输入值的空间,并使用Y来表示输出值的空间。在这个例子中,X = Y =ℝ。
为了更加正式地描述监督学习问题,我们的目标是,在给定训练集的情况下,学习函数h:X→Y,使得h(x)是y的对应值的“好”预测器。由于历史原因,该函数h被称为假设。从图中可以看出,这个过程是这样的:
当我们试图预测的目标变量是连续的时,例如在我们的住房示例中,我们将学习问题称为回归问题。
当y只能承受少量离散值时(例如,如果给定生活区域,我们想要预测住宅是房屋还是公寓,请说),我们将其称为分类问题。
来源:coursera 斯坦福 吴恩达 机器学习
网友评论