我们会在自己的模型上进行一个小规模的训练。一条直线的方程是 y = m * x + b,x 是输入,m 是直线的斜率,b 是纵轴的截距,y 是直线上对应 x 的值。我们需要训练的值就是 m 和 b。由于整个表达式只有输出 y 和输入 x,所以只有该两个变量需要训练。
图2机器学习中,有多少特征就有多少个 m,而 m 的值通常都用一个矩阵来表达,我们用「W」标记以表示「weight」(权重)。类似的,我们将 b 也用矩阵表示,简记为「b」,也就是「biases」(偏差)。
训练的过程,将会给 W 和 b 一定的初始值,然后用这些值来尝试预测。如你所料,一开始的结果往往不符合要求,但我们可以通过与「应得结果」比较,并修改 W 和 b 来得到比较准确的预测。
图3上述过程将会重复进行,每一次迭代或者循环都被称为训练过程的「阶」。我们再回头看看整个过程。一开始,我们好似随机画了一条线来分开红酒和啤酒。接下来,每一次循环,这条线都进行一定的移动,逐渐逼近那条理想的、假想的红酒和啤酒分界线。
摘自:机器学习「七步走」
网友评论