Perceptron Hypothesis Set
这一节中,林老师介绍了一种最为基本的假说模型:感知器模型。
先说背景问题:客户申请信用卡,银行想根据客户的申请信息,决定是否给客户发放。
这时我们用一个 n 维向量 x 表示客户的信息,比如 x1=8000,表示该客户月收入8000(需要统一量纲)。再用一个 n 维向量 w 表示每个信息所代表的权重。这时,我们用 x 和 w 的内积表示某个客户的得分。当这个客户的得分大于 Threshold 时,就发放信用卡,反之不发放。
然后我们得到这个假说函数 h(x):

显然,+1表示发放,-1表示不发放。接下来再对函数做如下处理:

这样我们就得到了一个漂亮的 hypothesis。
那么,这样一个表达式意味着什么呢?我们再来看一张图:

当在向量 x 只有两个维度时,显然它表示平面上的一条直线。平面上的点表示每个agent在平面上的位置,红叉表示不发放,圆圈表示发放。直线就将这样一个平面划分成了两块。显然,一个好的 hepothesis 是将data里发放和不发放两个点切割到了不同的区域。
不难推测,当 x 有多个维度时,感知器函数是一个超平面,将多维空间中的点分割成两部分。
网友评论