什么是距离?
举例一:计算两点之间直线的长度
初高中就学习的欧几里得距离,根据勾股定理,可以计算出斜边长度为,扩展到三维,n维,得到欧式距离公式。
举例二:两个地点的距离
从地点A走到地点B的距离计算,不能使用欧几里得距离了,没办法走蓝色这条直线。这里使用曼哈顿距离,把每一小段的距离都加起来
由于距离是必大于0的,所以要加上绝对值。
举例三:棋子的最短距离
棋盘上某棋子可以前后、左右、斜向行走,从A点到B点的最短距离是,我们称这种距离度量为切夫雪比距离。
通过上面三个例子,我们可以定义距离。定义一个东西我们往往把它的属性摘出来,例如定义水果,我们提取出“可食”、“含水分”等特性。所以我们定义距离满足“非负性”、“对称性”、“三角不等性”。
什么是范数?
范数就是点到零点的距离。所以前面的
我们来定义一下范数。
在距离定义的基础上,多了数乘要求。就像热带水果和水果一样,热带水果比水果多一个属性限制。所以范数是属于距离的。使用符号表示x的范数。
我们发现欧几里得范数、曼哈顿范数、切夫雪比范数是有规律的,满足公式
当p=1时,就是曼哈顿范数,因此记录为,也成为L1范数
当p=2时,就是欧几里得范数,因此记录为,也成为L2范数
当p=时,就是切夫雪比范数,因此记录为,范数
ML中距离的度量
L1 Loss和L2 Loss
回归问题中,模型学习历史数据,然后做出预测,如何判断预测向量和实际值的距离呢?
MAE就是在曼哈顿距离的基础上加了mean(求均值),也被称为 L1 Loss
MSE在欧几里得距离上做了延申,也被称为L2 Loss
L1,L2正则
在曼哈顿范数(L1范数)和欧几里得范数(L2范数)上展开,在原本损失的基础上,加了限制。
小结
指标 | 公式 | 备注 |
---|---|---|
曼哈顿距离 | ||
L1 损失 | MAE | |
L1 范数 | ||
L1 正则 | ||
欧式距离 | ||
L2 范数 | ||
L2 损失 | ||
L2 正则 |
网友评论