-
计算机视觉核心的任务--图像的分类。
一张图片可以成三维数组的形式,每个像素的值从0到255。如下图所示:300 (高)* 100(宽) * 3(通道数)。
image.png
-
图像分类的挑战:
(1) 照射角度;
(2) 光照强度;
(3) 形状的改变;
(4)部分遮蔽;
(5)背景混入。 -
图像分类的思路:
(1)收集数据;(2)分类或标注训练和测试数据数据;(3)训练分类器;(4)测试、评估分类器;(5)发布分类器。 -
最近邻分类
采用L1(Manhatann)distance[曼哈顿距离]和L2(euclidean metric)distance[欧氏距离],进行k近邻算法。 -
线性分类
线性分类,简单来讲就是设计一个函数,那么这个函数它的输入是一个图片,它的输出是对应每一个类别的得分,如CIFAR-10,有10个分类,输出时会给出10个类别的得分;
f(x, W) = Wx + b,其中w为权重,b为偏置值,分类器的重点是找出合理的权重,使得准确率达到最高(相比KNN,不用与每一个样本进行对比计算距离)。
网友评论