直方图:
用于计算图片特征,表达
对图片数据/特征分布的一种统计
灰度,颜色 / 梯度/边缘,形状,纹理 / 局部特征点,视觉词汇
区间:
具有一定的统计或物理意义
一种数据或特征的代表
需要预定义或基于数据进行学习
数值是一种统计量:概率,频数,特定积累
维度小于原始数据
聚类:
目标:找出混合样本集中内在的组群关系
把一个对象集合分组或分割为子集或类,使得,类内对象之间的相关性高,类间对象之间的相关性差。
常用方法:Kmeans(数据分类大多首用kmeans),EM算法,谱聚类,层次聚类......
Kmeans:数据集(),是d维特征向量,目标:把n个数据分成k组s={}这种分类具有最小类内平方和
算法流程:1,首选K个类中心,首次随机选取,2,计算每个点跟K个类中心的距离,3,把数据点分配给距离最近的一个类中心,4,计算新的类中心(重复迭代2,3,4),5,满足终止条件后,终止迭代。
kmeans类数K的选取:
最简单:多值尝试取聚类指标最优或提升转折点
kmenas初始中心选择:
多次全随机取最优。
最远选取:第一类中心->随机选择,第二类中心->距离第一个中心最远的点,第三类中心->距离前2个中心最远的点,以此类推,到第K个
Kmeans++半随机:第一个类中心->随机选择,记D(x)为数据点x距最近的聚类中心的距离,选取下一个聚类中心,选取的概率正比于 ,以此类推,到第K个
其他。
颜色特征:
量化颜色直方图:
适用颜色空间:RGB,HSV等均匀空间
操作:颜色空间量化,单元由单元中心代表,统计落在量化单元上的像素数量。
聚类颜色直方图:
适用颜色空间:Lab等非均匀空间
操作:使用聚类算法对所有像素点颜色向量进行聚类,kmeans
单元(bin)由聚类中心代表。
几何特征:
边缘:像素明显变化的区域,具有丰富的语义信息,用于:物体识别,几何,时间变换
边缘定于:像素值函数快速变化的区域->一阶导数的极值区域
边缘提取:先高斯去噪(高斯滤波),再使用一阶导数获取极值,导数对噪声敏感,高斯核的标准差越大,核越大,面积约广。
边缘提取尺度问题:不同标准差的滤波(x方向)捕捉到的不同尺度的边缘,尺度越小细节越明显。
不同尺度对应不同的细节区分兴趣点/关键点:不同视角图片之间的映射,稳定局部特征点(可重复性,显著性,抗图片变换(外貌变换(平亮,光照),几何变换(平移,选择,尺度)))
兴趣点/关键点:图片匹配/拼接,运动跟踪,物体识别,机器人导航,3D重建
Harris角点(捕捉稳定的边缘组合点/关键点,不受光照/平移等影响):一种显著点,在任何方向上移动小观察窗,导致大的像素变动,说明信息点集中。
角点示意斑点:拉普拉斯限度,一阶导极值点->二阶导数零点,梯度/边缘可以通过寻找,二阶导数接近零,一阶导数足够大,对噪声很敏感,需要先做高斯平滑
一阶导数/二阶导数二阶导数高斯滤波(LOG)于标准差相关,若标准差越大,图像越粗糙,标准差越小,图像越繁杂。
捕捉斑点寻找拉普拉斯限度的极值,捕捉边缘寻找拉普拉斯的绝对值
SIFT关键点
基于尺度空间不变的特征,特点:具有良好的不变性,旋转,尺度缩放,平移,亮度变化,遮挡和噪声。独特性好,信息量丰富,适用于在海量特征数据库中进行快速,准确的匹配。多量性,即使少数物体也可以产生大量的SIFT特征。
尺度空间,使用不同标准差的LoG对图片进行滤波
滤波Dog,LoG近似等于2个不同尺度的高斯差分
DoGSIFT特征计算:计算高斯差分,尺度空间,获取极值点,特征点处理(位置插值,去除低对对比度,去除边缘点),方向估计,描述子提取。
SIFT特征点方向估计:在尺度上计算梯度直方图,2*2网格,8个方向,获取最高值为关键点主方向。
SIFT特征点方向归一化:将坐标轴方向旋转为关键点方向(旋转不变性)
将坐标轴方向旋转为关键点方向SIFT计算特征点描述子:在旋转后的坐标上采样16*16的像素窗,4*4网格,8方向直方图,共计128维。
SURF:近似SIFT算法,实现快速版,均值滤波,积分滤波,精度略有牺牲。
纹理特征
HOG(方向梯度直方图)
LBP(局部二值模式);将每个像素点于周围点大小比较,半径为R的圆上,均匀采样P个点,大小量化为0或1,多个bit组成一个数,统计每个数的直方图。
LBPGarbor滤波器组:具有高斯和的特性,模拟人类的视觉系统。
网友评论