之前的几节课,我们已经对YOLO算法有了一定的了解和研究,我们把YOLO算法的各个部分都深入的进行了一定的分析,和逐步的比较。
这节课是把YOLO算法进行一次总体的演示,看看它的过程是什么样的。
训练集
第一步其实就像我们之前说的那样,一张图片会生成一个3x3x2x8的向量(如果你把图片分成3x3而且使用2个achorbox和3个物体类别的话)。
对于训练集来说,我们需要清楚地标记这个物体的方框及类别,同时因为我们知道他们存在或不存在,因此可以将Pc标注好。当Pc等于0时,下面的数据就可以不用关注了。
做出预测
这次我们使用一张新的图片,假设在一开始的卷积神经网络分析当中,它提取出了一些有可能的方框。
首先我们要做的是,将Pc小于一定数值的方框去除。
其次是对每个方框进行一个非最大值抑制,得到最后我们所需要的精确物体分类和物体位置确定。
问题
其实虽然已经对这个网络有了一定的了解,但是我对不同Anchorbox究竟是如何进行非最大值抑制的还是有点混乱。
在视频当中,吴恩达最后对4个重合的方框进行了非最大值抑制,但是我并没有看到这些方框有重叠的部分,所以理论上来说他们是不应该被非最大值抑制给删除掉的,不知道是因为吴恩达演示示例的问题还是我理解的问题,这个可能需要后期实践来进行一些确认。
网友评论